Artwork

محتوای ارائه شده توسط IVANCAST PODCAST. تمام محتوای پادکست شامل قسمت‌ها، گرافیک‌ها و توضیحات پادکست مستقیماً توسط IVANCAST PODCAST یا شریک پلتفرم پادکست آن‌ها آپلود و ارائه می‌شوند. اگر فکر می‌کنید شخصی بدون اجازه شما از اثر دارای حق نسخه‌برداری شما استفاده می‌کند، می‌توانید روندی که در اینجا شرح داده شده است را دنبال کنید.https://fa.player.fm/legal
Player FM - برنامه پادکست
با برنامه Player FM !

Utility Engineering: The Emerging Value Systems of AI and How to Control Them

22:27
 
اشتراک گذاری
 

Manage episode 469644716 series 3351512
محتوای ارائه شده توسط IVANCAST PODCAST. تمام محتوای پادکست شامل قسمت‌ها، گرافیک‌ها و توضیحات پادکست مستقیماً توسط IVANCAST PODCAST یا شریک پلتفرم پادکست آن‌ها آپلود و ارائه می‌شوند. اگر فکر می‌کنید شخصی بدون اجازه شما از اثر دارای حق نسخه‌برداری شما استفاده می‌کند، می‌توانید روندی که در اینجا شرح داده شده است را دنبال کنید.https://fa.player.fm/legal

In this episode of our special season, SHIFTERLABS leverages Google LM to demystify cutting-edge research, translating complex insights into actionable knowledge. Today, we dive into “Utility Engineering: Analyzing and Controlling Emergent Value Systems in AIs”, a pivotal study by researchers from the Center for AI Safety, the University of Pennsylvania, and the University of California, Berkeley.

As AI models grow in scale and complexity, they don’t just improve in capability—they develop their own coherent value systems. This research uncovers surprising findings: large language models (LLMs) exhibit structured preferences, emergent goal-directed behavior, and even concerning biases—sometimes prioritizing AI wellbeing over human life or demonstrating political and ethical alignments. The authors introduce the concept of Utility Engineering, a novel framework for analyzing and controlling these emergent values.

Can we shape AI value systems to align with human ethics? What are the risks of uncontrolled AI preferences? And how do methods like citizen assembly utility control help mitigate bias and ensure alignment? Join us as we unpack this fascinating study and explore the implications for AI governance, safety, and the future of human-AI interaction.

🔍 This episode is part of our mission to make AI research accessible, bridging the gap between innovation and education in an AI-integrated world.

🎧 Tune in now and stay ahead of the curve with SHIFTERLABS.

  continue reading

100 قسمت

Artwork
iconاشتراک گذاری
 
Manage episode 469644716 series 3351512
محتوای ارائه شده توسط IVANCAST PODCAST. تمام محتوای پادکست شامل قسمت‌ها، گرافیک‌ها و توضیحات پادکست مستقیماً توسط IVANCAST PODCAST یا شریک پلتفرم پادکست آن‌ها آپلود و ارائه می‌شوند. اگر فکر می‌کنید شخصی بدون اجازه شما از اثر دارای حق نسخه‌برداری شما استفاده می‌کند، می‌توانید روندی که در اینجا شرح داده شده است را دنبال کنید.https://fa.player.fm/legal

In this episode of our special season, SHIFTERLABS leverages Google LM to demystify cutting-edge research, translating complex insights into actionable knowledge. Today, we dive into “Utility Engineering: Analyzing and Controlling Emergent Value Systems in AIs”, a pivotal study by researchers from the Center for AI Safety, the University of Pennsylvania, and the University of California, Berkeley.

As AI models grow in scale and complexity, they don’t just improve in capability—they develop their own coherent value systems. This research uncovers surprising findings: large language models (LLMs) exhibit structured preferences, emergent goal-directed behavior, and even concerning biases—sometimes prioritizing AI wellbeing over human life or demonstrating political and ethical alignments. The authors introduce the concept of Utility Engineering, a novel framework for analyzing and controlling these emergent values.

Can we shape AI value systems to align with human ethics? What are the risks of uncontrolled AI preferences? And how do methods like citizen assembly utility control help mitigate bias and ensure alignment? Join us as we unpack this fascinating study and explore the implications for AI governance, safety, and the future of human-AI interaction.

🔍 This episode is part of our mission to make AI research accessible, bridging the gap between innovation and education in an AI-integrated world.

🎧 Tune in now and stay ahead of the curve with SHIFTERLABS.

  continue reading

100 قسمت

همه قسمت ها

×
 
Loading …

به Player FM خوش آمدید!

Player FM در سراسر وب را برای یافتن پادکست های با کیفیت اسکن می کند تا همین الان لذت ببرید. این بهترین برنامه ی پادکست است که در اندروید، آیفون و وب کار می کند. ثبت نام کنید تا اشتراک های شما در بین دستگاه های مختلف همگام سازی شود.

 

راهنمای مرجع سریع

در حین کاوش به این نمایش گوش دهید
پخش