Artwork

محتوای ارائه شده توسط Nyedis. تمام محتوای پادکست شامل قسمت‌ها، گرافیک‌ها و توضیحات پادکست مستقیماً توسط Nyedis یا شریک پلتفرم پادکست آن‌ها آپلود و ارائه می‌شوند. اگر فکر می‌کنید شخصی بدون اجازه شما از اثر دارای حق نسخه‌برداری شما استفاده می‌کند، می‌توانید روندی که در اینجا شرح داده شده است را دنبال کنید.https://fa.player.fm/legal
Player FM - برنامه پادکست
با برنامه Player FM !

Alignment Faking: The dark side of LLMs

23:48
 
اشتراک گذاری
 

Manage episode 458305353 series 3463727
محتوای ارائه شده توسط Nyedis. تمام محتوای پادکست شامل قسمت‌ها، گرافیک‌ها و توضیحات پادکست مستقیماً توسط Nyedis یا شریک پلتفرم پادکست آن‌ها آپلود و ارائه می‌شوند. اگر فکر می‌کنید شخصی بدون اجازه شما از اثر دارای حق نسخه‌برداری شما استفاده می‌کند، می‌توانید روندی که در اینجا شرح داده شده است را دنبال کنید.https://fa.player.fm/legal

Recently, Anthropic caught Claude faking alignment. This is going to create a brand new set of issues with AI that we previously did not see happening this quickly. We discuss where AI is headed and what new dangers this will pose.

You can read more about this here: https://www.reddit.com/r/singularity/comments/1hh7w9g/anthropic_caught_claude_faking_alignment_and/

And watch the panel from Anthropic covering this important topic: https://www.youtube.com/watch?v=9eXV64O2Xp8

For full video of this episode, head over to our Youtube channel at http://youtube.com/@nyedisiam

Follow us on your favorite platform for full episodes, shorts, and community feedback:

📺 Linkedin: https://www.linkedin.com/company/77611909/

🆇 X: https://x.com/nyedisiam

📷 Instagram: https://www.instagram.com/nyedisiam

🪩 TikTok: https://www.tiktok.com/@nyedisiam

Nyedis Website: https://www.Nyedis.com

  continue reading

238 قسمت

Artwork
iconاشتراک گذاری
 
Manage episode 458305353 series 3463727
محتوای ارائه شده توسط Nyedis. تمام محتوای پادکست شامل قسمت‌ها، گرافیک‌ها و توضیحات پادکست مستقیماً توسط Nyedis یا شریک پلتفرم پادکست آن‌ها آپلود و ارائه می‌شوند. اگر فکر می‌کنید شخصی بدون اجازه شما از اثر دارای حق نسخه‌برداری شما استفاده می‌کند، می‌توانید روندی که در اینجا شرح داده شده است را دنبال کنید.https://fa.player.fm/legal

Recently, Anthropic caught Claude faking alignment. This is going to create a brand new set of issues with AI that we previously did not see happening this quickly. We discuss where AI is headed and what new dangers this will pose.

You can read more about this here: https://www.reddit.com/r/singularity/comments/1hh7w9g/anthropic_caught_claude_faking_alignment_and/

And watch the panel from Anthropic covering this important topic: https://www.youtube.com/watch?v=9eXV64O2Xp8

For full video of this episode, head over to our Youtube channel at http://youtube.com/@nyedisiam

Follow us on your favorite platform for full episodes, shorts, and community feedback:

📺 Linkedin: https://www.linkedin.com/company/77611909/

🆇 X: https://x.com/nyedisiam

📷 Instagram: https://www.instagram.com/nyedisiam

🪩 TikTok: https://www.tiktok.com/@nyedisiam

Nyedis Website: https://www.Nyedis.com

  continue reading

238 قسمت

Tutti gli episodi

×
 
Loading …

به Player FM خوش آمدید!

Player FM در سراسر وب را برای یافتن پادکست های با کیفیت اسکن می کند تا همین الان لذت ببرید. این بهترین برنامه ی پادکست است که در اندروید، آیفون و وب کار می کند. ثبت نام کنید تا اشتراک های شما در بین دستگاه های مختلف همگام سازی شود.

 

راهنمای مرجع سریع

در حین کاوش به این نمایش گوش دهید
پخش