Artwork

محتوای ارائه شده توسط Enough About AI. تمام محتوای پادکست شامل قسمت‌ها، گرافیک‌ها و توضیحات پادکست مستقیماً توسط Enough About AI یا شریک پلتفرم پادکست آن‌ها آپلود و ارائه می‌شوند. اگر فکر می‌کنید شخصی بدون اجازه شما از اثر دارای حق نسخه‌برداری شما استفاده می‌کند، می‌توانید روندی که در اینجا شرح داده شده است را دنبال کنید.https://fa.player.fm/legal
Player FM - برنامه پادکست
با برنامه Player FM !

04 Digesting The Data

39:26
 
اشتراک گذاری
 

Manage episode 449677099 series 3613033
محتوای ارائه شده توسط Enough About AI. تمام محتوای پادکست شامل قسمت‌ها، گرافیک‌ها و توضیحات پادکست مستقیماً توسط Enough About AI یا شریک پلتفرم پادکست آن‌ها آپلود و ارائه می‌شوند. اگر فکر می‌کنید شخصی بدون اجازه شما از اثر دارای حق نسخه‌برداری شما استفاده می‌کند، می‌توانید روندی که در اینجا شرح داده شده است را دنبال کنید.https://fa.player.fm/legal

Dónal and Ciarán discuss the vast ocean of data that Large Language Models (LLMs) depend on for their training, covering some of the issues of access to that data and the biases reflected within it. This episode should help you better understand some aspects of the AI training process.
Topics in this episode

  • What data is being used to train models like ChatGPT?
  • What are "supervised" or "unsupervised" machine learning methods?
  • How have the owners of copyright data, like news organisations, reacted to the use of their text?
  • What issues of bias arise in training models based on existing text?
  • What happens when AI models train on AI output?
  • How do we morally and ethically align the actions of AI models, as part of their training?

You can get in touch with us - hello@enoughaboutai.com - where we'd love to hear your questions, comments or suggestions!

  continue reading

4 قسمت

Artwork
iconاشتراک گذاری
 
Manage episode 449677099 series 3613033
محتوای ارائه شده توسط Enough About AI. تمام محتوای پادکست شامل قسمت‌ها، گرافیک‌ها و توضیحات پادکست مستقیماً توسط Enough About AI یا شریک پلتفرم پادکست آن‌ها آپلود و ارائه می‌شوند. اگر فکر می‌کنید شخصی بدون اجازه شما از اثر دارای حق نسخه‌برداری شما استفاده می‌کند، می‌توانید روندی که در اینجا شرح داده شده است را دنبال کنید.https://fa.player.fm/legal

Dónal and Ciarán discuss the vast ocean of data that Large Language Models (LLMs) depend on for their training, covering some of the issues of access to that data and the biases reflected within it. This episode should help you better understand some aspects of the AI training process.
Topics in this episode

  • What data is being used to train models like ChatGPT?
  • What are "supervised" or "unsupervised" machine learning methods?
  • How have the owners of copyright data, like news organisations, reacted to the use of their text?
  • What issues of bias arise in training models based on existing text?
  • What happens when AI models train on AI output?
  • How do we morally and ethically align the actions of AI models, as part of their training?

You can get in touch with us - hello@enoughaboutai.com - where we'd love to hear your questions, comments or suggestions!

  continue reading

4 قسمت

همه قسمت ها

×
 
Loading …

به Player FM خوش آمدید!

Player FM در سراسر وب را برای یافتن پادکست های با کیفیت اسکن می کند تا همین الان لذت ببرید. این بهترین برنامه ی پادکست است که در اندروید، آیفون و وب کار می کند. ثبت نام کنید تا اشتراک های شما در بین دستگاه های مختلف همگام سازی شود.

 

راهنمای مرجع سریع