Artwork

محتوای ارائه شده توسط Whitehat SEO and Whitehat Inbound Marketing Agency. تمام محتوای پادکست شامل قسمت‌ها، گرافیک‌ها و توضیحات پادکست مستقیماً توسط Whitehat SEO and Whitehat Inbound Marketing Agency یا شریک پلتفرم پادکست آن‌ها آپلود و ارائه می‌شوند. اگر فکر می‌کنید شخصی بدون اجازه شما از اثر دارای حق نسخه‌برداری شما استفاده می‌کند، می‌توانید روندی که در اینجا شرح داده شده است را دنبال کنید.https://fa.player.fm/legal
Player FM - برنامه پادکست
با برنامه Player FM !

Unpacking OpenAI's Latest Reasoning Models

11:32
 
اشتراک گذاری
 

Manage episode 442461526 series 2330470
محتوای ارائه شده توسط Whitehat SEO and Whitehat Inbound Marketing Agency. تمام محتوای پادکست شامل قسمت‌ها، گرافیک‌ها و توضیحات پادکست مستقیماً توسط Whitehat SEO and Whitehat Inbound Marketing Agency یا شریک پلتفرم پادکست آن‌ها آپلود و ارائه می‌شوند. اگر فکر می‌کنید شخصی بدون اجازه شما از اثر دارای حق نسخه‌برداری شما استفاده می‌کند، می‌توانید روندی که در اینجا شرح داده شده است را دنبال کنید.https://fa.player.fm/legal
Comparing the reasoning capabilities of two new OpenAI models, o1-mini and o1-preview, through a series of tests. The first test involved a classic children's game, the Tower of London, which assesses the ability to plan and reason about future states. Both models struggled with the game's rules, suggesting they still lack fundamental reasoning skills. The second test involved a hypothetical business scenario, where the models were tasked with analyzing risks, opportunities, and strategic paths forward based on provided information. The models performed poorly, often simply regurgitating information without providing valuable insights or critical analysis. Finally, the video concluded that, despite the initial hype surrounding the models, they don’t represent a significant leap in reasoning capabilities compared to older models like GPT-3. Although the authors acknowledge that the models are still under development, they express disappointment that they are not yet able to perform complex reasoning tasks in a way that would be useful for real-world applications.
  continue reading

93 قسمت

Artwork
iconاشتراک گذاری
 
Manage episode 442461526 series 2330470
محتوای ارائه شده توسط Whitehat SEO and Whitehat Inbound Marketing Agency. تمام محتوای پادکست شامل قسمت‌ها، گرافیک‌ها و توضیحات پادکست مستقیماً توسط Whitehat SEO and Whitehat Inbound Marketing Agency یا شریک پلتفرم پادکست آن‌ها آپلود و ارائه می‌شوند. اگر فکر می‌کنید شخصی بدون اجازه شما از اثر دارای حق نسخه‌برداری شما استفاده می‌کند، می‌توانید روندی که در اینجا شرح داده شده است را دنبال کنید.https://fa.player.fm/legal
Comparing the reasoning capabilities of two new OpenAI models, o1-mini and o1-preview, through a series of tests. The first test involved a classic children's game, the Tower of London, which assesses the ability to plan and reason about future states. Both models struggled with the game's rules, suggesting they still lack fundamental reasoning skills. The second test involved a hypothetical business scenario, where the models were tasked with analyzing risks, opportunities, and strategic paths forward based on provided information. The models performed poorly, often simply regurgitating information without providing valuable insights or critical analysis. Finally, the video concluded that, despite the initial hype surrounding the models, they don’t represent a significant leap in reasoning capabilities compared to older models like GPT-3. Although the authors acknowledge that the models are still under development, they express disappointment that they are not yet able to perform complex reasoning tasks in a way that would be useful for real-world applications.
  continue reading

93 قسمت

Alla avsnitt

×
 
Loading …

به Player FM خوش آمدید!

Player FM در سراسر وب را برای یافتن پادکست های با کیفیت اسکن می کند تا همین الان لذت ببرید. این بهترین برنامه ی پادکست است که در اندروید، آیفون و وب کار می کند. ثبت نام کنید تا اشتراک های شما در بین دستگاه های مختلف همگام سازی شود.

 

راهنمای مرجع سریع

در حین کاوش به این نمایش گوش دهید
پخش