Artwork

محتوای ارائه شده توسط HackerNoon. تمام محتوای پادکست شامل قسمت‌ها، گرافیک‌ها و توضیحات پادکست مستقیماً توسط HackerNoon یا شریک پلتفرم پادکست آن‌ها آپلود و ارائه می‌شوند. اگر فکر می‌کنید شخصی بدون اجازه شما از اثر دارای حق نسخه‌برداری شما استفاده می‌کند، می‌توانید روندی که در اینجا شرح داده شده است را دنبال کنید.https://fa.player.fm/legal
Player FM - برنامه پادکست
با برنامه Player FM !

Do Large Language Models Have Theory of Mind? A Benchmark Study

15:11
 
اشتراک گذاری
 

Manage episode 508418736 series 3474385
محتوای ارائه شده توسط HackerNoon. تمام محتوای پادکست شامل قسمت‌ها، گرافیک‌ها و توضیحات پادکست مستقیماً توسط HackerNoon یا شریک پلتفرم پادکست آن‌ها آپلود و ارائه می‌شوند. اگر فکر می‌کنید شخصی بدون اجازه شما از اثر دارای حق نسخه‌برداری شما استفاده می‌کند، می‌توانید روندی که در اینجا شرح داده شده است را دنبال کنید.https://fa.player.fm/legal

This story was originally published on HackerNoon at: https://hackernoon.com/do-large-language-models-have-theory-of-mind-a-benchmark-study.
Does GPT-4 really understand us? A benchmark study reveals AI’s surprising Theory of Mind abilities—and where the limits still lie.
Check more stories related to tech-stories at: https://hackernoon.com/c/tech-stories. You can also check exclusive content about #theory-of-mind-ai, #gpt-4-social-intelligence, #ai-higher-order-reasoning, #ai-mental-state-inference, #recursive-reasoning-in-ai, #ai-social-behavior-research, #language-model-benchmarks, #llm-cognitive-abilities, and more.
This story was written by: @escholar. Learn more about this writer by checking @escholar's about page, and for more stories, please visit hackernoon.com.
This article evaluates whether advanced language models like GPT-4 and Flan-PaLM demonstrate Theory of Mind (ToM)—the ability to reason about others’ beliefs, intentions, and emotions. While results show GPT-4 sometimes matches or even exceeds adult human performance on 6th-order ToM tasks, limitations remain: the benchmark is small, English-only, and excludes multimodal signals that shape real human cognition. Future research must expand across cultures, languages, and embodied interactions to truly test AI’s capacity for mind-like reasoning.

  continue reading

328 قسمت

Artwork
iconاشتراک گذاری
 
Manage episode 508418736 series 3474385
محتوای ارائه شده توسط HackerNoon. تمام محتوای پادکست شامل قسمت‌ها، گرافیک‌ها و توضیحات پادکست مستقیماً توسط HackerNoon یا شریک پلتفرم پادکست آن‌ها آپلود و ارائه می‌شوند. اگر فکر می‌کنید شخصی بدون اجازه شما از اثر دارای حق نسخه‌برداری شما استفاده می‌کند، می‌توانید روندی که در اینجا شرح داده شده است را دنبال کنید.https://fa.player.fm/legal

This story was originally published on HackerNoon at: https://hackernoon.com/do-large-language-models-have-theory-of-mind-a-benchmark-study.
Does GPT-4 really understand us? A benchmark study reveals AI’s surprising Theory of Mind abilities—and where the limits still lie.
Check more stories related to tech-stories at: https://hackernoon.com/c/tech-stories. You can also check exclusive content about #theory-of-mind-ai, #gpt-4-social-intelligence, #ai-higher-order-reasoning, #ai-mental-state-inference, #recursive-reasoning-in-ai, #ai-social-behavior-research, #language-model-benchmarks, #llm-cognitive-abilities, and more.
This story was written by: @escholar. Learn more about this writer by checking @escholar's about page, and for more stories, please visit hackernoon.com.
This article evaluates whether advanced language models like GPT-4 and Flan-PaLM demonstrate Theory of Mind (ToM)—the ability to reason about others’ beliefs, intentions, and emotions. While results show GPT-4 sometimes matches or even exceeds adult human performance on 6th-order ToM tasks, limitations remain: the benchmark is small, English-only, and excludes multimodal signals that shape real human cognition. Future research must expand across cultures, languages, and embodied interactions to truly test AI’s capacity for mind-like reasoning.

  continue reading

328 قسمت

כל הפרקים

×
 
Loading …

به Player FM خوش آمدید!

Player FM در سراسر وب را برای یافتن پادکست های با کیفیت اسکن می کند تا همین الان لذت ببرید. این بهترین برنامه ی پادکست است که در اندروید، آیفون و وب کار می کند. ثبت نام کنید تا اشتراک های شما در بین دستگاه های مختلف همگام سازی شود.

 

راهنمای مرجع سریع

در حین کاوش به این نمایش گوش دهید
پخش