Artwork

محتوای ارائه شده توسط Kabir. تمام محتوای پادکست شامل قسمت‌ها، گرافیک‌ها و توضیحات پادکست مستقیماً توسط Kabir یا شریک پلتفرم پادکست آن‌ها آپلود و ارائه می‌شوند. اگر فکر می‌کنید شخصی بدون اجازه شما از اثر دارای حق نسخه‌برداری شما استفاده می‌کند، می‌توانید روندی که در اینجا شرح داده شده است را دنبال کنید.https://fa.player.fm/legal
Player FM - برنامه پادکست
با برنامه Player FM !

Diffusion LLMs: A Paradigm Shift in Text Generation

9:03
 
اشتراک گذاری
 

Manage episode 470371279 series 3605659
محتوای ارائه شده توسط Kabir. تمام محتوای پادکست شامل قسمت‌ها، گرافیک‌ها و توضیحات پادکست مستقیماً توسط Kabir یا شریک پلتفرم پادکست آن‌ها آپلود و ارائه می‌شوند. اگر فکر می‌کنید شخصی بدون اجازه شما از اثر دارای حق نسخه‌برداری شما استفاده می‌کند، می‌توانید روندی که در اینجا شرح داده شده است را دنبال کنید.https://fa.player.fm/legal

In a groundbreaking development, Diffusion Large Language Models are revolutionizing the field by generating entire responses at once, using a technique inspired by text-to-image generation. This innovative approach, developed by Inception Labs, promises to be 10 times faster and 10 times less expensive than traditional autoregressive models that generate one token at a time. Unlike autoregressive models, diffusion models refine a rough, almost nonsensical text into a coherent solution through iterative steps. This leap in speed, achieving over a thousand tokens per second on standard NVIDIA H100 chips, drastically reduces waiting times and enables more test time compute. This breakthrough not only accelerates coding processes but also facilitates more advanced reasoning, error correction, and controllable generation, opening new possibilities for AI agents, edge applications, and various use cases. According to AI experts like Andrej Karpathy, this diffusion model may also unlock new unique psychology or new strengths and weaknesses, potentially leading to new behaviors in intelligent models.

Send us a text

Support the show

Podcast:
https://kabir.buzzsprout.com
YouTube:
https://www.youtube.com/@kabirtechdives
Please subscribe and share.

  continue reading

270 قسمت

Artwork
iconاشتراک گذاری
 
Manage episode 470371279 series 3605659
محتوای ارائه شده توسط Kabir. تمام محتوای پادکست شامل قسمت‌ها، گرافیک‌ها و توضیحات پادکست مستقیماً توسط Kabir یا شریک پلتفرم پادکست آن‌ها آپلود و ارائه می‌شوند. اگر فکر می‌کنید شخصی بدون اجازه شما از اثر دارای حق نسخه‌برداری شما استفاده می‌کند، می‌توانید روندی که در اینجا شرح داده شده است را دنبال کنید.https://fa.player.fm/legal

In a groundbreaking development, Diffusion Large Language Models are revolutionizing the field by generating entire responses at once, using a technique inspired by text-to-image generation. This innovative approach, developed by Inception Labs, promises to be 10 times faster and 10 times less expensive than traditional autoregressive models that generate one token at a time. Unlike autoregressive models, diffusion models refine a rough, almost nonsensical text into a coherent solution through iterative steps. This leap in speed, achieving over a thousand tokens per second on standard NVIDIA H100 chips, drastically reduces waiting times and enables more test time compute. This breakthrough not only accelerates coding processes but also facilitates more advanced reasoning, error correction, and controllable generation, opening new possibilities for AI agents, edge applications, and various use cases. According to AI experts like Andrej Karpathy, this diffusion model may also unlock new unique psychology or new strengths and weaknesses, potentially leading to new behaviors in intelligent models.

Send us a text

Support the show

Podcast:
https://kabir.buzzsprout.com
YouTube:
https://www.youtube.com/@kabirtechdives
Please subscribe and share.

  continue reading

270 قسمت

所有剧集

×
 
Loading …

به Player FM خوش آمدید!

Player FM در سراسر وب را برای یافتن پادکست های با کیفیت اسکن می کند تا همین الان لذت ببرید. این بهترین برنامه ی پادکست است که در اندروید، آیفون و وب کار می کند. ثبت نام کنید تا اشتراک های شما در بین دستگاه های مختلف همگام سازی شود.

 

راهنمای مرجع سریع

در حین کاوش به این نمایش گوش دهید
پخش