Artwork

محتوای ارائه شده توسط Pascal Hartig. تمام محتوای پادکست شامل قسمت‌ها، گرافیک‌ها و توضیحات پادکست مستقیماً توسط Pascal Hartig یا شریک پلتفرم پادکست آن‌ها آپلود و ارائه می‌شوند. اگر فکر می‌کنید شخصی بدون اجازه شما از اثر دارای حق نسخه‌برداری شما استفاده می‌کند، می‌توانید روندی که در اینجا شرح داده شده است را دنبال کنید.https://fa.player.fm/legal
Player FM - برنامه پادکست
با برنامه Player FM !

72: Multimodal AI for Ray-Ban Meta glasses

39:34
 
اشتراک گذاری
 

Manage episode 468970057 series 2390222
محتوای ارائه شده توسط Pascal Hartig. تمام محتوای پادکست شامل قسمت‌ها، گرافیک‌ها و توضیحات پادکست مستقیماً توسط Pascal Hartig یا شریک پلتفرم پادکست آن‌ها آپلود و ارائه می‌شوند. اگر فکر می‌کنید شخصی بدون اجازه شما از اثر دارای حق نسخه‌برداری شما استفاده می‌کند، می‌توانید روندی که در اینجا شرح داده شده است را دنبال کنید.https://fa.player.fm/legal

In this episode of the Meta Tech Podcast, host Pascal sits down with Shane, a research scientist at Meta, to explore the cutting-edge research behind Ray-Ban Meta glasses. Shane shares insights from his seven-year journey at Meta, where he focuses on computer vision and multimodal AI within the Wearables AI organization.

Tune in to learn how Shane's team is pioneering foundational models for Ray-Ban Meta glasses, tackling unique challenges, and pushing the boundaries of AI-driven innovation. Discover how multimodal AI is transforming user experiences and get a glimpse into the future of wearable technology. Whether you're an engineer, a tech enthusiast, or simply curious about the latest advancements, there is something for everyone in this episode.

Got feedback? Send it to us on Threads (https://threads.net/@metatechpod), Instagram (https://instagram.com/metatechpod) and don't forget to follow our host Pascal (https://mastodon.social/@passy, https://threads.net/@passy_). Fancy working with us? Check out https://www.metacareers.com/.

Links

Timestamps

  • Intro 0:06

  • OSS News 0:56

  • Introduction Shane 1:30

  • The role of research scientist over time 3:03

  • What's Multimodal AI? 5:45

  • Applying Multimodal AI in Meta's products 7:21

  • Acoustic modalities beyond speech 9:17

  • AnyMAL 12:23

  • Encoder zoos 13:53

  • 0-shot performance 16:25

  • Iterating on models 17:28

  • LLM parameter size 19:29

  • How do we process a request from the glasses? 21:53

  • Processing moving images 23:44

  • Scaling to billions of users 26:01

  • Where lies the optimisation potential? 28:12

  • Incorporating feedback 29:08

  • Open-source influence 31:30

  • Be My Eyes Programme 33:57

  • Working with industry experts at Meta 36:18

  • Outro 38:55

  continue reading

86 قسمت

Artwork
iconاشتراک گذاری
 
Manage episode 468970057 series 2390222
محتوای ارائه شده توسط Pascal Hartig. تمام محتوای پادکست شامل قسمت‌ها، گرافیک‌ها و توضیحات پادکست مستقیماً توسط Pascal Hartig یا شریک پلتفرم پادکست آن‌ها آپلود و ارائه می‌شوند. اگر فکر می‌کنید شخصی بدون اجازه شما از اثر دارای حق نسخه‌برداری شما استفاده می‌کند، می‌توانید روندی که در اینجا شرح داده شده است را دنبال کنید.https://fa.player.fm/legal

In this episode of the Meta Tech Podcast, host Pascal sits down with Shane, a research scientist at Meta, to explore the cutting-edge research behind Ray-Ban Meta glasses. Shane shares insights from his seven-year journey at Meta, where he focuses on computer vision and multimodal AI within the Wearables AI organization.

Tune in to learn how Shane's team is pioneering foundational models for Ray-Ban Meta glasses, tackling unique challenges, and pushing the boundaries of AI-driven innovation. Discover how multimodal AI is transforming user experiences and get a glimpse into the future of wearable technology. Whether you're an engineer, a tech enthusiast, or simply curious about the latest advancements, there is something for everyone in this episode.

Got feedback? Send it to us on Threads (https://threads.net/@metatechpod), Instagram (https://instagram.com/metatechpod) and don't forget to follow our host Pascal (https://mastodon.social/@passy, https://threads.net/@passy_). Fancy working with us? Check out https://www.metacareers.com/.

Links

Timestamps

  • Intro 0:06

  • OSS News 0:56

  • Introduction Shane 1:30

  • The role of research scientist over time 3:03

  • What's Multimodal AI? 5:45

  • Applying Multimodal AI in Meta's products 7:21

  • Acoustic modalities beyond speech 9:17

  • AnyMAL 12:23

  • Encoder zoos 13:53

  • 0-shot performance 16:25

  • Iterating on models 17:28

  • LLM parameter size 19:29

  • How do we process a request from the glasses? 21:53

  • Processing moving images 23:44

  • Scaling to billions of users 26:01

  • Where lies the optimisation potential? 28:12

  • Incorporating feedback 29:08

  • Open-source influence 31:30

  • Be My Eyes Programme 33:57

  • Working with industry experts at Meta 36:18

  • Outro 38:55

  continue reading

86 قسمت

همه قسمت ها

×
 
Loading …

به Player FM خوش آمدید!

Player FM در سراسر وب را برای یافتن پادکست های با کیفیت اسکن می کند تا همین الان لذت ببرید. این بهترین برنامه ی پادکست است که در اندروید، آیفون و وب کار می کند. ثبت نام کنید تا اشتراک های شما در بین دستگاه های مختلف همگام سازی شود.

 

راهنمای مرجع سریع

در حین کاوش به این نمایش گوش دهید
پخش