עונה 4 - פרק 1 - מודל התמלול הגדול בישראל - יניר מרמור
Manage episode 508399815 series 3516742
פותחים את עונה 4 עם סיפור קוד-פתוח משולב בינה מלאכותית
בפרק זה אירחנו את יניר מרמור ממכון וויצמן, ממקימי פרויקט “עברית AI” — יוזמה קהילתית לשיפור תמלול דיבור בעברית. דיברנו על איסוף הדאטה הקהילתי, היבטי זכויות יוצרים ואיך הם התמודדו עם הבעיה, בניית דאטה-סטים וגם על האפליקציות הפתוחות (ווב ובוט וואטסאפ) שכבר מתמללות עשרות אלפי שעות בחודש — לצד אתגרי פרטיות ותוכניות להמשך (סטרימינג, דומיינים רפואיים/משפטיים ועוד).
קישורים:
קבוצת וואצפ לעדכונים בפרויקט:
https://chat.whatsapp.com/CcwpHSezjbQCRvUGuubtkN
קבוצת הוואטסאפ לדיונים טכניים יותר:
https://chat.whatsapp.com/Bpf5DsndFwh9C3Rclk2Oul
האתר של הפרויקט: https://www.ivrit.ai/
המספר של אליעזר הבוט המתמלל: 055-957-1223
הממשק שבו אפשר להעלות הקלטות ולקבל תמלול זריז ואיכותי:
Transcribe.ivrit.ai
ערוץ היוטיוב להסברים נוספים על תמלול איכותי בכמויות:
https://youtube.com/@ivrit-ai-l2g?si=9imTFwn8Po_OMmaV
ממשק הקלטת חומר אימון למודל:
https://recital.ivrit.ai/
פטראון לתמיכה סמלית במאמץ:
https://www.patreon.com/ivrit_ai
או פייבוקס:
https://links.payboxapp.com/QzVhOJJAzVb
לטכנולוגיים ולטכנולוגיות שבינינו:
כל הקוד שלנו בגיטהאב: https://github.com/ivrit-ai
כל המודלים והדאטהסטים בהאגינגפייס: https://huggingface.co/ivrit-ai
מייל לתלונות והצעות 🙃:
41 قسمت