№23: Stable Diffusion – вбачаємо образи в шумі
Manage episode 342349350 series 3361795
🔞 Тут будуть матюки 🔞
Робочі посилання і коментарі в каналі https://t.me/midnight_chatter
- 0:0-0:30 Дисклеймер
- 0:31-1:10 Про що цей епізод?
- 1:11-4:45 Які свіжі моделі вміють у text -> image? (Спойлер: midjourney / stable diffusion / dalle-2 / parti / imagen / dalle-mini aka craiyon). Якими можна погратись безкоштовно?
- 4:46-15:10 Що таке архітектура encoder-decoder, латентне представлення, задача прибирання шуму
- 15:11-21:00 Поглянемо на механізм роботи дифузійних моделей (diffusion models) з висоти польоту птиці — що лякає Сашу? Важливість апскейлінгу. Обсяги дата поінтів коли працюємо на хайрез картинках
- 21:01-24:28 Задачі, які можна вирішувати такими моделями — інпеінтінг, скетч в картинку, текст в картинку, різні стилі — чому страждають художники? Професіонали залишаться професіоналами!
- 24:29-32:35 Юзкейси і штуки які вже роблять: плагіни для фотошопу, інструменти для колажів, відео, етс – як AI допоможе вам виграти $300
- 32:36-36:26 Як відбувається сучасна інтеграція людини та машини — чи досі актуально використовувати для цього “морзянку”?
- 36:27-43:28 Кому дадуть $600k на опен сорс? Тренуйте правильні моделі!
Аромат комунізму.Федеративне навчання — розв’язок? - 43:29-46:28 Суперкомп’ютер КПІ не допоможе вам натренувати свою дифузійну модель
- 46:29-58:42 Гуманізація моделей. Всередині dalle-2 є прихована language model! А фейсбук боти трейдили і "вигадали приховану мову"
- 58:43-1:03:59 Яка модель генерує найгарніші зображення? І чи зможе якась з них зрозуміти концепт швайнокарася? 9/11 у світі AI
- 1:04:00-1:04:22 Які дипломні роботи будуть писати люди в КПІ?
Долучайтесь до нашого телеграм каналу https://t.me/midnight_chatter
Twitter: @O_Balachky
TikTok: @o_balachky
Музика: https://www.streambeats.com/ | @stas_gee
47 قسمت