Генеративный Computer Vision. Кирам Аль-Харба | Под Капотом

Ғылым және технология

#computervision #cv #diffusion #deeplearning #career #generativeai
#машинноеобучение
Присоединяйтесь к курсу GenCV со скидкой: deepschool.ru/gencv/?...
На подкасте «Под Капотом» мы говорим с экспертами из различных областей, чтобы понять, как работают сложные системы изнутри.
В этом выпуске мы поговорили с Кирамом Аль-Харба, Research-инженером в области GenCV.
В выпуске обсудили:
- что такое генеративный CV, чем он отличается от «обычного» и где применяется
- какие проблемы есть у GAN'ов, а какие у диффузионок. Почему последние выстрелили
- есть ли в GenCV хорошие метрики или нужно на глаз ловить чекпоинты
- какое будущее нас ждёт и как защищаться от дипфейков
- что классного можно запустить у себя из open source
Курс 3DCV: deepschool.ru/3dcv?...
Курс СV Rocket: deepschool.ru/cvrocket?...
Курс Ускорение нейросетей: deepschool.ru/speedup?...
Наш телеграм, в котором мы напоминаем теорию и делимся советами по обучению нейросетей: t.me/deep_school
Мы в linkedin: / deep-school
Подписывайтесь, чтобы развиваться в ML и DL вместе!
00:00 | Small Talk
00:21 | Чем занимается Кирам
01:45 | Чем отличается генеративный CV от обычного
05:35 | Где применяется GenCV (FaceApp, DLSS)
07:30 | Какие модели есть в генеративном CV и как они работают
10:55 | Нужно ли разбираться в математике
12:45 | Что такое GAN
13:20 | Что такое Диффузия
15:00 | Когда лучше взять GAN, а когда диффузию
20:40 | Почему диффузионки выстрелили
23:48 | Генеративная трилемма
25:01 | Что такое VAE (вариационные автоэнкодеры)
28:49 | Сложнее ли обучать генеративные модели с нуля, чем с чекпоинта pre-trained весов
32:45 | Кто и как оценивает качество полученных генеративных моделей
41:02 | Как бороться с артефактами генераций
42:36 | 6 пальцев при генерации рук людей
43:07 | SORA: генерация видео становится реальностью
44:40 | Что под капотом у SORA
45:30 | Недостатки SORA
47:09 | Упирается ли обучение генеративных моделей в данные
50:13 | Общие проблемы в обучении генерации видео
52:30 | Ускорение диффузии
55:11 | Какие генеративные модели есть в Open Source
59:50 | Помогает ли синтетика для обычных задач
01:01:20 | Про контроль и адаптеры в диффузионная
01:05:48 | Про дипфейки
01:06:20 | Насколько сейчас проблема дипфейков рядом с нами
01:07:30 | Как защищаться от дипфейков
01:10:10 | Когда мы совсем не сможем «на глаз» отличить дипфейк
01:13:50 | Как диффузионки повлияли на индустрию
01:17:10 | Про нестабильность обучения GAN’ов
01:20:46 | Как Кирам пришёл в GenCV
01:22:32 | Тренды в GenCV vs тренды в 2D CV
01:24:56 | Наскучивают ли Кираму его задачи
01:26:13 | Что больше всего не нравится в работе
01:29:11 | О рынке вакансий в GenCV
01:32:11 | MLE в бигтехе vs MLE в стартапе (GenCV)
01:33:26 | Stable Diffusion: академия наносит ответный удар
01:34:25 | Кто идеальный кандидат на позицию MLE в GenCV
01:37:45 | C чего начать изучать GenCV
01:40:50 | За кем следить в индустрии, чтобы быть в тренде
01:41:52 | Советы по тому, как начать разбираться в коде и структуре генеративных моделях
01:44:35 | Подводим итоги
lilianweng.github.io, • Диффузионные модели с ... - блог и лекция, про которые говорили в конце

Пікірлер: 3

  • @user-qd4zx3mc9l
    @user-qd4zx3mc9l23 күн бұрын

    Спасибо, очень интересный выпуск!

  • @DAJakaRedAries
    @DAJakaRedAries14 күн бұрын

    Топовый материал, было интересно послушать)

  • @user-fy6nj3li8k
    @user-fy6nj3li8k26 күн бұрын

    Когда Вас снимает по 2 камеры смотрится на порядок приятнее. Может добавить Вам общую интерактивную доску? Где можно будет схематично что-то рисовать, немного.

Келесі