Поиск объектов на видео с Python и TensorFlow с нуля, cтроим и обучаем нейросеть UNet

В этом видео я хочу рассказать как можно с нуля разработать и обучить нейронную сеть для распознавания объектов на изображениях.
00:00 - Введение
00:39 - Виды задач распознавания
01:17 - Применяемые архитектуры нейронных сетей
02:00 - Система распознавания объектов
02:39 - Разметка данных
05:04 - Загрузка данных в TensorFlow
09:57 - Способ обработки изображений
11:00 - Архитектура UNet
13:10 - Реализация сети в Keras и TensorFlow
14:56 - Функции потерь и метрики
17:41 - Обучение нейронной сети
19:01 - Тестирование нейронной сети
Исходный код
colab.research.google.com/git...
Статьи
⁃ SegNet arxiv.org/pdf/1511.00561.pdf
⁃ DeepLab arxiv.org/pdf/1606.00915.pdf
⁃ UNet arxiv.org/pdf/1505.04597.pdf
⁃ Обзор функций arxiv.org/pdf/2006.14822.pdf

Пікірлер: 65

@tymurkr2 күн бұрын
Классное видео, все понятно объяснил, ещё попробую на этой недели протестить, если получится, напишу в PS(если не забуду).👍
@user-ji5fe9pb2b Жыл бұрын
Отличное Видео. С пояснением всего что сделано. Автору большое спасибо. Если такое же видео будет сделано и для других типов сетей или например PyTorch, было бы очень круто! Автору большое уважение.
@ernisesama16362 жыл бұрын
Наверное самое понятное обяснение на KZread. Продолжай пожалуста
@TheBestSurvival Жыл бұрын
Качественно и доступно, а главное реально интересно и полезно! Автору желаю 100500 подписчиков))
@goga-pro20244 ай бұрын
самое лучшее обьяснение за всю мою жизнь, а я с нейронками с 2014 года, обьясни людям в следующем видео как продолжить обучение не начиная с нуля, этого матерьяла мало в нете
@user-py2bu9ky2x2 жыл бұрын
Отличное видео! Спасибо автору за работу!
@727doto2 жыл бұрын
Отличное видео, спасибо, очень интересно! С нетерпением жду продолжения !
@cekkush2 жыл бұрын
Павел, очень доступно. Огромное спасибо. Ждём продолжения! Привет из Азербайджана.
@user-ji6ge3py9d2 жыл бұрын
Надо же как интересно . Класс! Здорово придумано.
@user-ov8jm4uv3w Жыл бұрын
Спасибо! Отличное видео! Все настолько хорошо объяснили!
@user-xc9vu6xq2r2 жыл бұрын
Очень полезное видео ! Спасибо большое !
@dyachenkokonstantin67 Жыл бұрын
Спасибо, очень чисто и понятно.
@PhotolessonsOrg2 жыл бұрын
Спасибо за ролик!
@user-jh4rw8wr5b2 жыл бұрын
Очень круто, спасибо большое
@user-sk8pc2mc1u2 жыл бұрын
Очень полезное дело 👍
@bekabad Жыл бұрын
Теперь я знаю, про что будет моя дипломная работа! Спасибо!
@Diman86ful
18 күн бұрын
ну что? получилось с дипломной?
@bekabad
9 күн бұрын
@@Diman86ful Нет, заставили писать что-то более прикладное. Пришлось CRM на Django бахнуть.
@seoonlyRU2 жыл бұрын
красота) лайк от СЕООНЛИ!
@lecturer_abramenkova2 жыл бұрын
Спасибо)
@yood1e Жыл бұрын
Годнота
@nikolaynovikov57562 жыл бұрын
Жду следующие видео, когда будет ???
@s1ngle772 жыл бұрын
Блин круто препод топ
@PLenchak7 ай бұрын
Отличное видео! Подскажите, как можно распечатывать карты признаков по мере обучения?
@GAVNO2 жыл бұрын
спасибо
@user-iy3yo2wt1n2 жыл бұрын
👍👍👍👍👍👍👍👍
@MrKappasama3 ай бұрын
Спасибо за видео! А можете подсказать, в какую сторону копать если нужно найти бинарную маску блоков текста на картинке? (в идеале так вырезать текст и восстановить фон)
@revoluxe9 ай бұрын
💪
@user-ct6zd7xm8s Жыл бұрын
круть
@user-ov8jm4uv3w Жыл бұрын
Кстати. А вот если задача стоит так, чтобы модель к цвету не привязывалась, а к форме - перевод в градации серого решит задачу? Например, изменение освещенности это сможет решить?
@meowxd1337 Жыл бұрын
А есть какой нибудь готовый датасет для лис, котов итд?
@user-gv3fx2jh7i Жыл бұрын
когда пытаюсь вставить свои изображения вылезает такая ошибка: TypeError: Input 'filename' of 'ReadFile' Op has type float32 that does not match expected type of string. что мне делать?
@user-qm9xh3je4y7 ай бұрын
Здравствуйте, у меня вопрос, чем кардинально будет отличаться данный метод от метода локализации? Суть же останется той же, только объект будет всего лишь один или есть различия?
@user-wj8po5ou5c Жыл бұрын
Отличное видео. Подскажите, а что за среда разработки используется на видео?
@user-of-world
Жыл бұрын
Юзай Google collab, офигенная штука
@user-fn4yc7un8z9 ай бұрын
Добрый день! Отличное видео, спасибо. Подскажите пожалуйста, в каком формате вы экспортировали данные из supervisely?
@lyftzeigen
9 ай бұрын
Здравствуйте! Sypervisely обновился, наверное сейчас это называется "Export to masks".
@user-fn4yc7un8z
9 ай бұрын
@@lyftzeigen большое спасибо!
@dmitrykhomyakov8451
6 ай бұрын
@@user-fn4yc7un8z Sypervisely. не предлагает экспорт в таком формате. На выбор дано 6 вариантов: Sypervisely, YOLO8, просто images (видимо без аннотаций), DOTA, COCO Keypoints, image links to CSV. Какой из этих форматов можно использовать в коде по Вашему видео?
@user-nj5vi5dh2f Жыл бұрын
Добрый день, спасибо за видео) очень помогло Но есть один вопрос, как подтянуть координаты пересмотра классов?
@user-cm8fi9vo8h
Жыл бұрын
А куда сохраняются обработанные кадры? Подскажи пожалуйста Или как сохранить их локально?
@djosmer2 Жыл бұрын
Подскажи. Допустим есть картинка, на ней один объект и снизу рядом текст, надо сделать рамку вокруг объекта с текстом. Сделать обводку не пойдет, т.к. повторяет форму объекта, надо чтоб линия плавно обводила объект с текстом, например как у стикеров. Сможет ли это сделать нейронка?
@lyftzeigen
Жыл бұрын
На мой взгляд, применять нейросеть для решения такой задачи, не самое оптимальное решение. Думаю, что проще воспользоваться классическими методами, например, выделение контуров текста и применение морфологических операций с последующей обработкой.
@arhalexxx3 ай бұрын
переобученная модель может получиться, если аугументация это простое копирование. Только эти предметы и будет хавать и то не всегда. чуть другая форма, тон и всё. Интересно вот как видеокарта настроена, если Вы ей собираетесь обучать.
@user-mk6yf4lu3p4 ай бұрын
А для чего применяется подряд tf.image.convert_image_dtype и следом нормализация image/255? Разве это не одно и тоже?
@user-cm8fi9vo8h Жыл бұрын
Здравствуйте, а куда сохраняются уже обработанные кадры? По коду они должны сохранятся в репозиторий videos/processed, я повторил, но у меня ничего в этой папке не появляется. Помогите, пожалуйста!
@user-cm8fi9vo8h
Жыл бұрын
ПОМОГИТЕ ПОЖАЛУЙСТА
@Grenkitop9 ай бұрын
Добрый день , Павел .Как с вами связаться ? Я хочу попросить вас обучить Аи под мою модель , я заплачу. И если интересно в дальнейшем мне нужна будет помощь для добавления разных объектов в мою библиотеку . В целом возможно долгосрочное сотрудничество в этом направлении
@user-cq3tt9fv9j Жыл бұрын
Здравствуйте. Имею следующую ошибку во время первой эпохи обучения: ValueError: Dimensions must be equal, but are 400 and 8 for '{{node dice_bce_mc_loss/mul}} = Mul[T=DT_FLOAT](dice_bce_mc_loss/unstack, dice_bce_mc_loss/unstack_1)' with input shapes: [?,400,500], [?,8,8]. В коде изменил лишь размер изображения (на 400x500), количество классов-цветов (с 8 на 2) и добавил указание количества каналов для png (mask = tf.io.decode_png(mask, channels=3)), а также небольшое изменение в Skip Connections - downsample_skips = reversed(downsample_skips[:0]). На какую часть программы порекомендуете взглянуть? Спасибо.
@lyftzeigen
Жыл бұрын
Здравствуйте! Изменение разрешения изображения тянет за собой все остальное. Нужно разобраться в размере данных, которые проходят через нейросеть и через все функции. А порекомендую взглянуть на связку YOLO + Roboflow: blog.roboflow.com/train-yolov7-instance-segmentation-on-custom-data/
@grey1111111114 ай бұрын
На Colab ошибка на ячейке с обучением модели: InvalidArgumentError: Graph execution error:
@grey111111111
4 ай бұрын
поменял GPU на CPU и заработало, почему так может быть?
@user-or5rm1ud9y2 жыл бұрын
Уважаемый автор, не могли бы вы помочь и предоставить файл с моделью нейронной сети которую Вы реализуете в данном ролике
@lyftzeigen
2 жыл бұрын
В описании к видео есть ссылка на Google Collab, где вы можете самостоятельно опробовать работу нейронной сети.
@user-or5rm1ud9y
2 жыл бұрын
@@lyftzeigen я имею ввиду схему нейронной сети, которая у вас демонстрируется на 2:30
@somebody5186 Жыл бұрын
!!!
@MrSatanizd Жыл бұрын
г_спади видос на 11 из 10 по объяснению и демонстрации как вся это нейронная хня работает!!!!111. Есть ли возможность связаться с автором видео для общения по разработке решения распознавания объектов на видео?
@user-pc2ge5km9s2 жыл бұрын
Как размечать, как выгружать - ни слова об этом :(
@PhotolessonsOrg
2 жыл бұрын
согласен - это достаточно полезная информация была бы!
@user-ji5fe9pb2b
Жыл бұрын
На счет этого можно посмотреть видео по разметке данных именно указанными инструментами. Хотя согласен, можно было бы добавить описание.
@romastep6576 Жыл бұрын
Очень интересно, но почти ничего не понятно. Не в сторону автора выпад, а в сторону недостаточности моих знаний для полного понимания разжеваного до атомов материала 😂
@iiiyx Жыл бұрын
Слишком много "почему" после просмотра, поэтому это, увы, не обучающее видео.
@jeremyfox3031 Жыл бұрын
"хорошее видео" "отличное видео" "очень полезно" и бла-бла-бла пустая, никчёмная болтовня, которая никого, ничему и никогда не научит
@mattewcox7065 Жыл бұрын
кто нибудь сталкивался с проблемой, что именно маски не читаются с ошибкой: InvalidArgumentError: Matrix size-incompatible: In[0]: [189888,1], In[1]: [3,1] [[{{node rgb_to_grayscale/Tensordot/MatMul}}]] [Op:IteratorGetNext]
@mattewcox7065
Жыл бұрын
@@aligatorpe а я ззафиксил кстати и забыл как уже

Поиск объектов на видео с Python и TensorFlow с нуля, cтроим и обучаем нейросеть UNet

Пікірлер: 65

@Diman86ful

18 күн бұрын

@bekabad

9 күн бұрын

@user-of-world

Жыл бұрын

@lyftzeigen

9 ай бұрын

@user-fn4yc7un8z

9 ай бұрын

@dmitrykhomyakov8451

6 ай бұрын

@user-cm8fi9vo8h

Жыл бұрын

@lyftzeigen

Жыл бұрын

@user-cm8fi9vo8h

Жыл бұрын

@lyftzeigen

Жыл бұрын

@grey111111111

4 ай бұрын

@lyftzeigen

2 жыл бұрын

@user-or5rm1ud9y

2 жыл бұрын

@PhotolessonsOrg

2 жыл бұрын

@user-ji5fe9pb2b

Жыл бұрын

@mattewcox7065

Жыл бұрын

Келесі