NLP обработка текста, решение задачи классификации твитов - «Школа Больших Данных» Москва

В данном видео приведен пример первой стадии решения NLP задачи классификации текстов на языке программирования Python. Приведен пример обработки текста, продемонстрирован разница алгоритмов лемматизации и стемминга.
Ссылка на код: gist.github.com/MachineLearni...
По вопросам обучения на курсах машинного обучения приглашаем в нашу "Школу Больших Данных" г. Москва
Курс проводится только в специализированном учебном центре «Школа Больших Данных» python-school.ru
По вопросам обучения на курсах машинного обучения приглашаем в нашу «Школа Больших Данных»
Обращаться по телефону:
+7 (495) 41-41-121
+7 (995) 100-45-63
Чтобы не пропустить информацию о новых курсах, акциях и других событиях Школы Больших Данных, рекомендуем подписаться на нас в социальных сетях:
Телеграм-канал: t.me/BigDataSchool_ru
Facebook: / bigdataschoolru
Вконтакте: bdschool_mck
LinkedIn: / bigdataschoolru
Twitter: / bigdataschoolr
Подписывайтесь и будьте в курсе всех интересных новинок мира Big Data вместе со Школой больших данных - www.bigdataschool.ru

Пікірлер: 5

  • @siverska
    @siverska9 ай бұрын

    Классно объясняете! Спасибо! 😊 На курсе, который я прохожу, всё намного хуже.

  • @BigDataSchool

    @BigDataSchool

    9 ай бұрын

    Благодарим за отзыв. Приходите к нам на обучение, у нас самые лучшие преподаватели.🙂 (курс по теме видео bigdataschool.ru/courses/pnlp-natural-language-processing)

  • @nikolajbardukov2720
    @nikolajbardukov27203 жыл бұрын

    замечательный урок

  • @dblmok_

    @dblmok_

    3 жыл бұрын

    Спасибо!

  • @user-kk6es2ou8z
    @user-kk6es2ou8z10 ай бұрын

    Как то все сложно. Существют гораздо более простые методы для классификации текстов, которые работают на простом JS коде в обычном броузере на основе ассоциативной семантики. Кстати, достижение критерия достоверности при классификации контента при запросах пользователей требует сохранение изначальной структуры текстов датасета. Здесь текст чистится от стоп-слов и тд, что дает не достоверную классификацию

Келесі