От T9 до ChatGPT/ ML-инженер о том, как работают языковые модели и мифах вокруг AI

На Highload++ после доклада о языковых моделях к Ире выстроилась огромная очередь желающих задать вопросы. Кажется, в 2023 все только и говорили о ChatGPT, но никто так и не разобрался что у LLM под капотом.
Поймали Иру в студии kotelov podcast, чтобы поболтать о её приключениях в мире Data Science - узнали как она файнтюнит AI, разобрали в каких вопросах можно доверять ChatGPT и узнали как взломать языковую модель
Валерий Котелов пригласил в гости Ирину Николаеву - лид ML-направления в Raft, где она интегрирует LLM-модели в реальные продукты
Озвучка заставки - диктор, питч-тренер Димитрий Чумак t.me/+uM_zjrPjiadmYTky
Подписаться на невероятные новости, супервакансии и стажировки t.me/+MXmuoFyL5hxiOWVi
Обсудить проект t.me/kotelov_com
Отправить CV hr@kotelov.com или kotelov.com/hr/
Магазин мерча kotelov.com/merch/
Телега Иры - t.me/pansy_77
Блог компании habr.com/ru/companies/raft/ar...
Тг-канал Рафт про AI - t.me/kokuykin
huggingface.co/spaces/lmsys/c...
Внутри:
00:00 Начало
01:23 Как изменились языковые модели: От Т9 до ChatGPT
06:49 Откуда тренд на языковые модели LLM
11:37 Может ли нейросеть быть врачом?
17:11 Преимущества языковых моделей больших языковых моделей перед другими технологиями
20:22 Тест Тьюринга: как понять, что ты общаешься с нейронкой
22:56 Как персональные данные могут утечь из языковой модели
27:46 Тюнинг языковой модели: какие фичи можно прикрутить к LLM
29:19 Как один дата-сайентист может собрать свой колл-центр из нейронок
46:15 Переход с ChatGPT и Llama: разница промтинга языковых моделей
49:12 В чем разница ChatGPT и Llama
50:04 Бенчмарки для языковых моделей. Как понять какая LLM-модель лучше
51:37 Защита данных с помощью LLM-модели
54:47 Про файнтюнинг LLM
56:32 Может ChatGPT слить данные?
58:57 Внедрение LLM в реальное производство
01:09:38 Оптимизация существующих языковых моделей
01:17:02 Какое образование у Иры
01:19:23 Нужно ли образование дата-сайентисту?
| #нейросеть #chatgpt #интервью #chatgpt #llm #llama #chatgptplugins #нейросеть #промтинг #валерийкотелов #kotelov #котелов #чатбот #языковыемодели

Пікірлер: 47

  • @nikitacherenev8505
    @nikitacherenev85055 ай бұрын

    3:24 reinforcement learning - это как раз таки наоборот обучение С подкреплением

  • @denisbabaev
    @denisbabaev5 ай бұрын

    Kotelov, спасибо за подкаст. Было интересно и полезно, много инсайтов выдернул по теме ML. Ира, благодарю за информацию🖤

  • @tamelko
    @tamelko5 ай бұрын

    Очень интересно и красиво! Спасибо вам)

  • @lokser91
    @lokser915 ай бұрын

    Вообще есть кейсы постановки редких диагнозов по анализам и даже вроде удачные.

  • @denkor.z
    @denkor.z5 ай бұрын

    О, красиво и интересно, а людей нет) Рекомендации работают, подписался)

  • @education5983
    @education59834 ай бұрын

    Уважаемый kotelov. Спасибо что пригласили интересного специалиста. Пожалуйста следующий раз не мешайте выступающему своими ремарками.

  • @fredfrost8905
    @fredfrost89052 ай бұрын

    Контент топ - вайб рили найс, имбово самарит хайповый тренд на изи!

  • @DarkW1zard
    @DarkW1zard5 ай бұрын

    18:59 не правда. До ботов, когда звонили в поддержку выдавали перечень возможностей, нажмите то нажмите это и там так же матерились и пытались добраться до оператора, некоторые провайдеры и операторы специально убирали этот пункт в конец или делали его проблемным. Странно, что они в сколково не могут себе карточки позволить. И не такая уж сложная тема, не нужно упрощать. 20:24 насмотренность, как с постобработкой и графикой в фильмах.

  • @ML_DOOM
    @ML_DOOM5 ай бұрын

    Классный разговор с кучей интересных деталей! Спасибо Ире!

  • @wenzelrozman
    @wenzelrozman5 ай бұрын

    Ребята, спасибо, очень интересно! Как стать ML-инженером?))

  • @Rudolf_Barbu

    @Rudolf_Barbu

    5 ай бұрын

    тебе не стать

  • @bbrother92

    @bbrother92

    5 ай бұрын

    учи матан)

  • @wenzelrozman

    @wenzelrozman

    5 ай бұрын

    Интересно почему?)​@@Rudolf_Barbu

  • @Rudolf_Barbu

    @Rudolf_Barbu

    5 ай бұрын

    @@wenzelrozman Знаешь, есть такая пословица, если ты задаешь вопросы как или кем тебе стать - ты никем точно не станешь.

  • @sapporinsanbo3609

    @sapporinsanbo3609

    5 ай бұрын

    Какие вводные?))

  • @roman_pokora
    @roman_pokora4 ай бұрын

    Технология LLM это еще пока не та технология, которая попадает в руки злодея и позволяет владеть миром, но уже очень близко

  • @romanbolgar
    @romanbolgar5 ай бұрын

    Ничего не понятно но слушал с удовольствием голос приятный Умная... Хотелось бы с наглядностями. Я имею в виду установить на своём компьютере и Дообучить. Вот сейчас говорю эти слова А оно почему-то распознают какие-то пошлости. Даже не могут доработать нормальное распознание речи оффлайн

  • @user-ii3lg9xb9c

    @user-ii3lg9xb9c

    4 ай бұрын

    буржуйский гугель плохо понимает русский яз. Пользуйся Алисой

  • @romanbolgar

    @romanbolgar

    4 ай бұрын

    @@user-ii3lg9xb9c Я из Украины К сожалению Алиса работает плохо. Ну может доработали надо будет попробовать. Яндекс Всё время удивляет пытается держаться на плаву обходить блокировки. Радует что они себя позиционируют как международная компания. Огорчает что только позиционируют

  • @BrutalStrike2
    @BrutalStrike25 ай бұрын

    49:12

  • @brr3534
    @brr35345 ай бұрын

    Крутой и полезный выпуск!

  • @user-ii3lg9xb9c
    @user-ii3lg9xb9c4 ай бұрын

    Ведущий на молодого Тарантино похож! 🙂

  • @user-vw7tr1oh6v
    @user-vw7tr1oh6v4 ай бұрын

    Какой хитрый способ увеличить интерес к Сколково у айтишников

  • @nuegonah886
    @nuegonah8863 ай бұрын

    спасибо. Сэкономила себе полсекунды, сказав "пи оу си", а я потратил потом 30 секунд чтобы полезть спросить что это такое. Святой Чятжыпитичетыре, как научить людей ЭТИЧНОМУ таймменеджменту?

  • @userpupkin499
    @userpupkin4994 ай бұрын

    Насчет чатботов, неприятно не то, что с чатботом разговариваешь, а то, что после минуты разговора понимаешь, что там не человек. Причем сейчас фирмы не обязаны предупреждать, что с тобой бот разговаривает. Что плохо. А оайфхак такой: сразу спрашиваешь, что-то типа "чему равен корень из 36"? Если эта балалайка продолжает навязывать тебе кредит, то просто сбрасываешь звонок

  • @roman_pokora

    @roman_pokora

    4 ай бұрын

    просто говори "оператор" "оператор" и т.д. и тебя переведут на человека

  • @UtroMeerk
    @UtroMeerk4 ай бұрын

    Какое неуверенное и неумелое пользование родным языком... Кальки и суррогаты в большом количестве -- тому свидетельство. Если человек не осилил материнский язык, станем ли мы доверять утверждению, что он силён в более абстрактном языке, математике? Язык математики покоится на фундаменте кратких, необходимых и достаточных, бесспорных утверждений сделанных на родном языке. Затем опыт прояснения формулировок для математики сам напрашивается, чтобы его перенесли обратно, и повторно использовали уже в отношении бытовых оборотов родной речи. Без этой обратной связи математик из вас получится так себе. (спасибо за видео, благодаря вашему диалогу есть с чем сравнить, вспоминая свой студенческий опыт начала 1980х)

  • @sergeyshtirliz5018

    @sergeyshtirliz5018

    4 ай бұрын

    зумерша

  • @deniskhakimov

    @deniskhakimov

    4 ай бұрын

    @@sergeyshtirliz5018 так ведь дело не только в этом. Наши ML-щики часто чуть ли не дословно цитируют книги по машинному обучению, вместо того, чтобы давать собственные определения и приводить понятные всем аналогии. Сам несколько лет назад глубоко погружался в эту тему и прочитал достаточный объём литературы, как русскоязычной, так и в оригинале, поэтому когда слышу подобные цитирования, это нещадно режет слух. А в русскоязычных интервью с _экспертами_ я их слышу постоянно. Когда человек действительно понимает тему, он легко приведёт собственную аналогию или даст определение своими словами (если требуется, то понятное даже ребенку). Ну, блин, об этом ведь ещё Ричард Фейнман писал! Собственно, поэтому меня и не удивляет тот факт, что наши в среднем отстают на 1.5 - 2 года от того, что вытворяют лидеры индустрии.

  • @user-ii3lg9xb9c

    @user-ii3lg9xb9c

    4 ай бұрын

    Согласен. Математика - королева наук. Это всем известно.

  • @roman_pokora

    @roman_pokora

    4 ай бұрын

    Кальки это норма, всю математику калькировали с древних времён с греческого, потому что греческие математики её создавали, а теперь калькируют с английского, потому что изобретают и распространяют технологии именно на английском.

  • @user-ii3lg9xb9c

    @user-ii3lg9xb9c

    4 ай бұрын

    @@roman_pokora ага, лучший пример калькирования - современный украинский язык, который нынче всё больше являет собой кальку с польского и частично английского. Потерял самобытность. Это - хорошо?

  • @user-ii3lg9xb9c
    @user-ii3lg9xb9c4 ай бұрын

    15 минут послушал. Расстроился. У девочки очень замусоренная речь. Если она думает что говорить на жаргоне это круто, то ей надо в куклы играть, а не интервью давать. не буду смотреть. Мусор словесный, интересного ноль.

  • @roman_pokora

    @roman_pokora

    4 ай бұрын

    Это язык специалиста, а вы его не поняли.

  • @roman_pokora

    @roman_pokora

    4 ай бұрын

    Ну вот переведите мне слово промт в этом контексте. Запрос - не подходит, заявка - нууу, короче попробуй перевести и сделать так, чтобы прижилось и распространилось

  • @user-ii3lg9xb9c

    @user-ii3lg9xb9c

    4 ай бұрын

    @@roman_pokora PROMT Master - уникальный переводчик, позволяющий переводить документы пакета MS Office (Word, Excel, PowerPoint, One Note), презентации и файлы PDF с сохранением исходного стиля и форматирования.

  • @user-ii3lg9xb9c

    @user-ii3lg9xb9c

    4 ай бұрын

    @@roman_pokora специалист разговаривает обычным научным языком. А тут я вижу продвинутую ламершу ( если такие в природе бывают :-) )

  • @edwardsamokhvalov6720

    @edwardsamokhvalov6720

    Ай бұрын

    ​@@user-ii3lg9xb9cламерша от слова llama

Келесі