Как нейросеть научили читать тексты XVII века

Ғылым және технология

Рукописи, может быть, и не горят, но точно ветшают и портятся. Понять, что написано в двухсотлетних документах, бывает непросто - и из-за их состояния, и из-за особенностей языка. Но на помощь приходят нейросети.
В прошлом году Яндекс запустил «Поиск по архивам». Это сервис, который помогает людям искать упоминания своих предков в архивных документах так же, как в интернете. Для этого команда обучила модель читать старинные тексты, и она уже распознала миллионы страниц.
👀 Попробуйте найти в архивах корни своей семьи: yandex.ru/archive
Это рубрика «Вопрос со звёздочкой», в которой разработчики Яндекса простым языком объясняют сложные технологии. Татьяна Сапатова занимается распознаванием текста в Яндексе и, в частности, в «Поиске по архивам». В «Вопросе со звёздочкой» она рассказывает об особенностях дореформенной орфографии и поиске по старинным записям, которые раньше могли читать только эксперты.
#поискпоархивам #технологии #нейросети #it #яндекс #генеалогия
тайм-коды:
00:00 - Что такое «Поиск по архивам»
00:46 - Огонь, вода, титло и другие сложности распознавания
01:39 - Как эксперты учили нейросеть читать
02:37 - Как модель находила слова в узорах
03:22 - Планы на будущее

Пікірлер: 52

  • @val4521
    @val452128 күн бұрын

    Да я и свой подчерк не всегда потом распознать могу, что уж говорить про чужие

  • @gametraveleryt

    @gametraveleryt

    28 күн бұрын

    Жиза

  • @rwr518

    @rwr518

    23 күн бұрын

    Почерк

  • @shabbytie21925
    @shabbytie2192528 күн бұрын

    Ждём пока нейронка научится распознавать рецепты врачей

  • @TheBirdOfDesire

    @TheBirdOfDesire

    22 күн бұрын

    И речь машинистов электричек

  • @abstinentelven
    @abstinentelven28 күн бұрын

    А как же тëтенька в архиве, у которой каждый прогон сканера стоит от 100 рублей?

  • @katerinavikhoreva
    @katerinavikhoreva4 күн бұрын

    Пользовалась сервисом) Очень увлек🤗 Смогла найти не все данные, конечно, но понимаю, что оцифровка еще продолжается. Спасибо вам огромное за то, что делаете такие крутые вещи и за то, что они бесплатные!🥰

  • @user-zo4hw6wt4z
    @user-zo4hw6wt4z28 күн бұрын

    Спасибо за сервис ❤

  • @yandex

    @yandex

    28 күн бұрын

    ❤️🙌

  • @MishaGoncharov
    @MishaGoncharov28 күн бұрын

    Вот только свой документ не закинуть в этот сервис... Вот у меня есть свидетельство о браке 1920го года, кого-то из родственников. Но я не могу прочитать.. В поиске его не находится. Приходится искать другие сервисы по распознаванию, но качество у них по-моему похуже.

  • @nemodendi
    @nemodendi28 күн бұрын

    Очень симпатичная девушка всё коротко и понятно объяснила, спасибо за видео и за сервис.

  • @yandex

    @yandex

    22 күн бұрын

  • @yguzik
    @yguzik28 күн бұрын

    В первую очередь интерес вызывают описи документов которые ждут оцифровки. Ведь не в одном архиве оцифровку вели).

  • @AleksanderChuikov
    @AleksanderChuikov28 күн бұрын

    У вас список архивов расположен в неудобном порядке. Лучше на первое место поставить название региона, а потом всё остальное

  • @alex_prav

    @alex_prav

    28 күн бұрын

    Саша, попробуй найти в сервисе "оставить отзыв" или что то на подобии такого

  • @AleksanderChuikov

    @AleksanderChuikov

    28 күн бұрын

    @@alex_prav ок

  • @realamour2856
    @realamour285628 күн бұрын

    Учат нейросети всякой сложной херне, сперва научите ваши нейросервисы не ломаться, как ни зайдешь в браузер, переводчик не работает, помощник не работает, завтра снова работает что то одно из двух, послезавтра работает все, еще через день нихера не работает, переустановил браузер, та же херня. Начал гуглить и узнал, что у кучи людей та же беда.

  • @vlabangog

    @vlabangog

    26 күн бұрын

    Незнай, пользуюсь сервисами Яндекса уже около 3-ёх лет, за всё это время Яндекс Музыка только отваливалась пару раз

  • @her0189
    @her018920 күн бұрын

    Отправьте пожалуйста мой заказ, месяц уже лежит

  • @TheBirdOfDesire
    @TheBirdOfDesire22 күн бұрын

    Насколько же вы крутые! 😍

  • @yandex

    @yandex

    22 күн бұрын

    Спасибо за поддержку, приятно читать такое ❤️

  • @WithoutNumbers

    @WithoutNumbers

    22 күн бұрын

    ​@@yandex Было бы также приятно прочитать ответ на удаленные комментарии по теме нахождения Яндекса в Диспетчере задач даже после отключения пункта «Разрешить работу в фоне» на странице настроек: значок меню (≡) → Настройки → Системные → Автозапуск и фоновый режим после закрытия браузера. В итоге кстати удалось избавиться от автоматического запуска Алисы при старте системы, несанкционированного и неуправляемого поведения Яндекса в ОС, сейчас нагрузки на систему нет, хотя сам браузер не удален, лишь два файла - "service_update.exe". Все это напоминает вирус, майнер или хакеров, особенно после удаления переписки, словно мошенничество, реально скам какой-то. Такое ощущение и осадок остается после всего увиденного.

  • @yandex

    @yandex

    22 күн бұрын

    Ваш комментарий видим! Совсем скоро ответим.

  • @yandex

    @yandex

    22 күн бұрын

    Голосовой помощник Алиса интегрирован в Яндекс Браузер и упоминается в названии программы, но это не означает, что он включён. Все процессы браузера называются Yandex with voice assistant Alice или «Яндекс с голосовым помощником Алиса». Работающие в фоновом режиме процессы помогают Яндекс Браузеру открываться быстрее. Попробуйте, пожалуйста, отключить опцию в настройках: меню ≡ → Настройки → Системные → Производительность → Ускорить запуск браузера.

  • @WithoutNumbers

    @WithoutNumbers

    21 күн бұрын

    @@yandex Спасибо за предложение с пояснения и простите за беспокойство. Что касается самого вопроса, на данный момент смог добиться исчезновения элементов Яндекс из Диспетчера задач после закрытия браузера удалив файл "service_update.exe" в двух папках. Необходимость ручного обновления никак не мешает в сравнении с неконтролируемым поведением фоновых процессов и так или иначе это единственно что сейчас сработало, а в будущем, если и это поломается, что ж, значит опять буду читать субтитры из обучающих видео на иностранных языках. Возможно людям на топовых ПК эти процессы на фоне не заметны и это не является для них проблемой, но не у всех под рукой топ железо, чтоб обеспечивать различному софту постоянное потребление ресурсов системы или связь с интернетом, хотя конечно ваши безопасники могут поспорить, я не технарь в IT по образованию. Пункт "Производительность" и опции "Обновлять Браузер, даже если он не запущен" и "Ускорять запуск Браузера" уже нашел самостоятельно по видео, которые записывают люди последние 4 года пытаясь как-то решить этот вопрос с фоновыми процессами. Так что думаю можно закругляться, благодарю за потраченное время и поддержку. Теперь и я могу сказать, что вы крутые, раз уделяете столько внимание своим пользователям!

  • @MrGidella
    @MrGidella27 күн бұрын

    Когда вы договорились с РГАДА, где и хранятся все эти тексты, без этого толку от ваших технологий, основной корпус данных там.

  • @playinlifecom
    @playinlifecom27 күн бұрын

    после просмотра этого видео врачи совсем расслабятся

  • @gametraveleryt
    @gametraveleryt28 күн бұрын

    Ура видео

  • @yandex

    @yandex

    28 күн бұрын

  • @WithoutNumbers

    @WithoutNumbers

    23 күн бұрын

    @@yandex Смотрите, есть видео - "19 яндекс браузеров в Диспетчере задач" и там ваша компания 4 года назад с этого аккаунта оставила ответ, цитата: "@yandex 4 года назад Здравствуйте! Несколько процессов браузера, которые вы видите в диспетчере задач компьютера, возникают из-за включенных у вас расширений и открытых вкладок. Все браузеры на основе Chromium (в том числе Google Chrome и Opera) работают подобным образом и создают отдельный процесс для каждого приложения или вкладки браузера. Количество потребляемой оперативной памяти зависит от того, какие вкладки открыты у вас в данный момент и какие расширения используются." Вопрос в следующем - Как сделать так, чтобы после закрытия вашего браузера, все эти вкладки, несколько десятков, исчезли из Диспетчера задач и браузер после закрытия не потреблял ресурсы системы? Для тех, кто не в курсе - Приходится убирать процессы Яндекса вручную, выбирать по одному элементу из списка и нажимать на кнопку "Снять задачу", это ужасно неудобно, долго и муторно, ведь не всегда с первого раза получается завершить процесс. Почему ваш браузер сам целиком и полностью до сих пор не закрывается окончательно, как это происходит в других браузерах? Это так сложно реализовать? Единственна причина, почему многие все еще держат ваш Яндекс браузер в системе и закрывают все вручную таким неудобным образом - это возможность аудио перевода некоторых видео на Ютубе. Поэтому, когда у самого Ютуба, Гугл или других компаний будет такой ИИ, то Яндекс будет удален окончательно, чтобы не нагружать систему скрытыми и неконтролируемыми процессами в системе, которые используют ресурсы памяти, дисков SSD, процессоры и тд. У SSD и NVMe такое вообще неприемлемо, когда что-то постоянно записывается, считывается, висит и тормозит. 2024 год и эта мелочь все ще не исправлена, просто жесть, учитывая какими возможностями обладает ваша компания и тот факт, что у других браузеров этой проблемы нет.

  • @yandex

    @yandex

    22 күн бұрын

    Здравствуйте! Попробуйте, пожалуйста, отключить пункт «Разрешить работу в фоне» на странице настроек: значок меню (≡) → Настройки → Системные → Автозапуск и фоновый режим. Функция обеспечивает работу браузера в фоновом режиме и активность некоторых фоновых расширений после закрытия браузера.

  • @gametraveleryt

    @gametraveleryt

    22 күн бұрын

    @@yandex хорошо :)

  • @gametraveleryt

    @gametraveleryt

    22 күн бұрын

    @@yandex а в каком приложении?

  • @user-qt7nu6gc2s
    @user-qt7nu6gc2s19 күн бұрын

    Здравствуйте почему когда нажимаешь скачать картинку то не скачивается а открывается всё фото

  • @yandex

    @yandex

    19 күн бұрын

    Здравствуйте! Пожалуйста, расскажите подробнее о ситуации. Правильно понимаем, что вы говорите о скачивании изображения в десктопной версии Яндекс Браузера?

  • @user-qt7nu6gc2s

    @user-qt7nu6gc2s

    19 күн бұрын

    Я говорю про то что когда вводишь запрос и открываешь раздел картинки выбираешь то что нужно и нажимаешь скачать то ничего не скачивается а просто открывается фото на полный экран

  • @yandex

    @yandex

    19 күн бұрын

    Спасибо за уточнение! Ваш вопрос не теряем, скоро вернёмся.

  • @user-qt7nu6gc2s

    @user-qt7nu6gc2s

    19 күн бұрын

    Спасибо

  • @yandex

    @yandex

    19 күн бұрын

    Мы убрали возможность скачать изображение из Картинок, чтобы не нарушать авторское право на интеллектуальную собственность. Скачать картинку можно на сайте-источнике: под картинкой выберите «Скачать» → она откроется на сайте → нажмите на неё и удерживайте → Скачать или Сохранить изображение.

  • @fleeshka4896
    @fleeshka489627 күн бұрын

    Как круто!

  • @arch6544
    @arch654426 күн бұрын

    не знал, что в Яндексе работает бывшая жена Эдварда Билла

  • @user-yx6fd5ht3h
    @user-yx6fd5ht3h26 күн бұрын

    у яндекс есть 1 - то что их нету

  • @user-gz7qc4hf5h
    @user-gz7qc4hf5h28 күн бұрын

    Яндекс пробил очередное дно

  • @user-wu5tt3fy5w
    @user-wu5tt3fy5w27 күн бұрын

    В Яндексе жирных много

  • @user-eq2eq3wz4m

    @user-eq2eq3wz4m

    26 күн бұрын

    Никакой у вас культуры нет

  • @vlabangog

    @vlabangog

    26 күн бұрын

    Ты походу не отличаешь жирных от пышных. Именно эта девушка пышная, красивая, приятная на голос, вызывает симпатию и не побоюсь этой фразы "есть за что ухватиться". К жирным её ни как не отнесёшь.

  • @WithoutNumbers

    @WithoutNumbers

    23 күн бұрын

    А в интернете тупых

Келесі