Поиск по архивам: как найти историю семьи в документах XVIII века (yet another podcast #33)

Ғылым және технология

Год назад Яндекс запустил «Поиск по архивам». Это сервис, в котором можно искать информацию по архивным документам почти как в интернете. Для этого разработчики обучили нейросети расшифровывать рукописные записи со сложной дореволюционной орфографией.
Сейчас в базе более 11 миллионов архивных документов из хранилищ Москвы, Астраханской, Оренбургской, Иркутской и других областей. Это метрические книги, исповедные ведомости и ревизские сказки XVIII - начала XX века. Они будут полезны как историкам, так и тем, кто хочет больше узнать о прошлом своей семьи.
👉 «Поиск по архивам»: yandex.ru/archive
В yet another podcast обсуждаем, что интересного можно найти в архивах и как мы обучили нейросеть распознавать букву Ѣ. Разобраться с исторической темой помогают руководитель «Поиска по архивам» Александр Болховитянов и руководитель группы распознавания текста Татьяна Сапатова.
yet another podcast - регулярный подкаст о новых технологиях, продуктах Яндекса и людях, которые над ними работают. В каждом выпуске ведущий Павел Кушелев с гостями обсуждают один продукт компании: большое обновление, важную разработку и стоящие за ними процессы.
🦸‍♂️ В гостях - Иван Корякин, автор телеграм-канала «Генеалогика» и подкаста «Откуда родом»
t.me/go_genealogy
www.kommersant.ru/theme/3315
🎧 НА ДРУГИХ ПЛАТФОРМАХ:
• Яндекс Музыка: music.yandex.ru/album/24046885
• Apple Podcasts: clck.ru/34JYfc
• Google Podcasts: clck.ru/34JYPX
⚡ ЧТО В ВЫПУСКЕ
00:00 - Поиск, но не в интернете
02:13 - Сколько архивов в России
05:23 - Легенда про суперархив мормонов
11:19 - Раньше даже бумага была лучше
13:13 - Как сделать запрос в архив
17:47 - Фонд и опись: глоссарий архивов
19:29 - Архивный мем!
22:00 - Зачем придумали «Поиск по архивам»
23:19 - Три главных вызова
27:03 - Как обучали нейросеть
31:39 - Что такое метрическая книга
34:30 - Нейросеть видела слова везде
39:27 - Учили на «Анне Карениной»
42:58 - Байка про The Beatles
46:50 - Ефросинья или баранина
49:41 - 40 000 долларов за 10 символов
54:23 - Особенности старой орфографии
01:02:48 - Нейросеть YASTREB
01:05:01 - Распознавание почерка врачей?
01:08:21 - Особенности тайского и корейского
01:10:39 - Тамбов как треть Европы
01:13:37 - Про коллаб с Genotek и «Великими описями»
01:19:38 - Кушелев - про семейное древо
01:21:48 - С чего начать поиск предков
01:25:42 - Да, но зачем всё это?

Пікірлер: 23

  • @IrinaTaran85
    @IrinaTaran852 ай бұрын

    Ребят, вы делаете огромное дело - возвращаете людям, семьям, целой стране - их корни. Человек без рода - как дерево без корней. Очень жду Рязанскую губерию.

  • @sve_eta
    @sve_eta2 ай бұрын

    Огромнейшее спасибо команде Яндекса! Вы делаете колоссальную работу!! 🙏 У Ивана, кстати, есть очень полезный небольшой курс по Генеалогии - для начала поисков предков очень рекомендую! Мне уже удалось найти информацию о далёких предках, и это просто невероятно! ❤

  • @user-be3jd3qx8x
    @user-be3jd3qx8x2 ай бұрын

    Очень интересно! Спасибо за выпуск 🙏

  • @rinpav
    @rinpav2 ай бұрын

    Скорее бы Тамбов, Пенза, Рязань 🥺 И вообще мечтаю чтобы все-все-все документы архивные со временем вышли в открытый доступ, не только те, что напрямую связаны с генеалогией. Иногда, например, хочется побольше узнать об истории какого-то места, населенного пункта (особенно если это какая-то небольшая деревня), о чем не всегда есть информация в открытом доступе, и в делах может быть не вынесено в название, а упоминаться в тексте.... И как это было бы полезно! Спасибо вам за этот проект!

  • @MrTonav
    @MrTonav2 ай бұрын

    Какая крутая передача получилась, о великом деле!

  • @diletante_orchestra
    @diletante_orchestra2 ай бұрын

    Спасибо за вашу деятельность. Еще не работала с яндекс.архивами. Но понимаю, какое важное дело. А еще смотрела на девушку, какая симпатичная и приятная!

  • @elenzhitkova2715
    @elenzhitkova27152 ай бұрын

    Ребята, вы классные! Работаю с яндекс. архивом практически каждый день. Успехов вам и дальнейшего развития! ❤

  • @yandex

    @yandex

    2 ай бұрын

    Спасибо за тёплые слова! ❤️

  • @user-pz7mh7qv5d
    @user-pz7mh7qv5d2 ай бұрын

    Спасибо команде за проект "Поиск по архивам"! Надеюсь у вас появится сервис по переводу магометянских метрик.

  • @user-ff9ft1ld5g
    @user-ff9ft1ld5g2 ай бұрын

    Классный проект, хорошее дело 👍

  • @AVVA20
    @AVVA202 ай бұрын

    👍👍👍

  • @user-nc6vg9lo2i
    @user-nc6vg9lo2i2 ай бұрын

    Врачи уже давно початую 😊

  • @jerry_martinezz
    @jerry_martinezz2 ай бұрын

    столько раз уже услышала про свою область) приятно)))

  • @IlyaShamionov
    @IlyaShamionov2 ай бұрын

    👍

  • @user-dn8ey3ro8q
    @user-dn8ey3ro8q2 ай бұрын

    Пусть оператор бъет ведущего как только он засовывает очки в рот и разговаривает. Каждый выпуск он так делает

  • @MrMegaTimmi
    @MrMegaTimmi2 ай бұрын

    А у них там в Яндексе довольно много жирных стало заметно.

  • @user-wu5tt3fy5w

    @user-wu5tt3fy5w

    2 ай бұрын

    Людей обманывают и жрут наворованое!

  • @pawpawqwertyuiop

    @pawpawqwertyuiop

    2 ай бұрын

    Зачем вы так

  • @user-gz7qc4hf5h
    @user-gz7qc4hf5h2 ай бұрын

    Противые

  • @playinlifecom
    @playinlifecom2 ай бұрын

    да ты чеееееееееееее! поиск по архивам

Келесі