«Яндекс» научил нейросети расшифровывать документы с дореволюционной орфографией

Компания «Яндекс» научила нейросети расшифровывать архивные дореволюционные документы, к которым открыт доступ. Благодаря новым возможностям, пользователи смогут ознакомиться с историческими данными с тесовой расшифровкой. Об этом сообщили в пресс-службе компании.

«Яндекс» научил нейросети расшифровывать документы с дореволюционной орфографией

Попробовать новую технологию может любой желающий в сервисе «Поиск по архивам». В нем находится более чем 2,5 млн страниц исторических документов с текстовой расшифровкой. Новый алгоритм построен на принципе системы оптического распознания символов, то есть, учитывает особенности почерка, а также узнает утратившие актуальность буквы и символы — «понимает особую структуру архивных документов».

Специалисты обучили нейросеть на основе массива данных из сотен тысяч рукописных строк реальных текстов VIII-XIX веков и десятков миллионов сгенерированных примеров. Благодаря технологии можно расшифровать текст, который вряд ли будет понятен современному человеку без специальных знаний. 

scroll to top