Попробовать новую технологию может любой желающий в сервисе «Поиск по архивам». В нем находится более чем 2,5 млн страниц исторических документов с текстовой расшифровкой. Новый алгоритм построен на принципе системы оптического распознания символов, то есть, учитывает особенности почерка, а также узнает утратившие актуальность буквы и символы — «понимает особую структуру архивных документов».
Специалисты обучили нейросеть на основе массива данных из сотен тысяч рукописных строк реальных текстов VIII-XIX веков и десятков миллионов сгенерированных примеров. Благодаря технологии можно расшифровать текст, который вряд ли будет понятен современному человеку без специальных знаний.