Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4
Шаги/Steps. 2026. Т. 12. № 4.
В кн.: Восточная Европа в древности и средневековье. Чтения памяти члена-корреспондента АН СССР В.Т. Пашуто. Выпуск XXXVIII. Будущее в настоящем: предсказания, знамения, видения, сны. М.: ИВИ РАН, 2026. С. 161-166.
Репозиторий открытых данных по русской литературе и фольклору. B001. Институт русской литературы (Пушкинский Дом) РАН, 2026

Проект филологов шел к сегодняшним результатам более десятилетия. Основа, проект "Автограф", появился в 2014 году благодаря группе исследователей Российского государственного архива литературы и искусства (РГАЛИ). В 2019 году Школа филологии НИУ ВШЭ подключилась к проекту под руководством Елены Пенской (сейчас — руководитель Центра цифровых архивных исследований ФГН). В 2022 году группа участников «Автографа» решила идти дальше. Они подали новую заявку в РНФ и выиграли грант на междисциплинарный и межуниверситетский проект «Культурное наследие России: интеллектуальный анализ и тематическое моделирование корпуса рукописных текстов». К работе подключились историки, математики и филологи из ВШЭ и их давние партнеры из Томского госуниверситета. Проект формально завершился в 2025 году, но исследования продолжаются. Елена Пенская и кандидат физико-математических наук Никита Ломов создали работающую информационную систему. .jpeg)
Обработка дневников Сухово-Кобылина.
Фото с платформы Steamlit.
Цель заключалась в разработке цифровых инструментов, которые могли бы работать с рукописями (дневниками, письмами, эго-документами XIX — начала XX веков), превращая их в структурированные данные с помощью алгоритмов машинного обучения. При этом нужнобыло создать не просто оцифрованный архив, а более усовершенствованный массив данных с возможностью тематического поиска по текстам.
Система, разработанная на ФГН, использует оригинальную архитектуру нейросети YOLO-HTR (You Only Look Once + Handwritten Text Recognition), которая одновременно решает две задачи: находит строки текста на изображении и расшифровывает их. Затем происходит семантизация и построение навигации.
Как работает семантическая навигация? С помощью больших языковых моделей система выделяет в тексте так называемые сущности: не только традиционные «персоны», «локации» или «организации», но и более сложные категории — «состояние здоровья», «политическое событие», «размышление». Пользователь может кликнуть на любую сущность и мгновенно получить все строки и страницы, где она упоминается. Сегодня исследователь может сформулировать запрос на естественном языке («покажи все упоминания болезней в 1850-е годы» или «выдели поездки с указанием маршрута и спутников»), а система вернет структурированный список — с полями, пригодными для дальнейшего анализа. Это позволяет отслеживать временную динамику упоминаний, выявлять совместные появления сущностей, реконструировать социальные связи, конфликты и перемещения.
Работа системы на примере дневника Сухово-Кобылина.
Проект продолжается в рамках Программы фундаментальных исследований НИУ ВШЭ 2026 года («Язык, литература и культура в историческом и социальном измерении»).
Школа филологических наук: Профессор