Пятница, 05 декабря 2025

Информационный портал

Лента новостей

РЕКЛАМА

10 октября 2025
Елена Кузьмина

В Новгородском университете создали нейросеть для чтения и расшифровки берестяных грамот

Проект Ивана Филиппова и Ирины Телиной по созданию нейросети для автоматического распознавания текстов древнерусских грамот победил в конкурсе «Студенческий стартап»

Автор разработки – магистрант Политехнического института, ассистент кафедры информационных технологи

Автор разработки – магистрант Политехнического института, ассистент кафедры информационных технологи

Фотография ©: предоставлена пресс-службой НовГУ имени Ярослава Мудрого

В Новгородском университете имени Ярослава Мудрого разработали систему искусственного интеллекта для автоматического распознавания и интерпретации текстов древнерусских грамот. Разработка вошла в число проектов-победителей грантового конкурса «Студенческий стартап» Фонда содействия инновациям. На её реализацию выделили 1 млн рублей.

Автор разработки – магистрант Политехнического института, ассистент кафедры информационных технологий и систем Иван Филиппов. Руководитель проекта – доцент кафедры физики твёрдого тела и микроэлектроники Ирина Телина, рассказали в пресс-службе вуза.

– Система показала высокую производительность: полный прогон одного изображения занимает 1-2 секунды, – рассказал Иван Филиппов. – Также она демонстрирует надёжность и устойчивость благодаря компактной архитектуре, плавной работе пользовательского интерфейса. Точность распознавания высокая – после всех доработок и корректировок она составляет 98%.

По его словам, задача распознавания букв достаточно тривиальна в области компьютерного зрения, однако специфика древнерусских символов вносит дополнительную сложность.

– Эксперты подтверждают необходимость поиска новых инструментов для работы с древнерусскими документами, – отметил автор проекта. – Только в Великом Новгороде уже найдено более 1200 берестяных грамот, и их количество продолжает расти с каждым годом. При этом процесс их расшифровки очень трудоёмкий и требует много времени. Многие символы могут иметь разные варианты прочтений, а разнообразие устаревших букв и наличие редких диакритических знаков усложняют классификацию по стандартным моделям.

Автоматических решений для таких задач на данный момент нет. Существующие аналоги либо недостаточно точны, либо нестабильны, либо требуют больших, размеченных вручную датасетов. Разработка Ивана Филиппова призвана стать новым быстрым инструментом для библиографилов, палеографов, архивистов.

Для обучения нейросети использовали датасет из пяти «эталонных» грамот, на которых буквы были размечены вручную. При отборе грамот было важно, чтобы они были целыми, крупными по объёму и содержали наибольшее разнообразие разборчиво написанных букв. Также в датасет вошли автоматические вырезки букв, сделанные детектором.

– С запуска детектора начинается процесс работы ИИ, – пояснил Иван Филиппов. – Детектор отвечает за обнаружение и объединение боксов вокруг букв. Боксы – это прямоугольники, заключающие в себе буквы. Так как модель не может принять полную грамоту и дать детальную расшифровку – необходимо давать ей буквы по отдельности, уже после собирая их в строки. Затем происходит сегментация, поиск контуров, объединение соседних боксов по дистанции и соотношение площадей. Далее для распознавания букв используется свёрточная сеть ResNet-18, адаптированная под вырезки 64х64 пикселя. Все полученные вырезки букв сохраняются в виде PNG-файлов, сгруппированных по классам. Экспорт данных реализован на языке программирования Python с использованием стандартных библиотек, что гарантирует лёгкую интеграцию и последующую аналитику.

На данный момент уже создано приложение, позволяющее быстро загружать фото, автоматически детектировать боксы, распознавать буквы и экспортировать результаты. Для удобства пользователя в нём используется интуитивный интерфейс Canvas. Он позволяет быстро и наглядно загружать любые изображения грамот, использовать функции зума и панорамы для точного выбора областей, автоматически или вручную выделять рамки вокруг букв, мгновенно редактировать, перемещать, удалять и отменять действия. Все действия выполняются мышью и горячими клавишами, а готовые инструменты Python обеспечивают простоту интеграции и отзывчивость даже на больших изображениях.

Система способна обучаться самостоятельно. В будущем этот процесс планируется полностью автоматизировать. Сейчас, по мере использования программы, датасет для обучения обогащается новыми качественными расшифровками.

Больше о новгородских берестяных грамотах можно узнать в спецпроекте «НВ» и лингвиста, академика РАН Алексея Гиппиуса «Напиши мне грамоту».

По словам разработчика, система уже сейчас готова к интеграции в архивные и научные проекты по изучению древнерусских грамот. То, что уже сделано, позволяет раскрыть такие функции, как датирование и установка авторства грамоты. Модель, обученная на грамотах, хорошо работает и с рукописями, что и является основной проблемой, к решению которой в итоге мы придём.

– Ведь у нас хранится множество рукописей, о которых, помимо самого текста, мало что известно, – отметил Иван Филиппов. – В любом случае, мы открыты к взаимодействию и готовы работать со всеми, кто может быть заинтересован в реализации проекта – например, с Центром археологических исследований НовГУ.

Теги: Великий Новгород, НовГУ, берестяные грамоты, ИИ, нейросеть, наука

РЕКЛАМА

Еще новости

Абитуриентам из Новгородской, Московской областей, Республики Татарстан, Санкт-Петербурга и Ленинградской области рассказали о возможности по окончании учёбы получить сразу четыре диплома.

Выпускники Гуманитарного института Новгородского университета могут получить сразу четыре диплома

Система построена на интеграции основного образования с программами дополнительного профессионального обучения, которые студенты начинают осваивать со второго курса

03.12.2025 | Образование

Участники хакатона создали актуальные и востребованные мини-приложения и чат-боты для мессенджера МАХ.

Студенты разработали более 50 полезных цифровых сервисов для мессенджера Мах

В первом студенческом хакатоне по разработке сервисов для национального мессенджера Mах приняли участие более 2,7 тысячи студентов из 286 вузов

01.12.2025 | Образование

Хакатон планируют проводить каждый семестр с новыми партнёрами и задачами.

Новгородцы стали победителями всероссийского хакатона «Грамотное решение v2.0»

Пять проектов студентов Новгородского университета были отмечены экспертами финала всероссийского хакатона «Грамотное решение v2.0»

01.12.2025 | Образование

Общая сумма федеральной поддержки на строительство кампуса составляет 6 млрд рублей.

На строительство кампуса в Великом Новгороде планируют направить 4 млрд рублей

В Великом Новгороде продолжается строительство университетского кампуса

29.11.2025 | Образование

За оригинальным забором находится бывший дом купца Якунина.

По ограде бывшего купеческого дома в Валдае можно изучать химию и историю

В Валдае собственник бывшего дома купца Якунина установил вокруг него ограждение в стилистике школьной доски

28.11.2025 | Образование

Андрей Ефременков рассказал о своём видении развития института.

Андрей Ефременков стал директором Гуманитарного института Новгородского университета

На должность директора Химико-технологического института на заседании Учёного совета Новгородского университета избрали Ульяну Медведеву

25.11.2025 | Образование

Свежий выпуск газеты «Новгородские Ведомости» от 03.12.2025 года

РЕКЛАМА