2024 год отмечен огромным вкладом в разгадку одной из величайших загадок археологии: раскрыто содержание греческого текста внутри обугленного свитка, захороненного 2000 лет назад в результате извержения Везувия. Об истории открытия и о том, где нужно учиться, чтобы стать специалистом, способным решать такие загадки, читайте в нашем материале.

Vesuvius Challenge
Международная команда специалистов по искусcтвенному интеллекту сумела прочитать фрагмент полностью обугленного свитка. Свиток был обнаружен еще в XVIII веке при раскопках в Геркулануме на вилле, сгоревшей при извержении Везувия в 79 году. Раскрыть его невозможно, но ученым удалось прочесть сканы, полученные с помощью компьютерной томографии.
Весной 2023 года стартовал конкурс Vesuvius Challenge по расшифровке папирусов. К тому моменту ученые во главе с профессором Брентом Силсом из Университета Кентукки (США) показали, что алгоритм машинного обучения может извлекать буквы и символы из рентгеновских снимков свитков. Исследователи описали свой алгоритм и предоставили участникам конкурса
Vesuvius Challenge материал: тысячи трехмерных рентгеновских изображений двух неразвернутых папирусов и трех фрагментов.
Победителем одного из промежуточных этапов конкурса стал 28-летний IT-специалист в области искусственного интеллекта Антон Репушко (родом из Тулы, сейчвс живет в Берлине), создавший специальные «маски» для обнаружения чернил в свитках. В исследовании ему помогали гуманитарии. Антон нашел себе учителя греческого языка из Петербурга, а искать греческие буквы в полученных изображениях ему помогал друг, окончивший истфак СПбГУ и изучавший язык в классической петербургской гимназии.
Команда студентов (из Египта, Швейцарии и США) —
победителей следующего этапа конкурса — обучила модель ИИ на сканах свернутого папируса. В итоге удалось прочитать ранее неизвестную философскую работу эпикурейской школы, в которой обсуждаются чувства и удовольствие (в прочитанном тексте речь идет об источниках удовольствия, включая музыку, вкус каперсов и багряный цвет).
Полученный результат открывает путь к использованию методов ИИ для полной расшифровки других свитков. По мнению исследователей, он может иметь революционные последствия для нашего понимания древнего мира. Главная библиотека виллы Геркуланума так и не была найдена, а под землей все еще могут находиться тысячи свитков. Методы машинного обучения, впервые предложенные учеными, теперь могут быть использованы для изучения других типов скрытого текста, таких как картонаж — переработанные папирусы.
Подробнее о технологии проведенных исследований читайте в
обзорах прессы и на сайте проекта
Vesuvius Challenge.Выбрать направления обучения, на которых готовят специалистов, способных решать подобные загадки, помогут в Школе лингвистики. Кроме бакалавриата, где с третьего курса можно выбрать трек «Компьютерная лингвистика», здесь действуют магистерские программы «Компьютерная лингвистика» и «Цифровые методы в гуманитарных науках».