• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4

 

🧭 Как до нас добраться

 

Телефон: +7 (495) 772-95-90 доб. 22734

E-mail: ling@hse.ru

Руководство
Заместитель руководителя Ахапкина Яна Эмильевна

Редакторы сайта — Наталья Борисовна Пименова, Татьяна Борисовна Казакова, Максим Олегович Бажуков, Юлия Геннадьевна Бадрызлова

Статья
Морфологический гессер как инструмент анализа полевых данных: опыт работы с науканским языком
В печати

Будянская Е. М., Бузанов А. О., Жорник Д. О. и др.

Томский журнал лингвистических и антропологических исследований. 2025. № 2 (48).

Глава в книге
Cases of morphosyntactic affinity in North-Eastern Siberia: borrowing, substrata, social settings' influence... or chance?
В печати

Kazakova T., Vinyar A., Бакланов А. Е. et al.

In bk.: Первый Евразийский конгресс лингвистов. Москва, 9–13 декабря 2024: Тезисы докладов. M.: 2025.

Препринт
Exploring the Effectiveness of Methods for Persona Extraction
В печати

Konstantin Zaitsev.

arxiv.org. Computer Science. Cornell University, 2024

Рукописи не сгорели

2024 год отмечен огромным вкладом в разгадку одной из величайших загадок археологии: раскрыто содержание греческого текста внутри обугленного свитка, захороненного 2000 лет назад в результате извержения Везувия. Об истории открытия и о том, где нужно учиться, чтобы стать специалистом, способным решать такие загадки, читайте в нашем материале.

Vesuvius Challenge

Vesuvius Challenge
Международная команда специалистов по искусcтвенному интеллекту сумела прочитать фрагмент полностью обугленного свитка. Свиток был обнаружен еще в XVIII веке при раскопках в Геркулануме на вилле, сгоревшей при извержении Везувия в 79 году. Раскрыть его невозможно, но ученым удалось прочесть сканы, полученные с помощью компьютерной томографии.

Весной 2023 года стартовал конкурс Vesuvius Challenge по расшифровке папирусов. К тому моменту ученые во главе с профессором Брентом Силсом из Университета Кентукки (США) показали, что алгоритм машинного обучения может извлекать буквы и символы из рентгеновских снимков свитков. Исследователи описали свой алгоритм и предоставили участникам конкурса Vesuvius Challenge материал: тысячи трехмерных рентгеновских изображений двух неразвернутых папирусов и трех фрагментов. Победителем одного из промежуточных этапов конкурса стал 28-летний IT-специалист в области искусственного интеллекта Антон Репушко (родом из Тулы, сейчвс живет в Берлине), создавший специальные «маски» для обнаружения чернил в свитках. В исследовании ему помогали гуманитарии. Антон нашел себе учителя греческого языка из Петербурга, а искать греческие буквы в полученных изображениях ему помогал друг, окончивший истфак СПбГУ и изучавший язык в классической петербургской гимназии.

Команда студентов (из 
Египта, Швейцарии и США) — победителей следующего этапа конкурса  — обучила модель ИИ на сканах свернутого папируса. В итоге удалось прочитать ранее неизвестную философскую работу эпикурейской школы, в которой обсуждаются чувства и удовольствие (в прочитанном тексте речь идет об источниках удовольствия, включая музыку, вкус каперсов и багряный цвет). 

Полученный результат открывает путь к использованию методов ИИ для полной расшифровки других свитков. По мнению исследователей, он может иметь революционные последствия для нашего понимания древнего мира. Главная библиотека виллы Геркуланума так и не была найдена, а под землей все еще могут находиться тысячи свитков. Методы машинного обучения, впервые предложенные учеными, теперь могут быть использованы для изучения других типов скрытого текста, таких как картонаж — переработанные папирусы.

Подробнее о технологии проведенных исследований читайте в обзорах прессы и на сайте проекта Vesuvius Challenge.

Выбрать направления обучения, на которых готовят специалистов, способных решать подобные загадки, помогут в Школе лингвистики. Кроме бакалавриата,  где с третьего курса можно выбрать трек «Компьютерная лингвистика»,  здесь действуют магистерские программы «Компьютерная лингвистика» и «Цифровые методы в гуманитарных науках».