• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4

 

🧭 Как до нас добраться

 

Телефон: +7 (495) 772-95-90 доб. 22734

E-mail: ling@hse.ru

Руководство
Заместитель руководителя Ахапкина Яна Эмильевна

Редакторы сайта — Наталья Борисовна Пименова, Татьяна Борисовна Казакова, Максим Олегович Бажуков, Юлия Геннадьевна Бадрызлова

Книга
Proceedings of the 3rd Workshop on NLP Applications to Field Linguistics (Field Matters 2024)

Bangkok: Association for Computational Linguistics, 2024.

Статья
Проект словаря новоарамейских глаголов

Шведова Е. Е.

Вопросы лексикографии. 2024. № 34. С. 42-61.

Глава в книге
String Similarity Measures for Evaluating the Lemmatisation in Old Church Slavonic

Afanasev I., Lyashevskaya O.

In bk.: Structuring Lexical Data and Digitising Dictionaries: Grammatical Theory, Language Processing and Databases in Historical Linguistics. Leiden; Boston: Brill, 2024. P. 13-35.

Препринт
Exploring the Effectiveness of Methods for Persona Extraction
В печати

Konstantin Zaitsev.

arxiv.org. Computer Science. Cornell University, 2024

Рукописи не сгорели

2024 год отмечен огромным вкладом в разгадку одной из величайших загадок археологии: раскрыто содержание греческого текста внутри обугленного свитка, захороненного 2000 лет назад в результате извержения Везувия. Об истории открытия и о том, где нужно учиться, чтобы стать специалистом, способным решать такие загадки, читайте в нашем материале.

Vesuvius Challenge

Vesuvius Challenge
Международная команда специалистов по искусcтвенному интеллекту сумела прочитать фрагмент полностью обугленного свитка. Свиток был обнаружен еще в XVIII веке при раскопках в Геркулануме на вилле, сгоревшей при извержении Везувия в 79 году. Раскрыть его невозможно, но ученым удалось прочесть сканы, полученные с помощью компьютерной томографии.

Весной 2023 года стартовал конкурс Vesuvius Challenge по расшифровке папирусов. К тому моменту ученые во главе с профессором Брентом Силсом из Университета Кентукки (США) показали, что алгоритм машинного обучения может извлекать буквы и символы из рентгеновских снимков свитков. Исследователи описали свой алгоритм и предоставили участникам конкурса Vesuvius Challenge материал: тысячи трехмерных рентгеновских изображений двух неразвернутых папирусов и трех фрагментов. Победителем одного из промежуточных этапов конкурса стал 28-летний IT-специалист в области искусственного интеллекта Антон Репушко (родом из Тулы, сейчвс живет в Берлине), создавший специальные «маски» для обнаружения чернил в свитках. В исследовании ему помогали гуманитарии. Антон нашел себе учителя греческого языка из Петербурга, а искать греческие буквы в полученных изображениях ему помогал друг, окончивший истфак СПбГУ и изучавший язык в классической петербургской гимназии.

Команда студентов (из 
Египта, Швейцарии и США) — победителей следующего этапа конкурса  — обучила модель ИИ на сканах свернутого папируса. В итоге удалось прочитать ранее неизвестную философскую работу эпикурейской школы, в которой обсуждаются чувства и удовольствие (в прочитанном тексте речь идет об источниках удовольствия, включая музыку, вкус каперсов и багряный цвет). 

Полученный результат открывает путь к использованию методов ИИ для полной расшифровки других свитков. По мнению исследователей, он может иметь революционные последствия для нашего понимания древнего мира. Главная библиотека виллы Геркуланума так и не была найдена, а под землей все еще могут находиться тысячи свитков. Методы машинного обучения, впервые предложенные учеными, теперь могут быть использованы для изучения других типов скрытого текста, таких как картонаж — переработанные папирусы.

Подробнее о технологии проведенных исследований читайте в обзорах прессы и на сайте проекта Vesuvius Challenge.

Выбрать направления обучения, на которых готовят специалистов, способных решать подобные загадки, помогут в Школе лингвистики. Кроме бакалавриата,  где с третьего курса можно выбрать трек «Компьютерная лингвистика»,  здесь действуют магистерские программы «Компьютерная лингвистика» и «Цифровые методы в гуманитарных науках».