• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4

 

🧭 Как до нас добраться

 

Телефон: +7 (495) 772-95-90 доб. 22734

E-mail: ling@hse.ru

Руководство
Заместитель руководителя Ахапкина Яна Эмильевна

Редакторы сайта — Наталья Борисовна Пименова, Татьяна Борисовна Казакова, Максим Олегович Бажуков, Юлия Геннадьевна Бадрызлова

Книга
Proceedings of the 3rd Workshop on NLP Applications to Field Linguistics (Field Matters 2024)

Bangkok: Association for Computational Linguistics, 2024.

Глава в книге
String Similarity Measures for Evaluating the Lemmatisation in Old Church Slavonic

Afanasev I., Lyashevskaya O.

In bk.: Structuring Lexical Data and Digitising Dictionaries: Grammatical Theory, Language Processing and Databases in Historical Linguistics. Leiden; Boston: Brill, 2024. P. 13-35.

Препринт
Exploring the Effectiveness of Methods for Persona Extraction
В печати

Konstantin Zaitsev.

arxiv.org. Computer Science. Cornell University, 2024

Опубликован корпус нанайских текстов

В Лаборатории языковой конвергенции завершена работа по созданию нового ресурса: корпуса нанайского языка, включающего материалы на разных диалектах.

Опубликован корпус нанайских текстов

Корпус объединяет исторические записи из сборника В. А. Аврорина «Материалы по нанайскому языку и фольклору» (1941, 1948 гг.), представляющие горинский и найхинский говоры, а также современные полевые материалы, собранные С. А. Оскольской, Н. М. Стойновой и К. А. Шагал (Крапивиной) в различных селах Хабаровского края. Для современных текстов доступны аудиозаписи.

В создании корпуса участвовали Г. И. Бельды и Е. А. Дмитриева, выполнившие расшифровку текстов, а глоссирование всех материалов выполнено С. А. Оскольской.

На данный момент объем корпуса составляет около 7000 токенов, в дальнейшем планируется его пополнение.