• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4

 

🧭 Как до нас добраться

 

Телефон: +7 (495) 772-95-90 доб. 22734

E-mail: ling@hse.ru

Руководство
Заместитель руководителя Ахапкина Яна Эмильевна

Редакторы сайта — Наталья Борисовна Пименова, Татьяна Борисовна Казакова, Максим Олегович Бажуков, Юлия Геннадьевна Бадрызлова

Книга
Proceedings of the 3rd Workshop on NLP Applications to Field Linguistics (Field Matters 2024)

Bangkok: Association for Computational Linguistics, 2024.

Глава в книге
String Similarity Measures for Evaluating the Lemmatisation in Old Church Slavonic

Afanasev I., Lyashevskaya O.

In bk.: Structuring Lexical Data and Digitising Dictionaries: Grammatical Theory, Language Processing and Databases in Historical Linguistics. Leiden; Boston: Brill, 2024. P. 13-35.

Препринт
Exploring the Effectiveness of Methods for Persona Extraction
В печати

Konstantin Zaitsev.

arxiv.org. Computer Science. Cornell University, 2024

Появился калькулятор семантической близости для башкирского языка

Доцент школы лингвистики Б.В. Орехов запустил новый лингвистический веб-сервис: "Калькулятор семантической близости для башкирского языка", во многом аналогичный RusVectores, который сделали сотрудник и студент Вышки Андрей Кутузов и Елизавета Кузьменко.

Как и RusVectores для русского, "Калькулятор семантической близости" умеет находить наиболее близкие по своему контексту слова (квази-синонимы или ассоциаты) в башкирском языке, основываясь на векторных моделях, которые были построены на башкирских текстах объёмом 21 млн. словоупотреблений. Все слова предварительно лемматизированы с помощью программы bashmorph, также созданной Б.В. Ореховым.