• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4

 

🧭 Как до нас добраться

 

Телефон: +7 (495) 772-95-90 доб. 22734

E-mail: ling@hse.ru

Руководство
Заместитель руководителя Ахапкина Яна Эмильевна

Редакторы сайта — Наталья Борисовна Пименова, Татьяна Борисовна Казакова, Максим Олегович Бажуков, Юлия Геннадьевна Бадрызлова

Книга
Proceedings of the 3rd Workshop on NLP Applications to Field Linguistics (Field Matters 2024)

Bangkok: Association for Computational Linguistics, 2024.

Глава в книге
Building a Database of Conversational Routines

Bychkova P., Яскевич А. А., Гюласарян С. М. et al.

In bk.: Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024). ELRA and ICCL, 2024. P. 2548-2555.

Препринт
Exploring the Effectiveness of Methods for Persona Extraction
В печати

Konstantin Zaitsev.

arxiv.org. Computer Science. Cornell University, 2024

Появился калькулятор семантической близости для башкирского языка

Доцент школы лингвистики Б.В. Орехов запустил новый лингвистический веб-сервис: "Калькулятор семантической близости для башкирского языка", во многом аналогичный RusVectores, который сделали сотрудник и студент Вышки Андрей Кутузов и Елизавета Кузьменко.

Как и RusVectores для русского, "Калькулятор семантической близости" умеет находить наиболее близкие по своему контексту слова (квази-синонимы или ассоциаты) в башкирском языке, основываясь на векторных моделях, которые были построены на башкирских текстах объёмом 21 млн. словоупотреблений. Все слова предварительно лемматизированы с помощью программы bashmorph, также созданной Б.В. Ореховым.