• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4

 

🧭 Как до нас добраться

 

Телефон: +7 (495) 772-95-90 доб. 22734

E-mail: ling@hse.ru

Руководство
Заместитель руководителя Ахапкина Яна Эмильевна

Редакторы сайта — Наталья Борисовна Пименова, Татьяна Борисовна Казакова, Максим Олегович Бажуков, Юлия Геннадьевна Бадрызлова

Книга
Митрополиты, мудрецы, переводчики в cредневековой Европе

Белов Н. В., Бойцов М. А., Виноградов А. Ю. и др.

М.: Издательский дом НИУ ВШЭ, 2024.

Статья
Building an Open Corpus and a Morphological Parser for Corpus Annotation for Standard Dargwa

Svetlana Iu. Toldova, Elena O. Sokur.

Journal of Siberian Federal University. Series: Humanities & Social Sciences. 2024. Vol. 17. No. 5. P. 905-915.

Глава в книге
SmurfCat at PAN 2024 TextDetox: Alignment of Multilingual Transformers for Text Detoxification

Rykov E., Zaytsev K., Anisimov I. et al.

In bk.: CLEF 2024 Working Notes. CEUR Workshop Proceedings, 2024. P. 2866-2871.

Препринт
Exploring the Effectiveness of Methods for Persona Extraction
В печати

Konstantin Zaitsev.

arxiv.org. Computer Science. Cornell University, 2024

Появился калькулятор семантической близости для башкирского языка

Доцент школы лингвистики Б.В. Орехов запустил новый лингвистический веб-сервис: "Калькулятор семантической близости для башкирского языка", во многом аналогичный RusVectores, который сделали сотрудник и студент Вышки Андрей Кутузов и Елизавета Кузьменко.

Как и RusVectores для русского, "Калькулятор семантической близости" умеет находить наиболее близкие по своему контексту слова (квази-синонимы или ассоциаты) в башкирском языке, основываясь на векторных моделях, которые были построены на башкирских текстах объёмом 21 млн. словоупотреблений. Все слова предварительно лемматизированы с помощью программы bashmorph, также созданной Б.В. Ореховым.