• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4

 

🧭 Как до нас добраться

 

Телефон: +7 (495) 772-95-90 доб. 22734

E-mail: ling@hse.ru

Руководство
Заместитель руководителя Ахапкина Яна Эмильевна
Глава в книге
‘No way!’ Discourse formulae of disagreement in Russian and Eng-lish: a comparative study.
В печати

Kozyuk E., Badryzlova Y.

In bk.: Computational Linguistics and Intellectual Technologies: Papers from the Annual International Conference “Dialogue” (2021). Iss. 20. 2021.

Препринт
Effort versus performance tradeoff in lemmatisation for Uralic languages

Tyers F. M., Bibaeva M.

Proceedings of the Sixth International Workshop on Computational Linguistics of Uralic Languages. 2020.iwclul-1.2. Association for Computational Linguistics, 2020

Состоялся 5-й Колмогоровский семинар по компьютерной лингвистике и наукам о языке

26 апреля состоялся Колмогоровский семинар по компьютерной лингвистике и наукам о языке, организуемый совместно Департаментом анализа данных и искуcственного интеллекта, МНУЛ Интеллектуальных систем и структурного анализа и Школой лингвистики. В этом году семинар прошёл в онлайн-формате.

Состоялся 5-й Колмогоровский семинар по компьютерной лингвистике и наукам о языке

С 2016 года на Колмогоровском семинаре по компьютерной лингвистике ежегодно встречаются, делают доклады и обмениваются опытом студенты и сотрудники как ВШЭ, так и других университетов, а также ведущие специалисты-практики в области компьютерной лингвистики. В этом году приглашёнными докладчиками были Валентин Малых (Huawei) и Борис Галицкий (НИУ ВШЭ, Oracle Inc.).

Валентин Малых рассказал об основных направлениях исследований лаборатории Noah's Ark компании Huawei. Участники семинара узнали, чем занимается лаборатория и в каких людях она заинтересована. А после Валентин представил проект “SumTitles: a Summarization Dataset with Low Extractiveness”. Идея заключается в том, чтобы автоматически создавать саммари обсуждений в чатах или комментариях — это позволит быстро получить самую важную информацию, не вникая в каждое из множества сообщений.

Борис Галицкий, работник Oracle и ассоциированный сотрудник Международной лаборатории интеллектуальных систем и структурного анализа, выступил с докладом “Discourse Trees for Dialogue Management”. Он рассказал о принципе работы “persistent chat-bot”, помогающего пользователю в форме диалога последовательно изучать ту или иную информацию сколь угодно долго и подробно до тех пор, пока у него совсем не останется вопросов. Главное преимущество бота состоит в том, что развитие диалога основывается не на семантике слов, а на структуре автоматически создаваемого дискурсивного дерева, по которому “продвигается” общение.

В семинаре также приняли участие два аспиранта Школы лингвистики. Иван Смирнов рассказал о системе автоматического исправления словообразовательных ошибок в текстах студентов, изучающих русский как иностранный, а Амир Бакаров представил доклад "Лингвистическая репрезентативность эмбеддингов слов". 

В других докладах поднимались темы методов компьютерной обработки так называемых “low-resource languages”, исследования лингвистических моделей, методов классификации текстовых материалов, и много других увлекательных и пока не изведанных тем.

Записи всех докладов и презентации скоро будут доступны на странице семинара.