• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4

 

🧭 Как до нас добраться

 

Телефон: +7 (495) 772-95-90 доб. 22734

E-mail: ling@hse.ru

Руководство
Заместитель руководителя Ахапкина Яна Эмильевна

Редакторы сайта — Наталья Борисовна Пименова, Татьяна Брисовна Казакова, Максим Олегович Бажуков, Юлия Геннадьевна Бадрызлова

Книга
Митрополиты, мудрецы, переводчики в cредневековой Европе

Белов Н. В., Бойцов М. А., Виноградов А. Ю. и др.

М.: Издательский дом НИУ ВШЭ, 2024.

Глава в книге
Тест на распознавание книжных заголовков для младших школьников: пилотное исследование

Урывская Д. А., Староверова В. Н., Лопухина А. А. и др.

В кн.: Наука и образование: проблемы и перспективы [Электронный ресурс]: Материалы XXVI Международной научно-практической конференции молодых ученых и студентов, посвящённой 85-летию АГГПУ им. В. М. Шукшина (Бийск, 5 апреля 2024 г.). Бийск: АГГПУ им. В.М. Шукшина, 2024. С. 240-244.

Препринт
Grammar in Language Models: BERT Study

Chistyakova K., Kazakova Tatiana.

Linguistics. WP BRP. НИУ ВШЭ, 2023. No. 115.

Состоялся 5-й Колмогоровский семинар по компьютерной лингвистике и наукам о языке

26 апреля состоялся Колмогоровский семинар по компьютерной лингвистике и наукам о языке, организуемый совместно Департаментом анализа данных и искуcственного интеллекта, МНУЛ Интеллектуальных систем и структурного анализа и Школой лингвистики. В этом году семинар прошёл в онлайн-формате.

Состоялся 5-й Колмогоровский семинар по компьютерной лингвистике и наукам о языке

С 2016 года на Колмогоровском семинаре по компьютерной лингвистике ежегодно встречаются, делают доклады и обмениваются опытом студенты и сотрудники как ВШЭ, так и других университетов, а также ведущие специалисты-практики в области компьютерной лингвистики. В этом году приглашёнными докладчиками были Валентин Малых (Huawei) и Борис Галицкий (НИУ ВШЭ, Oracle Inc.).

Валентин Малых рассказал об основных направлениях исследований лаборатории Noah's Ark компании Huawei. Участники семинара узнали, чем занимается лаборатория и в каких людях она заинтересована. А после Валентин представил проект “SumTitles: a Summarization Dataset with Low Extractiveness”. Идея заключается в том, чтобы автоматически создавать саммари обсуждений в чатах или комментариях — это позволит быстро получить самую важную информацию, не вникая в каждое из множества сообщений.

Борис Галицкий, работник Oracle и ассоциированный сотрудник Международной лаборатории интеллектуальных систем и структурного анализа, выступил с докладом “Discourse Trees for Dialogue Management”. Он рассказал о принципе работы “persistent chat-bot”, помогающего пользователю в форме диалога последовательно изучать ту или иную информацию сколь угодно долго и подробно до тех пор, пока у него совсем не останется вопросов. Главное преимущество бота состоит в том, что развитие диалога основывается не на семантике слов, а на структуре автоматически создаваемого дискурсивного дерева, по которому “продвигается” общение.

В семинаре также приняли участие два аспиранта Школы лингвистики. Иван Смирнов рассказал о системе автоматического исправления словообразовательных ошибок в текстах студентов, изучающих русский как иностранный, а Амир Бакаров представил доклад "Лингвистическая репрезентативность эмбеддингов слов". 

В других докладах поднимались темы методов компьютерной обработки так называемых “low-resource languages”, исследования лингвистических моделей, методов классификации текстовых материалов, и много других увлекательных и пока не изведанных тем.

Записи всех докладов и презентации скоро будут доступны на странице семинара.