• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4

 

🧭 Как до нас добраться

 

Телефон: +7 (495) 772-95-90 доб. 22734

E-mail: ling@hse.ru

Руководство
Заместитель руководителя Ахапкина Яна Эмильевна

Редакторы сайта — Наталья Борисовна Пименова, Татьяна Брисовна Казакова, Максим Олегович Бажуков, Юлия Геннадьевна Бадрызлова

Глава в книге
Тест на распознавание книжных заголовков для младших школьников: пилотное исследование

Урывская Д. А., Староверова В. Н., Лопухина А. А. и др.

В кн.: Наука и образование: проблемы и перспективы [Электронный ресурс]: Материалы XXVI Международной научно-практической конференции молодых ученых и студентов, посвящённой 85-летию АГГПУ им. В. М. Шукшина (Бийск, 5 апреля 2024 г.). Бийск: АГГПУ им. В.М. Шукшина, 2024. С. 240-244.

Препринт
Grammar in Language Models: BERT Study

Chistyakova K., Kazakova Tatiana.

Linguistics. WP BRP. НИУ ВШЭ, 2023. No. 115.

Воздушные шарики, хрустальные шары: возможности RuSkELL для изучающих русский

Новый сезон семинаров школы лингвистики открыла Ольга Культепина с докладом «Коллокационные характеристики слова в выдаче RuSkELL». Онлайн-ресурс RuSkELL был разработан под руководством сотрудников школы лингвистики для помощи иностранцам, изучающим русский язык.

Преподаватели центра РКИ активно используют инструменты компьютерной лингвистики для работы с иностранными студентами, осваивающими русский. Один из таких инструментов — скетч-грамматики, представляющие собой некоторую выжимку корпусной статистики о сочетаемости слова.

Возможность работать с типичными коллокациями, существующими в современном языке, крайне важна для обучения, и для их получения используется RuSkELL — онлайн-ресурс для изучения русского языка, основанный на корпусе ruTenTen11 и адаптированный для использования непрофессиональным пользователем, незнакомым с корпусной лингвистикой и не имеющим лингвистического образования. RuSkELL был разработан сотрудниками школы лингвистики факультета гуманитарных наук НИУ ВШЭ в сотрудничестве с Масариковым университетом в Брно и факультетом компьютерных наук НИУ ВШЭ. Общее руководство разработкой осуществляла профессор школы лингвистики Валентина Апресян.

Для изучающих русский как иностранный некоторые особенности скетч-грамматик чрезвычайно полезны — например, в отличии от подхода «мешка слов» скетчи основываются на грамматических отношениях, что позволяет задать тип связи в словосочетании, и посмотреть, например, какими существительными может управлять глагол «играть». К тому же ruTenTen11 не ограничивается русской классической литературой и включает язык интернета, что позволяет изучать не только стандартные коллокации, но и сленг.

В рамках проекта уже реализованы выдачи коллокатов для существительных, глаголов, прилагательных и наречий; не так давно были существенно расширены выдачи числительных (в том числе, разделены группы количественных числительных, управляющих существительными в творительном либо родительном падеже), продолжается разработка предлогов. Уже сейчас на основе RuSkELL для мотивированных студентов с высоким уровнем языка преподаватели центра создают упражнения на распознавание близких синонимов (большой опыт/город/интерес; крупный скот/центр/бизнес) и вывод разницы значений из сочетаемости (шарик —  воздушный, разноцветный, сырный, пластмассовый; шар  — бильярдный, зеркальный, магический).

Однако достоинства RuSkELL не заканчиваются на пользе в преподавании РКИ. Наличие в выдаче идиом, полуидиоматических сочетаний и даже фразеологизмов, новых употреблений позволяет использовать его как исследовательский инструмент. В своем выступлении Ольга Культепина рассказала об изменениях в сочетаемости слова, которые не встречаются в выдаче НКРЯ. К примеру, возможна «смена оценки» (агрессивная рекламаагрессивная езда), «расширение сочетаемости» (нотка цитрусовых), возникновение новых идиом и фразеологизмов (лебединая верность), а также заметна разница сочетаемости однокоренных (столстолик).