Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.
Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4
Телефон: +7 (495) 772-95-90 доб. 22734
E-mail: ling@hse.ru
Редакторы сайта — Наталья Борисовна Пименова, Татьяна Борисовна Казакова, Максим Олегович Бажуков, Юлия Геннадьевна Бадрызлова
Школа лингвистики была образована в декабре 2014 года. Сотрудники школы преподают на образовательных программах по теоретической и компьютерной лингвистике в бакалавриате и магистратуре. Лингвистика, которой занимаются в школе, — это не только знание иностранных языков, но прежде всего наука о языке и о способах его моделирования. Научные группы школы занимаются исследованиями в области типологии, социолингвистики и ареальной лингвистики, корпусной лингвистики и лексикографии, древних языков и истории языка. Кроме того, в школе создаются лингвистические технологии и ресурсы: корпуса, обучающие тренажеры, словари и тезаурусы, технологии для электронного представления текстов культурного наследия.
Bangkok: Association for Computational Linguistics, 2024.
Вопросы языкознания. 2025.
Pozdnyakov V., Makarov I., Maksim Kazadaev.
In bk.: Proceedings of the IEEE/IAFE Computational Intelligence for Financial Engineering (CIFEr-24). IEEE, 2024. P. 1-7.
arxiv.org. Computer Science. Cornell University, 2024
Преподаватели центра РКИ активно используют инструменты компьютерной лингвистики для работы с иностранными студентами, осваивающими русский. Один из таких инструментов — скетч-грамматики, представляющие собой некоторую выжимку корпусной статистики о сочетаемости слова.
Возможность работать с типичными коллокациями, существующими в современном языке, крайне важна для обучения, и для их получения используется RuSkELL — онлайн-ресурс для изучения русского языка, основанный на корпусе ruTenTen11 и адаптированный для использования непрофессиональным пользователем, незнакомым с корпусной лингвистикой и не имеющим лингвистического образования. RuSkELL был разработан сотрудниками школы лингвистики факультета гуманитарных наук НИУ ВШЭ в сотрудничестве с Масариковым университетом в Брно и факультетом компьютерных наук НИУ ВШЭ. Общее руководство разработкой осуществляла профессор школы лингвистики Валентина Апресян.
Для изучающих русский как иностранный некоторые особенности скетч-грамматик чрезвычайно полезны — например, в отличии от подхода «мешка слов» скетчи основываются на грамматических отношениях, что позволяет задать тип связи в словосочетании, и посмотреть, например, какими существительными может управлять глагол «играть». К тому же ruTenTen11 не ограничивается русской классической литературой и включает язык интернета, что позволяет изучать не только стандартные коллокации, но и сленг.
В рамках проекта уже реализованы выдачи коллокатов для существительных, глаголов, прилагательных и наречий; не так давно были существенно расширены выдачи числительных (в том числе, разделены группы количественных числительных, управляющих существительными в творительном либо родительном падеже), продолжается разработка предлогов. Уже сейчас на основе RuSkELL для мотивированных студентов с высоким уровнем языка преподаватели центра создают упражнения на распознавание близких синонимов (большой опыт/город/интерес; крупный скот/центр/бизнес) и вывод разницы значений из сочетаемости (шарик — воздушный, разноцветный, сырный, пластмассовый; шар — бильярдный, зеркальный, магический).
Однако достоинства RuSkELL не заканчиваются на пользе в преподавании РКИ. Наличие в выдаче идиом, полуидиоматических сочетаний и даже фразеологизмов, новых употреблений позволяет использовать его как исследовательский инструмент. В своем выступлении Ольга Культепина рассказала об изменениях в сочетаемости слова, которые не встречаются в выдаче НКРЯ. К примеру, возможна «смена оценки» (агрессивная реклама — агрессивная езда), «расширение сочетаемости» (нотка цитрусовых), возникновение новых идиом и фразеологизмов (лебединая верность), а также заметна разница сочетаемости однокоренных (стол – столик).