Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.
Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4
Телефон: +7 (495) 772-95-90 доб. 22734
E-mail: ling@hse.ru
Редакторы сайта — Наталья Борисовна Пименова, Татьяна Борисовна Казакова, Максим Олегович Бажуков, Юлия Геннадьевна Бадрызлова
Школа лингвистики была образована в декабре 2014 года. Сотрудники школы преподают на образовательных программах по теоретической и компьютерной лингвистике в бакалавриате и магистратуре. Лингвистика, которой занимаются в школе, — это не только знание иностранных языков, но прежде всего наука о языке и о способах его моделирования. Научные группы школы занимаются исследованиями в области типологии, социолингвистики и ареальной лингвистики, корпусной лингвистики и лексикографии, древних языков и истории языка. Кроме того, в школе создаются лингвистические технологии и ресурсы: корпуса, обучающие тренажеры, словари и тезаурусы, технологии для электронного представления текстов культурного наследия.
Bangkok: Association for Computational Linguistics, 2024.
Вопросы языкознания. 2025.
Pozdnyakov V., Makarov I., Maksim Kazadaev.
In bk.: Proceedings of the IEEE/IAFE Computational Intelligence for Financial Engineering (CIFEr-24). IEEE, 2024. P. 1-7.
arxiv.org. Computer Science. Cornell University, 2024
«Она прикольная!» — говорит семилетняя Вика Каверина про олимпиаду «Что может корпус». Школа лингвистики вместе с сайтом «Верные слова» второй раз предлагают детям 7 – 16 лет разобраться в НКРЯ и провести собственные лингвистические исследования на корпусном материале. Теперь студентки «Фундаментальной и прикладной лингвистики» побеседовали с победителями и их родителями.
Анастасия, до олимпиады вы пользовались НКРЯ?
Да. Но никогда не думала, что к корпусу можно приобщить ребенка. Было интересно: это вообще возможно? Получилось, и мы прямо довольны!
Вы делали задания вместе?
Да, я помогала. Например, в задании, где нужно было найти слова, которые оканчиваются на *ужка, Вика не знала, как ввести запрос в корпусе. Задание про хобот ей очень понравилось, потому что там тексты сказочные были. И она сразу поняла, что идти «хоботом» значит ‘следом’, ‘хвостом’. С заданием про суп и борщ Вика тоже долго сидела сама, читала примеры.
Вика, какое задание запомнилось?
Самое первое, где надо было перетаскивать ответы про еду.
Евгения, вы раньше работали с лингвистическим корпусом?
Нет. Но теперь думаю, что он поможет нам в обучении. Мы живём в Украине, и преподавание русского языка здесь сейчас происходит на достаточно слабом уровне, а так как мы преимущественно разговариваем на русском в нашей семье, то ребенку необходимы занятия. Из ресурсов для начальной школы нам кажутся достойными внимания «Верные слова». Работа в НКРЯ – еще один вариант урока.
Влад, какое задание было самым интересным?
Про то, что борщ – это не суп!
Что тебе больше всего понравилось в олимпиаде?
Мне понравились те задания, в которых нужно было работать с графиками. Я люблю узнавать про историю слов, как они раньше употреблялись.
Как ты думаешь, для чего нужен электронный корпус русского языка?
Если вы не знаете о каком-то слове, что оно значит и значило, можно посмотреть в корпусе и все узнать. Я иногда так делаю.
Как ты научилась работать в НКРЯ?
В прошлом году прошла курс на «Верных словах». В этом году еще раз его посмотрела, чтобы вспомнить инструкции.
Ты второй год побеждаешь в олимпиаде. Чем она тебе нравится?
Нравится, что не обязательно делать все задания за раз. Можно отложить, подумать и еще раз вернуться. Что есть курс по работе с корпусом: если что-то забыла, можно в него заглянуть. Нравится искать в корпусе – в нем много информации.
Какой, например?
Самое интересное – это происхождение слов. В корпусе видно, когда, как слова начали употребляться – я смотрела по графикам.
Откуда ты узнала об олимпиаде?
Прочитала в группе «Младолингвисты» Вконтакте. Я вообще оттуда очень много узнаю связанного с лингвистикой.
То есть ты интересуешься лингвистикой?
Да, и даже очень. Заинтересовалась примерно год назад: порешала задачки с Турнира Ломоносова и они мне очень понравились. Стала ещё решать задачи, например, из Традиционной олимпиады по лингвистике. Мне больше всего интересно строение языков: книга Плунгяна «Почему языки такие разные» совсем меня заворожила, там всё так здорово и понятно объясняется!
И про НКРЯ ты раньше знала?
Про корпус узнала первый раз на сайте «Верные слова». Поучилась в нем работать. Мне очень понравилось, я даже собираюсь использовать НКРЯ в проекте на будущий год. Корпус дает очень много возможностей. Было бы здорово, если бы его изучали в школе отдельной темой!
А в олимпиаде что понравилось?
Задания очень интересные, хотелось докопаться до ответа и узнать правду. Но больше всего помог сам формат олимпиады: очень понравилось, что можно было несколько дней подумать и потом вернуться к решению. Я, например, много раз возвращалась к четвертому заданию, и очень обрадовалась, когда наконец нашла, что сочетание «проблема с» стало употребляться не так давно. И еще очень понравилось работать с биграммами и с графиками. А вот то, что «хоботом» раньше называли хвост, очень меня удивило, это стало самым неожиданным.
Ты решила почти всё. Сложно было?
Не очень. Не нужно было решать на время и нервничать, это плюс. И очень хорошо, что можно пробовать различные способы поиска: так не получилось — тогда придумывай по-другому.
Собираешься участвовать на будущий год?
Да, конечно. Вы знаете, я когда читала ответы, то в них иногда находила лучшие способы поиска, будет интересно их испытать.
Можешь предложить проекты, которые хорошо делать с помощью НКРЯ?
В корпусе можно следить за историей конкретного слова: когда появилось, как часто употреблялось в разные периоды (интересно подумать, с чем связаны скачки в употреблении), как развивались значения. Можно сделать «биографию» слова по материалам корпуса. Когда ищешь сам, а не просто открываешь словарь, знания лучше укладываются в голове. Плюс в словаре может не быть интересующего тебя слова, а в корпусе оно наверняка есть. Или вот, например, идея: сейчас много спорят о школьной форме. Поиск в корпусе этого словосочетания и анализ контекстов помогли бы понять, вечная ли это проблема. Как относились к школьной форме раньше?
Откуда ты узнал об олимпиаде?
Я еще в начале года участвовал в Традиционной лингвистической олимпиаде, после этого начал интересоваться темой, отсюда подписка на группу Вконтакте «Младолингвисты», а там давали ссылку на эту олимпиаду. Я прочитал, мне стало интересно, и вот – зарегистрировался.
А чем она тебя заинтересовала?
Я вообще только тогда о корпусе узнал, почему-то о нем раньше не слышал. Оказалось, что очень интересный ресурс.
Какое задание понравилось?
Например, задание, где нужно в параллельном корпусе найти, есть ли в английском языке переносное значение у выражения «махнуть рукой». Оно прикольное очень: с одной стороны сложное, а с другой — простое.
Удалось попробовать разные способы работы с НКРЯ?
Да. Правда, не все способы понравились.
Почему?
Сейчас объясню. Дело в том, что я незрячий, учусь в школе специальной для незрячих – такой интернат в Москве есть. Кстати, недавно представители вашего факультета приезжали в нашу школу, рассказывали о том, как у вас устроена безбарьерная среда. У вас есть студентка, Оксана Осадчая, которая нам сейчас помогает в переводе на Брайль гуманитарных олимпиад. С ее помощью Лингвистическую олимпиаду перевели на Брайль, и в прошлом году наша школа впервые ее запустила. Ваши студенты стали приезжать к нам, готовить к олимпиадам по русскому и лингвистике. Так вот в корпусе есть такая штука, которая называется графики, и вот с ними я работать, например, не могу.
А для каких заданий нужны были графики?
Например, для последнего, где надо было выбрать письмо, которое не могло быть написано в 1928-м году. Кстати, ответ на него был для меня полной неожиданностью. Для решения надо было в поиск в корпусе вводить «подозрительные» словосочетания. Собственно, я так и делал. Кто же знал, что подозрительное словосочетание – это «проблемы с» чем-то? Вроде, обычное выражение, оно могло существовать давно! Даже не подумал. Я решил, что это вопрос про технологии. Проверял в корпусе слова «робот», «кино»… А когда увидел правильный ответ, это был «полный фейл».
Как ты считаешь, умение пользоваться корпусом тебе пригодится?
Думаю, да. Во-первых, я часто видел в словарях ссылки на корпус при описании употребления слова. А еще у меня часто проблемы с такими заданиями, когда даны какие-то параметры — ну, грубо говоря, сложноподчиненное предложение — и нужно придумать пример. А я не могу придумать. Не знаю, о чем. А тут зашел в корпус, ввел нужные характеристики — вот тебе и предложение из литературы! Еще мне очень понравился мультимедийный подкорпус — там можно послушать, как говорят. Например, забиваешь фразу, и можно узнать, как именно она произносилась в таком-то фильме.
Почему ты решила участвовать в «Что может корпус»? Или ты во всех олимпиадах участвуешь, по инерции?
Ну нет, по инерции во всех не участвую, потому что мне немножечко лень. Я просто увидела: олимпиада, связанная с НКРЯ, — а мы эту тему проходили какое-то время назад на занятиях по компьютерной лингвистике в Лицее НИУ ВШЭ.
Твои одноклассники тоже участвовали?
Проблема в том, что сейчас люди еще чтут разделение на «гуманитариев» и «технарей». Поэтому мой класс немного посмеивается надо мной: они думают, что в душе я скрытый гуманитарий, хотя учусь на направлении «математика и информатика».
Что тебе понравилось в олимпиаде?
В ней были вопросы, в которых нужно писать что-то самому. Не просто решить пример, как на математике, где тебе скажут, верное решение или неверное. Здесь нет точного распределения на правильное-неправильное, нет одного ответа на все случаи жизни. Мне именно этим олимпиада и была интересна.