Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.
Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4
Телефон: +7 (495) 772-95-90 доб. 22734
E-mail: ling@hse.ru
Редакторы сайта — Наталья Борисовна Пименова, Татьяна Борисовна Казакова, Максим Олегович Бажуков, Юлия Геннадьевна Бадрызлова
Школа лингвистики была образована в декабре 2014 года. Сотрудники школы преподают на образовательных программах по теоретической и компьютерной лингвистике в бакалавриате и магистратуре. Лингвистика, которой занимаются в школе, — это не только знание иностранных языков, но прежде всего наука о языке и о способах его моделирования. Научные группы школы занимаются исследованиями в области типологии, социолингвистики и ареальной лингвистики, корпусной лингвистики и лексикографии, древних языков и истории языка. Кроме того, в школе создаются лингвистические технологии и ресурсы: корпуса, обучающие тренажеры, словари и тезаурусы, технологии для электронного представления текстов культурного наследия.
Bangkok: Association for Computational Linguistics, 2024.
Kirill Koncha, Abina Kukanova, Kazakova Tatiana et al.
In bk.: Proceedings of the 3rd Workshop on NLP Applications to Field Linguistics (Field Matters 2024). Bangkok: Association for Computational Linguistics, 2024. Ch. 1. P. 1-5.
arxiv.org. Computer Science. Cornell University, 2024
Вы стали лингвистом после получения диплома инженера в Кембридже. Как случился этот переход?
Всё началось с греческих танцев. Я ходил на них, пока учился на инженера, а преподаватель танцев получал степень PhD по фонетике.
То есть всё произошло случайно?
Да, совершенно случайно. Я нашел его статьи, почитал их и подумал: «о, это выглядит неожиданно похоже на настоящую науку». Учась на инженера, я никогда не слышал о фонетике. Это не самый популярный предмет в Великобритании. В основном люди не знают, что такое лингвистика. Все думают, что это о том, как учить языки.
Кажется, в России то же самое. Ну, и что было дальше?
Чтение статей пробудило мой первоначальный интерес. Дальше во время учёбы я просто ходил в библиотеку и брал книги по лингвистике. В итоге к концу университетского курса я понял, что лингвистика нравится мне даже больше, чем инженерные науки. Я всё равно закончил образование и получил степень магистра. А потом мне посоветовали пройти так называемый «конверсионный курс», годичную магистерскую программу, которая позволяет начать с основ и освоить необходимое. Такие программы есть в небольшом количестве университетов, мне посоветовали Университет Эдинбурга или Университетский колледж Лондона (UCL). Это было около 7 лет назад.
Куда же вы пошли?
Я решил пойти в UCL и закончил магистратуру там. Это было нужно, чтобы понять, насколько мне интересна лингвистическая стезя. Никогда не знаешь, пока не попробуешь. В UCL я встретил своего будущего научного руководителя. Он сказал, что может попробовать взять меня на программу подготовки PhD, и если я проявлю себя, то могу получить финансирование от университета. Это как раз было проверкой того, насколько серьезно я готов уйти в лингвистику. Вот и весь мой путь: греческие танцы, самостоятельное изучение фонетики в библиотеке, Университетский колледж Лондона, PhD. И теперь я постдок в Йельском университете.
И изучаете языки майя?
Да, я хотел заняться языками, которые мало кто исследует. Если вы занимаетесь испанским, то все вокруг вас тоже занимаются испанским. А изучать редкие и малоизученные языки хорошо и для карьеры, и для собственного языкового развития.
В вашей лекции вы сказали, что нужно стремиться к большему типологическому разнообразию. Не могли бы вы еще раз прокомментировать, почему это важно? Почему важно выходить за пределы одной языковой семьи?
Да, и именно типологическое разнообразие — сильная сторона Вышки, сильная сторона школы лингвистики. Мне кажется, преимущество состоит в том, что широкая типологическая перспектива не позволит вам «переобучить» вашу теоретическую модель языка. Предположим, все ваши теоретические построение основаны на материале всего нескольких языков… И давайте будем честны, так и происходит сейчас в экспериментальной лингвистике: даже в самых продвинутых областях западноевропейские исследователи работают максимум на 6 языках, среди которых английский, испанский, французский. Самый «экзотический» — японский, потому что на это еще хватает ресурсов. В результате вы строите теоретическую модель и думаете, что она описывает язык. Но пока она описала лишь несколько похожих языков.
Большинство из которых — потомки латыни.
Именно. Так что это классическая проблема «переобучения», как в машинном обучении. Если вы переобучили вашу модель, она выдает неверные предсказания на новых незнакомых данных. Поэтому работая с различными языками (и я имею в виду действительно типологически различными), особенно с малоизученными, можно надеяться избежать этого. И тогда ваша теория будет иметь большую объяснительную силу.
К тому же, как мы знаем, малоизученные редкие языки довольно быстро умирают. Чем больше таких языков исчезает, тем меньше у нас данных для разработки наших моделей и тем больше они страдают от переобучения.
Понравилось ли вам общаться со студентами во время лекции? Кажется, после вашего выступления завязалась довольно долгая дискуссия.
Да, я был впечатлен вопросами. У студентов Вышки развито чувство языкового разнообразия — видимо, благодаря вашей учебной программе и поездкам в экспедиции. Они приводили примеры из огромного количество редких языков. Я, конечно, не вспомню и половины названий. Это было довольно необычно. Я преподавал в UCL и в Йеле, и там студенты обычно не используют для лингвистических примеров и контрпримеров языки, находящиеся за пределами их ближайшей зоны доступа. Очень здорово, что студенты Вышки сразу пытаются примерить любую модель и любую теорию к тем редким языкам, которые им известны.
Некоторые вопросы были больше связаны с вопросом восприятия речи. В частности, был поднят вопрос о различиях в реакции на служебные и содержательные (знаменательные) слова. То есть студенты, по-видимому, знакомы и с той стороной лингвистики, которая касается изучения восприятия речи. Я думал, что основные специализации школы лингвистики — теоретическая и компьютерная лингвистика, но, по-видимому, здесь много занимаются и экспериментальной работой.