• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4

 

🧭 Как до нас добраться

 

Телефон: +7 (495) 772-95-90 доб. 22734

E-mail: ling@hse.ru

Руководство
Заместитель руководителя Ахапкина Яна Эмильевна

Редакторы сайта — Наталья Борисовна Пименова, Татьяна Борисовна Казакова, Максим Олегович Бажуков, Юлия Геннадьевна Бадрызлова

Книга
Митрополиты, мудрецы, переводчики в cредневековой Европе

Белов Н. В., Бойцов М. А., Виноградов А. Ю. и др.

М.: Издательский дом НИУ ВШЭ, 2024.

Статья
Building an Open Corpus and a Morphological Parser for Corpus Annotation for Standard Dargwa

Svetlana Iu. Toldova, Elena O. Sokur.

Journal of Siberian Federal University. Series: Humanities & Social Sciences. 2024. Vol. 17. No. 5. P. 905-915.

Глава в книге
SmurfCat at PAN 2024 TextDetox: Alignment of Multilingual Transformers for Text Detoxification

Rykov E., Zaytsev K., Anisimov I. et al.

In bk.: CLEF 2024 Working Notes. CEUR Workshop Proceedings, 2024. P. 2866-2871.

Препринт
Exploring the Effectiveness of Methods for Persona Extraction
В печати

Konstantin Zaitsev.

arxiv.org. Computer Science. Cornell University, 2024

«У студентов Вышки развито чувство языкового разнообразия»

Постдок из Йельского университета Кевин Тан прочитал в школе лингвистики лекцию о том, как статистические ожидания носителей разных языков влияют на произнесение и восприятие отдельных фонем. В интервью сайту школы Кевин рассказал, как перековаться из инженера в лингвиста-фонолога с помощью греческих танцев и в чем студенты Вышки превосходят сверстников из Йеля и UCL.

Вы стали лингвистом после получения диплома инженера в Кембридже. Как случился этот переход?

Всё началось с греческих танцев. Я ходил на них, пока учился на инженера, а преподаватель танцев получал степень PhD по фонетике.

То есть всё произошло случайно?

Да, совершенно случайно. Я нашел его статьи, почитал их и подумал: «о, это выглядит неожиданно похоже на настоящую науку». Учась на инженера, я никогда не слышал о фонетике. Это не самый популярный предмет в Великобритании. В основном люди не знают, что такое лингвистика. Все думают, что это о том, как учить языки.

Кажется, в России то же самое.  Ну, и что было дальше?

Чтение статей пробудило мой первоначальный интерес. Дальше во время учёбы я просто ходил в библиотеку и брал книги по лингвистике. В итоге к концу университетского курса я понял, что лингвистика нравится мне даже больше, чем инженерные науки. Я всё равно закончил образование и получил степень магистра. А потом мне посоветовали пройти так называемый «конверсионный курс», годичную магистерскую программу, которая позволяет начать с основ и освоить необходимое. Такие программы есть в небольшом количестве университетов, мне посоветовали Университет Эдинбурга или Университетский колледж Лондона (UCL). Это было около 7 лет назад.

Куда же вы пошли?

Я решил пойти в UCL и закончил магистратуру там. Это было нужно, чтобы понять, насколько мне интересна лингвистическая стезя. Никогда не знаешь, пока не попробуешь. В UCL я встретил своего будущего научного руководителя. Он сказал, что может попробовать взять меня на программу подготовки PhD, и если я проявлю себя, то могу получить финансирование от университета. Это как раз было проверкой того, насколько серьезно я готов уйти в лингвистику. Вот и весь мой путь: греческие танцы, самостоятельное изучение фонетики в библиотеке, Университетский колледж Лондона, PhD. И теперь я постдок в Йельском университете.

И изучаете языки майя?

Да, я хотел заняться языками, которые мало кто исследует. Если вы занимаетесь испанским, то все вокруг вас тоже занимаются испанским. А изучать редкие и малоизученные языки хорошо и для карьеры, и для собственного языкового развития.

В вашей лекции вы сказали, что нужно стремиться к большему типологическому разнообразию. Не могли бы вы еще раз прокомментировать, почему это важно? Почему важно выходить за пределы одной языковой семьи?

Да, и именно типологическое разнообразие — сильная сторона Вышки, сильная сторона школы лингвистики. Мне кажется, преимущество состоит в том, что широкая типологическая перспектива не позволит вам «переобучить» вашу теоретическую модель языка. Предположим, все ваши теоретические построение основаны на материале всего нескольких языков… И давайте будем честны, так и происходит сейчас в экспериментальной лингвистике: даже в самых продвинутых областях западноевропейские исследователи работают максимум на 6 языках, среди которых английский, испанский, французский. Самый «экзотический» — японский, потому что на это еще хватает ресурсов. В результате вы строите теоретическую модель и думаете, что она описывает язык. Но пока она описала лишь несколько похожих языков.

Большинство из которых — потомки латыни.

Именно. Так что это классическая проблема «переобучения», как в машинном обучении. Если вы переобучили вашу модель, она выдает неверные предсказания на новых незнакомых данных. Поэтому работая с различными языками (и я имею в виду действительно типологически различными), особенно с малоизученными, можно надеяться избежать этого. И тогда ваша теория будет иметь большую объяснительную силу.

К тому же, как мы знаем, малоизученные редкие языки довольно быстро умирают. Чем больше таких языков исчезает, тем меньше у нас данных для разработки наших моделей и тем больше они страдают от переобучения.

Понравилось ли вам общаться со студентами во время лекции? Кажется, после вашего выступления завязалась довольно долгая дискуссия.

Да, я был впечатлен вопросами. У студентов Вышки развито чувство языкового разнообразия — видимо, благодаря вашей учебной программе и поездкам в экспедиции. Они приводили примеры из огромного количество редких языков. Я, конечно, не вспомню и половины названий. Это было довольно необычно. Я преподавал в UCL и в Йеле, и там студенты обычно не используют для лингвистических примеров и контрпримеров языки, находящиеся за пределами их ближайшей зоны доступа. Очень здорово, что студенты Вышки сразу пытаются примерить любую модель и любую теорию к тем редким языкам, которые им известны.

Некоторые вопросы были больше связаны с вопросом восприятия речи. В частности, был поднят вопрос о различиях в реакции на служебные и содержательные (знаменательные) слова. То есть студенты, по-видимому, знакомы и с той стороной лингвистики, которая касается изучения восприятия речи. Я думал, что основные специализации школы лингвистики — теоретическая и компьютерная лингвистика, но, по-видимому, здесь много занимаются и экспериментальной работой.