Продолжаем серию интервью к юбилею Школы лингвистики. Об «истории своей жизни» в Школе, о науке и преподавании рассказывет Георгий Алексеевич Мороз.
Начало пути – Этапы карьеры – Школа лингвистики: зарождение нового – Две попытки создать компьютерную лингвистику и “каста” вышкинцев – Что происходило – Вспоминая пандемию – Наша “фишка” – МФА, забытые знания и другие проблемы преподавания – Гении презентаций – “Большой контекст”. Встречи и сотрудничества – Про международную лабораторию языковой конвергенции – О будущем
Начало пути
– Когда Вы начали работать на лингвистическом направлении в НИУ ВШЭ?
– Я начал работать в ШЛ в 2013 году – тогда я учился на втором году аспирантуры в МГУ. В Вышке я помогал вести курс по языкам России, который входил, насколько помню, в большой курс введения в специальность и который вел Михаил Александрович Даниэль, Юрий Ландер и много разных людей. Это был общий курс, в разных частях которого были разные кусочки лингвистики. В одной из таких частей я помогал Сергею Владимировичу Князеву вести фонетику. И еще сам я вел польский язык.
– Как получилось, что Вы попали именно в Школу лингвистики?– Первый раз я попал в Вышку на Покровке, еще не будучи преподавателем: с Юрием Ландером я рассказывал про нашу адыгейскую экспедицию на экспедиционном вечере. Тогда я и познакомился со Школой.
Я закончил специалитет в РГГУ и поступил в аспирантуру МГУ, и мое направление в Вышку не кажется мне странным, потому что тогда много людей из РГГУ и МГУ начинали работать в Вышке. Люди в моей тусовке, как и один из до сих пор очень значимых для меня людей, Юрий Александрович Ландер, конечно же, были там. Это было сигналом, что Вышка – хорошее место. В нем уже были Светлана Юрьевна Толдова, Нина Роландовна Добрушина, Михаил Александрович Даниэль, с которым мы перед этим ездили в экспедицию вместе с вышкинскими студентами. Все они – важные люди в моей жизни. Поэтому я в каком-то смысле шел работать с друзьями.
–
Как Вы связаны со Школой лингвистики?
Этапы карьеры
– Мой путь в Вышке был очень длинным и не совсем прямолинейным. Сначала я был преподавателем. Моей специальностью были польский язык и фонетика, и я достаточно долго преподавал эти курсы. Потом, когда Екатерина Владимировна спросила меня, что я хочу вести больше: латынь или R (это такой язык программирования, который тогда, да и сейчас ассоциируется со статистикой), – я выбрал R. Так я переквалифицировался в квантитативного лингвиста. У меня была большая поддержка со стороны Ольги Ляшевской и Ильи Щурова, с которыми мы вели курс по статистике в магистратуре.
Преподавание языка R было очень полезным для моей будущей работы в лаборатории языков Кавказа, а затем в международной лаборатории языковой конвергенции, где квантитативный R “сделал мне карьеру”. Я написал пакет
lingtypology, который позволял строить карты легко и просто, и это принесло большую пользу для разных лабораторных проектов. Данный пакет – самая цитируемая моя работа – оказался полезен не только в Вышке, но и далеко за ее пределами. Еще я участвовал в разных проектах и экспедициях в Адыгею, Карачаево-Черкесию и Дагестан и, надеюсь, что в этом тоже был полезен лаборатории. А сейчас я уже руковожу лабораторией в качестве заведующего и продолжаю этот путь. Посмотрим, что из этого выйдет.
Школа лингвистики: зарождение нового.
В каком-то смысле я считаю, что пассивно участвовал в создании Школы лингвистики. Когда я начал преподавать, наша Школа уже существовала внутри Школы филологии и уже сформировала свои отличительные черты. Основными центрами теоретической лингвистки в Москве тогда можно было считать РГГУ и МГУ, и возникновение третьего центра в Вышке стало важным событием, потому что здесь появилось много компьютерной лингвистики. Во многом это удалось сделать благодаря тому, что у наших истоков стояли Тимофей Архангельский, Боря Орехов, Оля Ляшевская, Светлана Юрьевна Толодова. Боря и Тимофей – суперкомпьютерные люди, Оля Ляшевская и Светлана Юрьевна – чуть менее, но с прекрасно совмещают компьютерное и теоретическое. Появилось свое направление, когда эти линии сливались: была хорошая теоретическая база, которая давалась одними преподавателями, но при этом студенты уже знали и математику, и программирование, и была такая взаимная подпитка.
Две попытки создать компьютерную лингвистику и “каста” вышкинцев
Важно еще сказать, что само направление теоретической лингвистики возникало еще в 60-е года 20-го века как ответ на отсутствие компьютерной лингвистики. IBM показал машинный перевод с английского на русский, и это всех взбудоражило. Много математиков и лингвистов начали работать вместе; тогда и была заложена традиция изучения математики лингвистами. Как студент РГГУ могу сказать, что математика преподавалась достаточно посредственно, в том смысле, что это была специальная математика для лингвистов, но она не носила никакого прикладного характера. Идеи, которые витали в 60-е года 20 века, тогда совершенно невозможно было реализовать. В результате появилась структурная лингвистика и прикладная. Люди, которые в 60-е, 70-е, 80-е выучили программирование и имели к этому доступ, что-то делали в своей области. Так, влияние того времени сказалось в том, что в СССР появилась чуть более структуралистская лингвистика с важным акцентом на малые языки. Анализ данных проник в общемировую лингвистику позже и стал второй важной вехой. Но несмотря на это, компьютерная лингвистика в достаточной мере в России не зародилась. Мне кажется, что Вышка – это вторая попытка собрать эти идеи. Важно, что Екатерина Владимировна Рахилина застала те самые времена, когда все это создавалось, она училась в одном из первых наборов ОТиПЛа. Интересно отметить, что в главных центрах, МГУ и РГГУ, компьютерная лингвистика не появилась. Когда я учился, в РГГУ было отдельное направление искуственного интеллекта задолго до всего хайпа вокруг AI, но я знаю всего одного человека оттуда, который продолжает заниматься лингвистикой. Компьютерная лингвистика в Москве, как мне кажется, появилась не в академии, но потом просочилась в Вышку и расцвела благодаря тому, что люди изучали программирование и математику. Уровень преподавания математики в Вышке был выше по сравнению с РГГУ, где он носил скорее познавательный характер и был абсолютно оторванным от реальности. Поэтому, когда я увидел студентов НИУ ВШЭ, наших лингвистов, которые учили математику не для галочки, я был приятно удивлен. И, конечно, все они в той или иной мере умели программировать. И важно даже не то, что кто-то хорошо писал код, а то, что такие студенты отлично понимали что программируемо, а что нет. И, вероятно, у тогдашних преподавателей было это осознание, а если и не было, то студенты преподавателей подтягивали. Вышкинские студенты стали, как мне кажется, отдельной кастой.
Что происходило
–
В каких событиях и мероприятиях Вы участвовали?– Когда я начал работать в Школе лингвистики, я занял позицию теоретического лингвиста, фонетиста, полевика. Мы вместе организовывали разные экспедиции, и я участвовал во многих экспедициях на Кавказ и в разных проектах Школы, связанных с ними.
Кроме того, у нас всегда организовывались разные конференции. Несколько конференций в Вороново, в которых я участвовал, были очень полезными. В первый год на вороновской конференции даже была устроена компьютерная сессия. Там был Фрэнсис Тайерс, он “раздавал данные” и предлагал проводить по ним исследования. Рупрехт фон Вальденфельс тоже приезжал к нам. Все это было прекрасно. Другое большое событие – это когда была организована международная лаборатория языковой конвергенции. Еще была конференция TyLex. Только взгляните в программу: Дэвид Гил, Мария Капчевская-Тамм, Эйтан Гросман, Вадик Киммельман, Мартин Хаспельмат, Мария Полински, Николас Эванс… В общем, было много интересных конференций, и, что важно, у Школы, благодаря ее сотрудникам, были активные связи. К нам приезжали очень звездные люди, самые разные в самое разное время. Было хорошее время до пандемии.
Вспоминая пандемию
Пандемия мне запомнилась мало чем, если честно. Я продолжал преподавать. Единственное, мы сделали в лаборатории одну достаточно сумасшедшую вещь. Была запланирована школа, которую мы должны были организовывать всей лабораторией, но грянула пандемия, и нам пришлось эту школу отменить. Вместо этого мы начали записывать онлайн-курс на тему языков Дагестана, и потом мы его записывали еще два года. Это сложно назвать онлайн-курсом в полном смысле этого слова: я рассказывал про фонетику, кто-то про разные грамматические аспекты, и в результате таким образом покрывался большой пласт того, что известно про современное нахско-дагестанское языкознание. То есть мы организовывали серии докладов в лаборатории и записывали их. Во всем мире к тому времени нельзя было никуда выйти, можно было только созваниваться. На этих созвонах, которые были посвящены школе, мы все сидели без масок напротив друг друга и все это курировали. (Я думаю, что это производило на некоторых наших коллег странное впечатление). Так мы провели два года.
Наша “фишка”
–
Какие проекты, реализуемые сейчас в Школе, Вам кажутся особенно интересными?
– Экспедиции. Это важная фишка Вышки. Количество экспедиций за это время – несчетное. Множество студентов прошли через них, выросли, выпустились. Множество работы было сделано, которое без этих экспедиций было бы невозможно.
– Каков Ваш собственный опыт преподавания?
МФА, забытые знания и другие проблемы преподавания
– Когда я начинал вести польский язык в Вышке, студенты ожидали, что они будут учить польский язык как язык: как поздороваться, как попрощаться, как посчитать до четырех. И я старался делать это, но про себя думал: “Это же лингвисты. Они уже три года учили лингвистику. Возьму и расскажу основы грамматики, как лингвисты ее понимают”. Это оказалось сущим провалом. Проблемы возникли чуть ли не на первом этапе, потому что когда я пришел и сказал: “Здравствуйте, вот вам табличка со звуками польского языка в МФА, а вот правила чтения. Давайте тренироваться,” – я понял, что это не помогло почти никому. Кому-то от этого стало легче, но большинство людей смотрели на знаки МФА без энтузиазма. Я подумал: “Наверно, первый блин комом, может, они стесняются меня”. Но оказалось, что мои представления о том, что должны знать лингвисты на третьем курсе, и реальные знания студентов отличались. Проблема была и во мне тоже. Мои знания как человека, только что выпустившегося из специалитета по лингвистике, отличались от того, что преподавалось в Школе, потому что преподавали там другие люди, не такие, какие меня учили в РГГУ. Поэтому медленно, но верно мне пришлось сойти с рельс “вы лингвисты, вы меня поймете с полуслова” и перейти к более традиционному изучению языка и к разговорному методу.
Я столкнулся с нестыковкой ожиданий и реальности еще один раз. Я начал вести курсы по R и статистике и посчитал так: “У вас полтора года назад была статистика, наверно вы сейчас все помните”. Это тоже была глупость, но здесь я, к счастью, достаточно быстро перестроился. Вообще, я никогда не видел такого в Вышке, чтобы студенты учились просто ради того, чтобы отходить пары и получить какую-то оценку. Они всегда были заинтересованные. Когда преподаешь, не получается идти по какому-то плану, который ты сам себе наметил – это вообще плохая стратегия. Нужно смотреть на аудиторию: есть контакт или нет контакта, – и подстраиваться под вопросы и темп студентов. Я всегда старался это делать. Даже если вдруг не получалось уместить то, что я планировал, я все равно был рад, что хотя бы то, что я сумел рассказать, что мы уже успели обсудить, было в правильном темпе и именно так, как надо. У людей появилось ощущение, что они поняли. Это было важно для меня в преподавании.
Гении презентаций
Другая вещь, которая меня поражала и продолжает поражать до сих пор – это удивительные способности вышкинских лингвистов, а может и всех вышкинских студентов, представлять и делать презентации. У меня ощущение, что студенты из МГУ и РГГУ делают сырые презентации. Конечно это очень сильно зависит от человека, бывают и выдающиеся работы. Но от вышкинцев у меня сложилось впечатление, что что бы ни случилось, сколько бы времени они ни потратили на исследование или работу, которую представляют, презентация все равно производит впечатление какой-то масштабной работы. И меня это всегда поражает. Я знаю, сколько студент в реальности работал, а он представляет это, как будто он – Стив Джобс: у меня такое ощущение, что люди рассказывают “ва-банк”.
“Большой контекст”. Встречи и сотрудничества
–
Какие события, связанные со Школой лингвистики, для Вас были самыми знаковыми и запоминающимися?– Для меня ценны люди, которые работают в Вышке. Я благодарен Школе, что она собрала таких людей, с которыми я мог встретиться и много что обсудить. Это и наши лингвисты, и заграничные, которые приезжали. Знакомство с ними мне действительно было важно. Оно давало уверенность, что то, чем я занимаюсь – это не что-то чисто российское, местечковое, а что есть большой контекст, в который все это вписывается.
Из того, что мне кажется важным, это приезды Рупрехта фон Вальденфельса. Знакомство с финскими коллегами, с Ником Хоуэллом, Фрэнсисом Тайерсом и Джошом Майерсом. Джош Майерс приезжал к нам и рассказывал про
speech-to-text и
text-to-speech во времена, когда это было менее модно, не так, как сейчас. Инструменты были менее разработаны, он рассказывал нам про то, как они работают, и проводил практику.
И конечно, мне важно знакомство с моими друзьями и с большей частью моей лаборатории, которое сложилось в Школе. То, что к нам приехали и стали с нами работать Кьяра Наккарато и Самира Ферхеес. Знакомство и дружба с этими людьми многое мне дали. Работа с Михаилом Александровичем Даниэлем, Ниной Добрушиной, Тимуром Майсаком, Свеном Гравундером, Эссекелем Койле. Непрерывное взаимодействие с этими людьми много дало мне как лингвисту, но и как человеку тоже. Еще я очень рад нашей совместной работе с Машей Хачатурян. Маша Хачатурян приезжала к нам в лабораторию и делала доклад про билингвизм носителей языков мано и кпелле (это языки в Гвинее и Либерии). Павел Иосад в какой-то момент приезжал к нам читать лекции по фонологии и фонетике. Все эти знакомства давали разные идеи и обмен опытом.
Про международную лабораторию языковой конвергенции
– Расскажите про Лабораторию языковой конвергенции
– Изначально это была лаборатория языков Кавказа, впоследствии разросшаяся. Был грант Вышки на создание международных лабораторий, и в результате Нина Добрушина и Миша Даниэль смогли договориться с Джоханной Николс, которая до сих пор продолжает курировать нашу работу. Так и появилось наше подразделение.
Мы организовали очень много разных экспедиций. Одно из направлений, которое придумала Нина Роландовна Добрушина – это сбор диалектных устных корпусов у диалектологов и “вывешивание” их в Интернете. Так мы собрали очень большое количество устных корпусов: были и устные корпуса диалектные, и устные корпуса билингвального русского (то есть как, например, по-русски говорят марийцы).
Когда я начал руководить лабораторией, я сразу поставил себе задачу начать анализировать собранные корпуса как единый объект, а не как совокупность разрозненных корпусов. Теперь мы пишем статьи на эту тему, которые скоро будут опубликованы – и это очень важный результат нашей работы.
Кроме того, отдельным результатом становятся книжки, которые издаются. Например, мегебский сборник, который вышел по следам экспедиций в Мегеб (селение в Дагестане, где говорят на мегебском диалекте даргинского языка, некоторые исследователи считают его отдельным языком). Сейчас готовится большой сборник по языкам Кавказа. Несмотря на то, что некоторые статьи мы закончили писать в 2019 году, сборник все “выходит и выходит”, и у меня есть мечты, что в следующем году, а то и в этом, что-то начнет выходить на самом деле.
Другим важным продуктом лаборатории стал типологический атлас языков Дагестана: мы собираем данные по разным грамматическим категориям во всех языкам Дагестана и соседних регионов: Чечни, Ингушетии, Грузии, Азербайджана, – рисуем карты и пишем маленькие статьи для атласа, где показывается распределение признаков. Есть и более мелкие результаты, все их можно увидеть на нашем сайте; я стараюсь вести каталог ресурсов, которых действительно очень много.
О будущем
–
Какие ещё не реализованные проекты и (или) надежды у Вас есть для Школы?– Мне сложно мечтать, если честно. Сейчас я работаю в лаборатории, поэтому связываю свое будущее с будущим лаборатории. Я надеюсь, что в будущем лингвистические лаборатории станут больше взаимодействовать друг с другом. Было бы хорошо, чтобы лингвистика наконец-то вылезла из своего пузыря и стала смотреть на совместный опыт с другими профессионалами, которые работают и на ФГН, и в других местах Вышки. Важно смотреть на наши возможные контакты и с математиками, и с филологами, и даже с историками. Другая вещь, которая мне кажется сейчас в Школе лингвистики слабой, – это взаимодействие с музеями. В музеях лежит тонна данных, которые можно было бы обрабатывать. Музейщики в принципе были бы счастливы их обработать, но нет этого диалога, и поэтому данные просто лежат. Особенно это касается главного «музея» России – Российской Государственной Библиотеки. Работают с этими данными кусочками, а ведь будущее компьютерных технологий – это прочитать большие массивы данных за раз, составить графики и посмотреть на данные с высоты птичьего полета. Это очень большое поле. Соответственно, я бы пожелал ШЛ междисциплинарного взаимодействия, не навязанного, а самостоятельного. Навязанные взаимодействия ни к чему хорошему не ведут, а спонтанно возникающие связи очень полезны.
–
Вы можете предположить, как будет меняться жизнь Школы с дальнейшим развитием технологий?– Много чего будет меняться. Сейчас “хайпуют” большие языковые модели, они продолжат “хайповать”, но какие-то ограничения в них обнаружатся. Как всегда, за прорывом проприетарных технологий будут опенсорсные, поэтому я надеюсь, что мы, как оплот компьютерной лингвистики, сможем освоить такие вещи и продолжать нести их в малые языки России и не только. Сейчас мы очень лингвистично-центричны. Если мы начнем смотреть шире и будем пытаться сделать инструменты для носителей малых языков, то это было бы полезно. Не знаю, что бы я, например, предложил сделать. Скажем, LLM для ботлихского языка. Или что-то в меньших масштабах: автоматическое создание кроссвордов, детские раскраски с языковыми задачками внутри, которые мы можем делать автоматически, языковые игры для коммьюнити. Все это большая работа, которую можно автоматизировать и делать на собрании большого количества данных, которые есть в ШЛ.