• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4

 

🧭 Как до нас добраться

 

Телефон: +7 (495) 772-95-90 доб. 22734

E-mail: ling@hse.ru

Руководство
Заместитель руководителя Ахапкина Яна Эмильевна

Редакторы сайта — Наталья Борисовна Пименова, Татьяна Брисовна Казакова, Максим Олегович Бажуков, Юлия Геннадьевна Бадрызлова

Статья
Язык Л. Н. Толстого: корпусный подход и интроспекция

Орехов Б. В.

Труды института русского языка им. В.В. Виноградова. 2024. № 1. С. 67-73.

Глава в книге
Languages examined or referred to in the present book

Creissels D., Zúñiga F., Moroz G.

In bk.: Applicative Constructions in the World's Languages. Berlin: De Gruyter Mouton, 2024. P. 61-73.

Препринт
Grammar in Language Models: BERT Study

Chistyakova K., Kazakova Tatiana.

Linguistics. WP BRP. НИУ ВШЭ, 2023. No. 115.

«Организаторы специально попросили бросить вызов традиционным установкам»

Профессор школы лингвистики Валентина Апресян — о поездке на конференцию COLING, участии в «нетрадиционном» теоретическом воркшопе и маленьких японских оленях, любящих печенье.

В середине декабря в Осаке прошла конференция COLING, одно из главных научных событий в мировой компьютерной лингвистике. Недавно мы писали об участии в ней нашего выпускника Никиты Медянкина, а теперь публикуем интервью с профессором Валентиной Юрьевной Апресян, которая была приглашенным докладчиком на воркшопе Gramm & Lex 2016 при COLING.

Валентина Юрьевна, расскажите, чему был посвящен воркшоп. Я так понимаю, он был «более лингвистический», чем весь COLING в целом, но все-таки с прикладной составляющей?

Безусловно. Когда Игорь Богуславский и Ева Хаичова (Eva Hajičová) организовывали вопркшоп, у них был план вернуть COLING’у «лингвистичность». В последнее время COLING стал в большей степени конференцией прикладных математиков и компьютерщиков. А здесь была идея сделать что-то более теоретическое.

Make COLING linguistic again?

A little bit. Не совсем linguistic again, но хотя бы какой-то лингвистический элемент добавить. Этому предшествовал опрос лингвистического сообщества, и меня тоже позвали в организацию этого воркшопа как человека, который занимается теорией. Но, конечно, многие участники Gramm & Lex 2016 занимаются компьютерной лингвистикой, прикладными задачами. 

Сама идея воркшопа была в том, чтобы созвать людей из разных областей, и поэтому тема была сформулирована достаточно общим образом: взаимодействие грамматики и лексики. Но на самом деле не так много есть областей в лингвистике, которые не находились бы где-то на стыке грамматики и словаря. Смысл был в том, чтобы разные люди представили свои разные взгляды на это взаимодействие и на какие-то теоретические проблемы лингвистики.

У меня была одна из так называемых invited position papers, и меня организаторы специально попросили выступить в полемическом ключе — бросить вызов каким-то традиционным установкам, чтобы была какая-то дискуссия. И многие люди делали то же самое, отклонялись от каких-то уже сложившихся  представлений.

Да, я как раз посмотрел call for papers и увидел, что там на первом месте стоит призыв к новизне. Посыл сформулирован такой: «лучше пусть у вас будет спорная работа, но новая, а не повторение старых практик». То есть это была сознательная установка организаторов?

Да, безусловно. У теоретических конференций в принципе есть тенденция следовать какому-то устоявшемуся паттерну. Здесь идея была не посвящать эту встречу какой-то одной теории, концепции или направлению (например, модели «Смысл — Текст» или формальным моделям), а именно соединить совсем разных людей. Получилось достаточно разнообразно.

Вы ощутили положительный эффект этого разнообразия? Может быть, какие-то «перпендикулярные» идеи?

Мне всегда интересно узнать что-то новое, так что, конечно, ощутила. В конце воркшопа Игорь Богуславский спросил, как участники отнеслись к этому, и в целом все отозвались положительно. Хотя Джеймс Пустейовски сказал, что если такая встреча состоится вновь, то ему бы хотелось большего «внутреннего единства». Но мне кажется, общее чувство было — «хорошо, что это состоялось». 

Из того, что вы сказали, может сложиться впечатление, что этот воркшоп — своеобразная попытка впрыснуть в COLING традицию нашего «Диалога», где как раз происходит встреча разных людей с разными идеями, а также компьютерных лингвистов — с теоретическими.

Если говорить о COLING’е в целом, там было много разных воркшопов, с разнообразием всё хорошо. Например, я там встретила одну знакомую из Бостона, которая организовывала воркшоп, посвященный компьютерной лингвистике и клиническим исследованиям в психиатрии. Скорее, я бы сказала, что это была попытка внутри одной секции «Диалога» организовать разнообразие. А вообще разнообразия там очень много, и конференция совершенно грандиозная.

Теперь о том, что касается новизны. Я лично, например, рассказывала про сферы действия — это традиционная тема для семантики, в том числе формальной семантики. Но я сделала исследование, которое рассматривает её с достаточно необычной точки зрения. Это было корпусное исследование прагматических факторов, которые влияют на интерпретацию и выбор конкретной сферы действия в конкретном высказывании. Получилось интересно, потому что это был неожиданный подход к хорошо известной теме «из учебников».

С другой стороны я открыла для себя, что, оказывается, тот же самый Джеймс Пустейовски занимался разметкой сферы действия в текстах. Он немедленно спросил, как можно было бы использовать мои данные, чтобы более успешно аннотировать.

То есть какие-то неизвестные ранее точки пересечения нашлись?

Нашлись, и совершенно неожиданно. Джеймс даже предложил совместно что-то сделать в будущем по этой теме. Для меня это было очень полезно. Ну, и конечно, полезно было услышать других докладчиков. Я и познакомилась с новыми людьми, и  узнала с новой неожиданной стороны знакомых коллег.  Например, там были чешские исследователи, которые обычно рассказывают про VALLEX (корпус семантических ролей, своего рода чешский FrameBank). Здесь они говорили о VALLEX с точки зрения взаимодействия лексики и грамматики, а именно о том, как отличаются по своей семантической структуре глаголя с -ся от глаголов без -ся.

Джеймс Пустейовски сделал совершенно неожиданный для меня доклад  — он рассказывал о мультимодальном словаре. Я помнила Джеймса формальным лингвистом, а он, оказывается, занимается разработкой мультимодального словаря — с картинками и разными другими визуальными репрезентациями, с жестами; вместо лексем там «воксемы» (семантические объекты специального языка VoxML).

То есть статья такого словаря является некой мультимедийной сущностью.

Да, неким мультимедийным элементом. И как в обычном словаре выделяются какие-то лексикографические типы на основе семантической общности, так и здесь внутри этого т.н. «воксикона» (лексикона «воксем») выделяются группы, можно производить типизацию на основе визуальных, жестовых черт и т.д.

Это очень интересно, спасибо за рассказ. Последний вопрос будет ненаучный: поскольку все происходило в Японии, не могу не спросить о том, удалось ли посмотреть что-то вокруг, погулять, поездить?

Я была там всего два дня, но мне удалось съездить в Нару, которая оказалась совершенно поразительным маленьким городком, где много древних буддийских храмов и живут 1200 маленьких оленей.  Они там бродят и едят у людей из рук специальные оленьи печенья.

 

Олень в г. Нара, фото Валентины Апресян

Я взяла велосипед и ездила посреди всего этого. Было чудесно, особенно после Осаки, в которой проходила конференция и которая выглядит таким огромным японским Нью-Йорком. Буквально полчаса на поезде — и ты оказываешься в другом мире.

  г. Нара, фото Валентины Апресян

Всем понятно, что в Японии совершенно нет места. Но после российских просторов очень странно ехать на поезде прямо среди огородов. Поезд идет через грядки с капустой и деревья с хурмой. То есть там так мало место, что уже через пару метров от железнодорожных путей люди ставят свои домики и выращивают свою капусту. А к хурме просто хотелось протянуть руку и сорвать.

   г. Нара, фото Валентины Апресян