Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.
Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4
Телефон: +7 (495) 772-95-90 доб. 22734
E-mail: ling@hse.ru
Редакторы сайта — Наталья Борисовна Пименова, Татьяна Борисовна Казакова, Максим Олегович Бажуков, Юлия Геннадьевна Бадрызлова
Школа лингвистики была образована в декабре 2014 года. Сотрудники школы преподают на образовательных программах по теоретической и компьютерной лингвистике в бакалавриате и магистратуре. Лингвистика, которой занимаются в школе, — это не только знание иностранных языков, но прежде всего наука о языке и о способах его моделирования. Научные группы школы занимаются исследованиями в области типологии, социолингвистики и ареальной лингвистики, корпусной лингвистики и лексикографии, древних языков и истории языка. Кроме того, в школе создаются лингвистические технологии и ресурсы: корпуса, обучающие тренажеры, словари и тезаурусы, технологии для электронного представления текстов культурного наследия.
Bangkok: Association for Computational Linguistics, 2024.
Труды института русского языка им. В.В. Виноградова. 2024. № 4 (42). С. 102-118.
В кн.: Будь в курсе цифровых гуманитарных исследований. Красноярск: Сибирский федеральный университет, 2024. С. 164-181.
arxiv.org. Computer Science. Cornell University, 2024
В середине декабря в Осаке прошла конференция COLING, одно из главных научных событий в мировой компьютерной лингвистике. Недавно мы писали об участии в ней нашего выпускника Никиты Медянкина, а теперь публикуем интервью с профессором Валентиной Юрьевной Апресян, которая была приглашенным докладчиком на воркшопе Gramm & Lex 2016 при COLING.
Валентина Юрьевна, расскажите, чему был посвящен воркшоп. Я так понимаю, он был «более лингвистический», чем весь COLING в целом, но все-таки с прикладной составляющей?
Безусловно. Когда Игорь Богуславский и Ева Хаичова (Eva Hajičová) организовывали вопркшоп, у них был план вернуть COLING’у «лингвистичность». В последнее время COLING стал в большей степени конференцией прикладных математиков и компьютерщиков. А здесь была идея сделать что-то более теоретическое.
Make COLING linguistic again?
A little bit. Не совсем linguistic again, но хотя бы какой-то лингвистический элемент добавить. Этому предшествовал опрос лингвистического сообщества, и меня тоже позвали в организацию этого воркшопа как человека, который занимается теорией. Но, конечно, многие участники Gramm & Lex 2016 занимаются компьютерной лингвистикой, прикладными задачами.
Сама идея воркшопа была в том, чтобы созвать людей из разных областей, и поэтому тема была сформулирована достаточно общим образом: взаимодействие грамматики и лексики. Но на самом деле не так много есть областей в лингвистике, которые не находились бы где-то на стыке грамматики и словаря. Смысл был в том, чтобы разные люди представили свои разные взгляды на это взаимодействие и на какие-то теоретические проблемы лингвистики.
У меня была одна из так называемых invited position papers, и меня организаторы специально попросили выступить в полемическом ключе — бросить вызов каким-то традиционным установкам, чтобы была какая-то дискуссия. И многие люди делали то же самое, отклонялись от каких-то уже сложившихся представлений.
Да, я как раз посмотрел call for papers и увидел, что там на первом месте стоит призыв к новизне. Посыл сформулирован такой: «лучше пусть у вас будет спорная работа, но новая, а не повторение старых практик». То есть это была сознательная установка организаторов?
Да, безусловно. У теоретических конференций в принципе есть тенденция следовать какому-то устоявшемуся паттерну. Здесь идея была не посвящать эту встречу какой-то одной теории, концепции или направлению (например, модели «Смысл — Текст» или формальным моделям), а именно соединить совсем разных людей. Получилось достаточно разнообразно.
Вы ощутили положительный эффект этого разнообразия? Может быть, какие-то «перпендикулярные» идеи?
Мне всегда интересно узнать что-то новое, так что, конечно, ощутила. В конце воркшопа Игорь Богуславский спросил, как участники отнеслись к этому, и в целом все отозвались положительно. Хотя Джеймс Пустейовски сказал, что если такая встреча состоится вновь, то ему бы хотелось большего «внутреннего единства». Но мне кажется, общее чувство было — «хорошо, что это состоялось».
Из того, что вы сказали, может сложиться впечатление, что этот воркшоп — своеобразная попытка впрыснуть в COLING традицию нашего «Диалога», где как раз происходит встреча разных людей с разными идеями, а также компьютерных лингвистов — с теоретическими.
Если говорить о COLING’е в целом, там было много разных воркшопов, с разнообразием всё хорошо. Например, я там встретила одну знакомую из Бостона, которая организовывала воркшоп, посвященный компьютерной лингвистике и клиническим исследованиям в психиатрии. Скорее, я бы сказала, что это была попытка внутри одной секции «Диалога» организовать разнообразие. А вообще разнообразия там очень много, и конференция совершенно грандиозная.
Теперь о том, что касается новизны. Я лично, например, рассказывала про сферы действия — это традиционная тема для семантики, в том числе формальной семантики. Но я сделала исследование, которое рассматривает её с достаточно необычной точки зрения. Это было корпусное исследование прагматических факторов, которые влияют на интерпретацию и выбор конкретной сферы действия в конкретном высказывании. Получилось интересно, потому что это был неожиданный подход к хорошо известной теме «из учебников».
С другой стороны я открыла для себя, что, оказывается, тот же самый Джеймс Пустейовски занимался разметкой сферы действия в текстах. Он немедленно спросил, как можно было бы использовать мои данные, чтобы более успешно аннотировать.
То есть какие-то неизвестные ранее точки пересечения нашлись?
Нашлись, и совершенно неожиданно. Джеймс даже предложил совместно что-то сделать в будущем по этой теме. Для меня это было очень полезно. Ну, и конечно, полезно было услышать других докладчиков. Я и познакомилась с новыми людьми, и узнала с новой неожиданной стороны знакомых коллег. Например, там были чешские исследователи, которые обычно рассказывают про VALLEX (корпус семантических ролей, своего рода чешский FrameBank). Здесь они говорили о VALLEX с точки зрения взаимодействия лексики и грамматики, а именно о том, как отличаются по своей семантической структуре глаголя с -ся от глаголов без -ся.
Джеймс Пустейовски сделал совершенно неожиданный для меня доклад — он рассказывал о мультимодальном словаре. Я помнила Джеймса формальным лингвистом, а он, оказывается, занимается разработкой мультимодального словаря — с картинками и разными другими визуальными репрезентациями, с жестами; вместо лексем там «воксемы» (семантические объекты специального языка VoxML).
То есть статья такого словаря является некой мультимедийной сущностью.
Да, неким мультимедийным элементом. И как в обычном словаре выделяются какие-то лексикографические типы на основе семантической общности, так и здесь внутри этого т.н. «воксикона» (лексикона «воксем») выделяются группы, можно производить типизацию на основе визуальных, жестовых черт и т.д.
Это очень интересно, спасибо за рассказ. Последний вопрос будет ненаучный: поскольку все происходило в Японии, не могу не спросить о том, удалось ли посмотреть что-то вокруг, погулять, поездить?
Я была там всего два дня, но мне удалось съездить в Нару, которая оказалась совершенно поразительным маленьким городком, где много древних буддийских храмов и живут 1200 маленьких оленей. Они там бродят и едят у людей из рук специальные оленьи печенья.
Олень в г. Нара, фото Валентины Апресян
Я взяла велосипед и ездила посреди всего этого. Было чудесно, особенно после Осаки, в которой проходила конференция и которая выглядит таким огромным японским Нью-Йорком. Буквально полчаса на поезде — и ты оказываешься в другом мире.
г. Нара, фото Валентины Апресян
Всем понятно, что в Японии совершенно нет места. Но после российских просторов очень странно ехать на поезде прямо среди огородов. Поезд идет через грядки с капустой и деревья с хурмой. То есть там так мало место, что уже через пару метров от железнодорожных путей люди ставят свои домики и выращивают свою капусту. А к хурме просто хотелось протянуть руку и сорвать.
г. Нара, фото Валентины Апресян