Анастасия Чижикова на конференции LREC 2022

20-25 июня в городе Марсель (Франция) прошла тринадцатая Международная Конференция по Языковым Ресурсам и их Оценке (International Conference on Language Resources and Evaluation, LREC 2022). В ней приняла очное участие выпускница нашей бакалаврской программы 2022 года Анастасия Чижикова. Мы попросили Анастасию рассказать нам об этой конференции.

LREC — это конференция по компьютерной лингвистике с фокусом на языковые ресурсы, корпуса и инструменты для их создания. В этом году конференция проходила в гибридном формате: можно было приехать выступить вживую в Palais du Pharo, а можно было записать видео выступления заранее. Помимо видео, нужно было написать статью и отправить организаторам слайды своего выступления. Все тексты статей, видео и слайды сейчас доступны на сайте конференции.

Помимо основной сессии, на конференции было множество воркшопов, а также несколько тьюториалов и постерные сессии.

Я была в числе авторов двух статей, представленных на конференции. Первая из них называется Phonetics of Negative Headshake in Russian Sign Language: A Small-Scale Corpus Study и посвящена она исследованию отрицательных поворотов головы в русском жестовом языке с помощью готовых инструментов компьютерного зрения. Её мы с моим соавтором Вадимом Киммельманом подали на воркшоп, посвященный обработке жестовых языков. Для выступления мы заранее перед конференцией записали видео, при этом докладывались мы на International Sign — искусственной жестовой системе, созданной специально для международных мероприятий. Ни я, ни Вадим не знаем International Sign в совершенстве, поэтому подготовка выступления была отдельной задачей — сложной, но очень увлекательной (и, мне кажется, в итоге получилось очень неплохо).

Вторую статью, которая называется Attention Understands Semantic Relations, мы написали с коллегами из лаборатории DeepPavlov, в которой я сейчас работаю. Это пробинговое исследование посвящено изучению семантических отношений в языковых моделях. Пробинговое исследование — это работа по исследованию того, насколько современные языковые модели (нейросети, которыми мы сейчас пользуемся практически во всех задачах NLP) обобщают знания из текста и сколько вообще этого знания в них есть. Проблема в том, что мы пользуется нейросетями, но не всегда до конца понимаем, почему они так хорошо решают работают — не является ли это результатом простого запоминания текстов, вместо обобщения знания, которое мы бы хотели там видеть. В нашей работе мы пытаемся извлекать графы знаний из текста с помощью анализа внутреннего механизма языковых моделей (так называемого механизма внимания). Графы знаний — это такой способ представления семантических отношений между сущностями в тексте: например, в предложении Москва — столица России между сущностями Москва и Россия есть отношение столица, это отношение мы и хотим извлечь. В нашей работе мы предлагаем простой наивный способ для извлечения этих отношений из моделей, а потом интерпретируем его результаты. Это исследование стало первым шагом в проекте по разработке необучаемых методов извлечения графов знаний из языковых моделей.

Эту статью, несмотря на все нынешние трудности с поездками за границу, мне удалось представить очно на постерной сессии. Мой доклад вызвал немалый интерес всех слушателей, которые не поленились прийти на место проведения конференции к 9:30 утра. Я ни минуты не стояла у своего постера в одиночестве — у меня всё время были слушатели. Более того, люди подходили ко мне и после окончания сессии, так что обсуждение нашей работы продолжалось и во время кофе-брейка. А когда я уже сняла постер со стенда, ко мне подошли ещё слушатели, которые не успели задать вопрос, поэтому пришлось устроить еще один импровизированный рассказ, расположив постер прямо на полу.

LREC-2022 был моей первой в жизни очной конференцией, и, конечно, оставил очень приятные впечатления и вдохновил меня на продолжение работы как исследователя. Меня очень впечатлила атмосфера конференции — очень доброжелательная и приятная. Все открыты к обсуждению и всегда готовы поделиться своими мыслями по поводу исследований, так что эта разница в опыте не чувствуется (на конференции были как крутые и опытные учёные, так и начинающие исследователи типа меня), и это вдохновляет. Место проведения тоже порадовало — очень уж красивый этот Palais du Pharo.

Добавим только, что помимо Анастасии в конференции приняли участие и другие наши коллеги: Антон Бузанов, Полина Бычкова, Арина Молчанова, Анна Постникова и Дарья Рыжова представили статью Multilingual Pragmaticon: Database of Discourse Formulae, а Юрий Макаров, Максим Меленченко и Дмитрий Новокшанов (ИКВИА) представили Шугнанский проект на воркшопе Workshop on Resources and Technologies for Indigenous, Endangered and Lesser-resourced Languages in Eurasia (EURALI) статьёй Digital Resources for the Shughni Language, а также выступили на постерной сессии — правда, не в очном формате.

Дата

25 июля, 2022 г.

Рубрики

Наука

Темы

студенты репортаж о событии LREC компьютерная лингвистика конференции

В статье упомянуты

Школа лингвистики

Персоны

Чижикова Анастасия Павловна