• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

При участии школы лингвистики вышла новая версия Universal Dependencies

Международный проект универсальной языконезависимой синтаксической разметки Universal Dependencies объявил о выходе версии 2.0. В числе новых ресурсов — языковые корпуса от школы лингвистики НИУ ВШЭ.

Опубликованная коллекция включает синтаксические корпуса для 50 языков, размеченные в едином формате Universal Dependencies ("универсальных зависимостей"). В числе новых ресурсов — пилотные корпуса белорусского и литовского языков, подготовленные в школе лингвистики.

Особенность выпуска UD 2.0 в том, что его данные станут основой для проведения крупного международного соревнования CoNLL 2017 Shared Task, посвященного мультиязычной синтаксической обработке текстов. Магистранты программы "Компьютерная лингвистика" и студенты бакалавриата школы лингвистики принимали участие в подготовке данных для русского языка.

Данные UD 2.0 вывешены в открытом доступе на сайте проекта. Подробнее о Universal Dependencies можно узнать из доклада профессора школы лингвистики Ольги Ляшевской на научном семинаре школы.