• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4

Как до нас добраться

 

Телефон: +7 (495) 772-95-90 доб. 22734

E-mail: ling@hse.ru

По вопросам, связанным с сайтом: portalhseling@gmail.com

Руководство

Руководитель Рахилина Екатерина Владимировна

Заместитель руководителя Ахапкина Яна Эмильевна

Книга
Введение в науку о языке

Кибрик А. Е., Федорова О. В., Татевосов С. Г. и др.

Буки Веди, 2019.

Глава в книге
Tense and Lax Body Parts in the Russian Deictic Gestures: The Case of Index Finger Pointing

Переверзева С. И.

In bk.: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 29 мая — 1 июня 2019 г.). Iss. 18(25). 2019. P. 1-16.

"Сильные доклады, прекрасные люди... и почти рождественская атмосфера"

Студенты магистерской программы "Компьютерная лингвистика" — об участии в международной конференции по интеллектуальным технологиям AINL FRUCT.

С 10 по 12 ноября студенты второго курса магистратуры школы лингвистики Анастасия Романова, Михаил Нефедов, Алена Феногенова и Оксана Дереза участвовали в международной конференции AINL FRUCT, проходившей в Санкт-Петербурге. Конференция была посвящена различным темам, связанным с современными интеллектуальными технологиями: анализом социальных сетей, речевыми технологиями, человеко-машинным взаимодействием, машинным обучением, автоматическим анализом и классификацией текстов. Наиболее популярным инструментом для решения задач были нейронные сети, о которых на конференции очень много и активно говорилось, проводились тюториалы, а участники делились своими наработками и знаниями этого метода.

 


Анастасия Романова

До самой конференции мы с Мишей участвовали в соревновании по определению парафраза для русского языка. Всем участникам было предложено два типа заданий: классификация на два класса (парафраз — непарафраз) и на три класса (парафраз - частичный парафраз - непарафраз). Были доступны два прогона: «стандартный», в котором система могла обучаться только на предоставленном организаторами корпусе, и «нестандартный», в котором можно было использовать любые другие данные. Так как прогоны оценивались отдельно, то в общей сложности было представлено четыре задания, в двух из которых мы одержали победу. Всех участников дорожки пригласили на конференцию для выступления на семинаре, посвященном автоматическому определению парафраза для русского языка.

 


Михиал Нефедов

В рамках данного семинара команды делились своими методами, инструментами и алгоритмами. Многих заинтересовало наше комплексное решение, в связи с чем мы получили большое количество дополнительных вопросов. С некоторыми участниками мы даже обменялись контактами для дальнейшего обсуждения текущей задачи, а также для совместной работы над другими.

 

 

Алена Феногенова

Этим летом я проходила практику от НИУ ВШЭ на предприятии НИИ КВАНТ. Сотрудничество получилось более чем плодотворным — мы разработали метод автоматического извлечения англицизмов в Интернете. Ведь в сетевых текстах огромное количество нестандартной лексики (сленг, жаргоны, англицизмы, неологизмы), которое комплексными системами (такими как морфологические, сентимент и синтаксический анализаторы) очень сложно обрабатывать. Необходим подход к лексической обработке, нормализации сетевых текстов, например, извлечению из них неологизмов. В работе мы исследовали англицизмы, разработали метод их автоматического нахождения, использовали технологии глубокого/глубинного обучения для данной задачи.

Тема конференции AINL очень удачно совпала с темой нашего метода, в результате чего нашу статью взяли, и мне удалось выступить и поделиться с научным сообществом нашей наработкой.

В целом, AINL оставил отличные впечатления, было множество сильных и интересных докладов, прекрасные люди, а Санкт-Петербург порадовал снежной, даже рождественской атмосферой.

 


Оксана Дереза 

Я участвовала в постерной сессии AINL, где было представлено семь работ на самые разнообразные темы: от автоматического извлечения корня слова до построения сети героев из произведений художественной литературы. Каждому участнику давалось по две минуты на краткую презентацию своей работы, после чего все желающие могли посмотреть постеры и задать их авторам вопросы. Этот блок был совмещен с фуршетом, так что дискуссии получились очень оживленными и доброжелательными. Мне удалось пообщаться как с коллегами из питерской Вышки, так и с московскими лингвистами.

Я рассказывала о своем лемматизаторе для древнеирландского языка, написанном в рамках прошлогодней курсовой работы. Древнеирландская орфография крайне вариативна, поэтому задача предсказания лемм для несловарных форм близка к спеллчекингу, и моя работа была в основном посвящена созданию алгоритма для отождествления несловарных форм со словарными на основе расстояния Дамерау-Левенштейна.

В постерной секции также участвовала студентка I курса школы лингвистики Татьяна Шаврина с демо-презентацией новых функций ГИКРЯ.