• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4

Как до нас добраться

 

Телефон: +7 (495) 772-95-90 доб. 22734

E-mail: ling@hse.ru

По вопросам, связанным с сайтом: portalhseling@gmail.com

Руководство
Заместитель руководителя Ахапкина Яна Эмильевна
Книга
Acta Linguistica Petropolitana. Труды Института лингвистических исследований РАН. Т. XV.

Под науч. редакцией: Д. Ф. Мищенко, Д. В. Герасимов, Н. М. Заика и др.

Т. 15: Материалы Четырнадцатой конференции по типологии и грамматике для молодых исследователей (2017 г.). Ч. 2. СПб.: ИЛИ РАН, 2019.

Глава в книге
Double-Blind Peer-Reviewing and Inclusiveness in Russian NLP Conferences

Kutuzov A. B., Никишина И. А.

In bk.: Analysis of Images, Social Networks and Texts. 8th International Conference, AIST 2019, Lecture Notes in Computer Science, Revised Selected Papers. Cham: Springer, 2019. P. 3-8.

Препринт
Length Of Constituent As A Relevant Factor In Russian Syntax

Letuchiy A.

Linguistics. WP BRP. НИУ ВШЭ, 2019. No. WP BRP 88/LNG/2019.

"Сильные доклады, прекрасные люди... и почти рождественская атмосфера"

Студенты магистерской программы "Компьютерная лингвистика" — об участии в международной конференции по интеллектуальным технологиям AINL FRUCT.

С 10 по 12 ноября студенты второго курса магистратуры школы лингвистики Анастасия Романова, Михаил Нефедов, Алена Феногенова и Оксана Дереза участвовали в международной конференции AINL FRUCT, проходившей в Санкт-Петербурге. Конференция была посвящена различным темам, связанным с современными интеллектуальными технологиями: анализом социальных сетей, речевыми технологиями, человеко-машинным взаимодействием, машинным обучением, автоматическим анализом и классификацией текстов. Наиболее популярным инструментом для решения задач были нейронные сети, о которых на конференции очень много и активно говорилось, проводились тюториалы, а участники делились своими наработками и знаниями этого метода.

 


Анастасия Романова

До самой конференции мы с Мишей участвовали в соревновании по определению парафраза для русского языка. Всем участникам было предложено два типа заданий: классификация на два класса (парафраз — непарафраз) и на три класса (парафраз - частичный парафраз - непарафраз). Были доступны два прогона: «стандартный», в котором система могла обучаться только на предоставленном организаторами корпусе, и «нестандартный», в котором можно было использовать любые другие данные. Так как прогоны оценивались отдельно, то в общей сложности было представлено четыре задания, в двух из которых мы одержали победу. Всех участников дорожки пригласили на конференцию для выступления на семинаре, посвященном автоматическому определению парафраза для русского языка.

 


Михиал Нефедов

В рамках данного семинара команды делились своими методами, инструментами и алгоритмами. Многих заинтересовало наше комплексное решение, в связи с чем мы получили большое количество дополнительных вопросов. С некоторыми участниками мы даже обменялись контактами для дальнейшего обсуждения текущей задачи, а также для совместной работы над другими.

 

 

Алена Феногенова

Этим летом я проходила практику от НИУ ВШЭ на предприятии НИИ КВАНТ. Сотрудничество получилось более чем плодотворным — мы разработали метод автоматического извлечения англицизмов в Интернете. Ведь в сетевых текстах огромное количество нестандартной лексики (сленг, жаргоны, англицизмы, неологизмы), которое комплексными системами (такими как морфологические, сентимент и синтаксический анализаторы) очень сложно обрабатывать. Необходим подход к лексической обработке, нормализации сетевых текстов, например, извлечению из них неологизмов. В работе мы исследовали англицизмы, разработали метод их автоматического нахождения, использовали технологии глубокого/глубинного обучения для данной задачи.

Тема конференции AINL очень удачно совпала с темой нашего метода, в результате чего нашу статью взяли, и мне удалось выступить и поделиться с научным сообществом нашей наработкой.

В целом, AINL оставил отличные впечатления, было множество сильных и интересных докладов, прекрасные люди, а Санкт-Петербург порадовал снежной, даже рождественской атмосферой.

 


Оксана Дереза 

Я участвовала в постерной сессии AINL, где было представлено семь работ на самые разнообразные темы: от автоматического извлечения корня слова до построения сети героев из произведений художественной литературы. Каждому участнику давалось по две минуты на краткую презентацию своей работы, после чего все желающие могли посмотреть постеры и задать их авторам вопросы. Этот блок был совмещен с фуршетом, так что дискуссии получились очень оживленными и доброжелательными. Мне удалось пообщаться как с коллегами из питерской Вышки, так и с московскими лингвистами.

Я рассказывала о своем лемматизаторе для древнеирландского языка, написанном в рамках прошлогодней курсовой работы. Древнеирландская орфография крайне вариативна, поэтому задача предсказания лемм для несловарных форм близка к спеллчекингу, и моя работа была в основном посвящена созданию алгоритма для отождествления несловарных форм со словарными на основе расстояния Дамерау-Левенштейна.

В постерной секции также участвовала студентка I курса школы лингвистики Татьяна Шаврина с демо-презентацией новых функций ГИКРЯ.