• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4

 

🧭 Как до нас добраться

 

Телефон: +7 (495) 772-95-90 доб. 22734

E-mail: ling@hse.ru

Руководство
Заместитель руководителя Ахапкина Яна Эмильевна

Редакторы сайта — Наталья Борисовна Пименова, Татьяна Борисовна Казакова, Максим Олегович Бажуков, Юлия Геннадьевна Бадрызлова

Книга
Proceedings of the 3rd Workshop on NLP Applications to Field Linguistics (Field Matters 2024)

Bangkok: Association for Computational Linguistics, 2024.

Глава в книге
String Similarity Measures for Evaluating the Lemmatisation in Old Church Slavonic

Afanasev I., Lyashevskaya O.

In bk.: Structuring Lexical Data and Digitising Dictionaries: Grammatical Theory, Language Processing and Databases in Historical Linguistics. Leiden; Boston: Brill, 2024. P. 13-35.

Препринт
Exploring the Effectiveness of Methods for Persona Extraction
В печати

Konstantin Zaitsev.

arxiv.org. Computer Science. Cornell University, 2024

"Сильные доклады, прекрасные люди... и почти рождественская атмосфера"

Студенты магистерской программы "Компьютерная лингвистика" — об участии в международной конференции по интеллектуальным технологиям AINL FRUCT.

С 10 по 12 ноября студенты второго курса магистратуры школы лингвистики Анастасия Романова, Михаил Нефедов, Алена Феногенова и Оксана Дереза участвовали в международной конференции AINL FRUCT, проходившей в Санкт-Петербурге. Конференция была посвящена различным темам, связанным с современными интеллектуальными технологиями: анализом социальных сетей, речевыми технологиями, человеко-машинным взаимодействием, машинным обучением, автоматическим анализом и классификацией текстов. Наиболее популярным инструментом для решения задач были нейронные сети, о которых на конференции очень много и активно говорилось, проводились тюториалы, а участники делились своими наработками и знаниями этого метода.

 


Анастасия Романова

До самой конференции мы с Мишей участвовали в соревновании по определению парафраза для русского языка. Всем участникам было предложено два типа заданий: классификация на два класса (парафраз — непарафраз) и на три класса (парафраз - частичный парафраз - непарафраз). Были доступны два прогона: «стандартный», в котором система могла обучаться только на предоставленном организаторами корпусе, и «нестандартный», в котором можно было использовать любые другие данные. Так как прогоны оценивались отдельно, то в общей сложности было представлено четыре задания, в двух из которых мы одержали победу. Всех участников дорожки пригласили на конференцию для выступления на семинаре, посвященном автоматическому определению парафраза для русского языка.

 


Михиал Нефедов

В рамках данного семинара команды делились своими методами, инструментами и алгоритмами. Многих заинтересовало наше комплексное решение, в связи с чем мы получили большое количество дополнительных вопросов. С некоторыми участниками мы даже обменялись контактами для дальнейшего обсуждения текущей задачи, а также для совместной работы над другими.

 

 

Алена Феногенова

Этим летом я проходила практику от НИУ ВШЭ на предприятии НИИ КВАНТ. Сотрудничество получилось более чем плодотворным — мы разработали метод автоматического извлечения англицизмов в Интернете. Ведь в сетевых текстах огромное количество нестандартной лексики (сленг, жаргоны, англицизмы, неологизмы), которое комплексными системами (такими как морфологические, сентимент и синтаксический анализаторы) очень сложно обрабатывать. Необходим подход к лексической обработке, нормализации сетевых текстов, например, извлечению из них неологизмов. В работе мы исследовали англицизмы, разработали метод их автоматического нахождения, использовали технологии глубокого/глубинного обучения для данной задачи.

Тема конференции AINL очень удачно совпала с темой нашего метода, в результате чего нашу статью взяли, и мне удалось выступить и поделиться с научным сообществом нашей наработкой.

В целом, AINL оставил отличные впечатления, было множество сильных и интересных докладов, прекрасные люди, а Санкт-Петербург порадовал снежной, даже рождественской атмосферой.

 


Оксана Дереза 

Я участвовала в постерной сессии AINL, где было представлено семь работ на самые разнообразные темы: от автоматического извлечения корня слова до построения сети героев из произведений художественной литературы. Каждому участнику давалось по две минуты на краткую презентацию своей работы, после чего все желающие могли посмотреть постеры и задать их авторам вопросы. Этот блок был совмещен с фуршетом, так что дискуссии получились очень оживленными и доброжелательными. Мне удалось пообщаться как с коллегами из питерской Вышки, так и с московскими лингвистами.

Я рассказывала о своем лемматизаторе для древнеирландского языка, написанном в рамках прошлогодней курсовой работы. Древнеирландская орфография крайне вариативна, поэтому задача предсказания лемм для несловарных форм близка к спеллчекингу, и моя работа была в основном посвящена созданию алгоритма для отождествления несловарных форм со словарными на основе расстояния Дамерау-Левенштейна.

В постерной секции также участвовала студентка I курса школы лингвистики Татьяна Шаврина с демо-презентацией новых функций ГИКРЯ.