• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4

 

🧭 Как до нас добраться

 

Телефон: +7 (495) 772-95-90 доб. 22734

E-mail: ling@hse.ru

Руководство
Заместитель руководителя Ахапкина Яна Эмильевна

Редакторы сайта — Наталья Борисовна Пименова, Татьяна Борисовна Казакова, Максим Олегович Бажуков, Юлия Геннадьевна Бадрызлова

Книга
Proceedings of the 3rd Workshop on NLP Applications to Field Linguistics (Field Matters 2024)

Bangkok: Association for Computational Linguistics, 2024.

Глава в книге
Семантическое пространство названий профессий и особенности его языкового отражения

Фуфаева И. В., Згировская О. Г.

В кн.: Лингвистическая семантика в пространственном измерении: Словарь. Дискурс. Корпус. Екатеринбург: Кабинетный ученый, 2024. Гл. 5.3.. С. 259-272.

Препринт
Exploring the Effectiveness of Methods for Persona Extraction
В печати

Konstantin Zaitsev.

arxiv.org. Computer Science. Cornell University, 2024

Новые бакалаврские мастерские: от Яндекс.Навигатора до древненемецкого

В школе лингвистики прошла презентация очередного «сезона» бакалаврских мастерских. На выбор студентам были представлены 16 проектов — от пополнения лингвистических баз данных и создания электронных словарей до автоматизации загрузки дневников на сайт «Прожито» и совершенствования Яндекс.Навигатора.

Проектная работа — одна из ключевых особенностей обучения в школе лингвистики НИУ ВШЭ. Участие в разработке электронных ресурсов, сборе и обработке данных, совершенствовании различных приложений позволяет студентам не только пополнить запас лингвистических знаний и прикладных умений. Помимо этого участники мастерских получают опыт работы в настоящем «боевом» проекте, навыки командного взаимодействия и менеджмента, привыкают нести личную ответственность за результат.

В этом году студентам были представлены 16 проектов. Традиционно их спектр достаточно широк и охватывает как теоретическую, так и прикладную лингвистику, а в некоторых случаях выходит за пределы одной дисциплины.

Теоретическую часть спектра на этот раз представляли проекты по созданию базы данных исторических изменений XIX века, разработке методов автоматического сбора лексико-типологических данных, пополнению единой базы звуковых изменений (создана преподавателем школы Георгием Морозом), исследованию омофонии и омографии систем письменности в различных языках, обогащению типологического атласа языков Дагестана (разрабатывается сотрудниками Лаборатории языков Кавказа и участниками НУГ «Языки Дагестана»). Проекты по преобразованию в новый формат базы данных «Языки мира» и обновлению базы семантических переходов «DatSemShift» были представлены сотрудниками Института языкознания РАН, который является разработчиком обоих ресурсов.


Сотрудник Института языкознания РАН Вадим Дьячков представляет базу «Языки мира»

К прикладным проектам можно отнести участие в разработке лингвистического обеспечения для Яндекс.Навигатора (проект курирует сотрудник Яндекса), создание и пополнение электронных словарей НИУ ВШЭ (проект «Вышка.Словари»), разработку семантического анализатора для русского языка и учебного корпуса древненемецких текстов. 


Преподаватели Илья Чечуро и Эльмира Мустакимова представляют проект «Вышка.Словари»

В отдельную группу можно выделить проект, связанны  с автоматизацией загрузки оцифрованных дневников для ресурса «Прожито». Этот ресурс — пример успешного межсдисциплинарного сотрудничества исследователей из различных областей знания, в том числе и лингвистики, которую в команде «Прожито» представляет студентка магистратуры школы лингвистики и член Центра цифровых гуманитарных исследований НИУ ВШЭ Наташа Тышкевич.


Наташа Тышкевич и Михаил Мельниченко представляют проект «Прожито»

Сайт «Прожито» уже стал заметным явлением в русскоязычном Интернете, получил долю внимания медиа и исследовательского сообщества, привлек несколько сотен волонтеров к работе над оцифровкой письменных свидетельств прошедших эпох. 

 За два года работы мы сумели сделать корпус, где через расширенный поисковый интерфейс люди могут работать не только с конкретными дневниками, но и со всем массивом текстов эпохи. Например, посмотреть по тому или иному ключевому слову, что записано в личных дневниках жителей Киева 1 сентября 1939 года…

Михаил Мельниченко
Историк, основатель проекта «Прожито»  

В результате сейчас команда не справляется с потоком данных и ищет возможности для автоматизации процесса, для чего и будут привлечены студенты школы лингвистики. 


Историк Михаил Мельниченко представляет проект «Прожито»

После выбора мастерской студенты встречаются с кураторами и совместно разрабатывают план работы. Участие в проектах рассчитано на полугодовой цикл, в конце которого происходит представление результатов мастерских. Кроме того регулярной практикой является выступление с промежуточными итогами проектной работы на научных конференциях и подготовка публикаций.