Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4
Телефон: +7 (495) 772-95-90 доб. 22734
E-mail: ling@hse.ru
Редакторы сайта — Наталья Борисовна Пименова, Максим Олегович Бажуков, Константин Евгеньевич Сатдаров
Школа лингвистики была образована в декабре 2014 года. Сотрудники школы преподают на образовательных программах по теоретической и компьютерной лингвистике в бакалавриате и магистратуре. Лингвистика, которой занимаются в школе, — это не только знание иностранных языков, но прежде всего наука о языке и о способах его моделирования. Научные группы школы занимаются исследованиями в области типологии, социолингвистики и ареальной лингвистики, корпусной лингвистики и лексикографии, древних языков и истории языка. Кроме того, в школе создаются лингвистические технологии и ресурсы: корпуса, обучающие тренажеры, словари и тезаурусы, технологии для электронного представления текстов культурного наследия.
Зибер И. А., Стенин И. А., Старченко А. М. и др.
М.: Буки Веди, 2025.
Цифровые гуманитарные исследования. 2025. № 1. С. 60-69.
Daria I., Konstantin Zaitsev, Olga S.
In bk.: CLEF 2025 Working Notes. Vol. 4038. CEUR Workshop Proceedings, 2025.
arxiv.org. Computer Science. Cornell University, 2024
Проектная работа — одна из ключевых особенностей обучения в школе лингвистики НИУ ВШЭ. Участие в разработке электронных ресурсов, сборе и обработке данных, совершенствовании различных приложений позволяет студентам не только пополнить запас лингвистических знаний и прикладных умений. Помимо этого участники мастерских получают опыт работы в настоящем «боевом» проекте, навыки командного взаимодействия и менеджмента, привыкают нести личную ответственность за результат.
В этом году студентам были представлены 16 проектов. Традиционно их спектр достаточно широк и охватывает как теоретическую, так и прикладную лингвистику, а в некоторых случаях выходит за пределы одной дисциплины.
Теоретическую часть спектра на этот раз представляли проекты по созданию базы данных исторических изменений XIX века, разработке методов автоматического сбора лексико-типологических данных, пополнению единой базы звуковых изменений (создана преподавателем школы Георгием Морозом), исследованию омофонии и омографии систем письменности в различных языках, обогащению типологического атласа языков Дагестана (разрабатывается сотрудниками Лаборатории языков Кавказа и участниками НУГ «Языки Дагестана»). Проекты по преобразованию в новый формат базы данных «Языки мира» и обновлению базы семантических переходов «DatSemShift» были представлены сотрудниками Института языкознания РАН, который является разработчиком обоих ресурсов.
Сотрудник Института языкознания РАН Вадим Дьячков представляет базу «Языки мира»
К прикладным проектам можно отнести участие в разработке лингвистического обеспечения для Яндекс.Навигатора (проект курирует сотрудник Яндекса), создание и пополнение электронных словарей НИУ ВШЭ (проект «Вышка.Словари»), разработку семантического анализатора для русского языка и учебного корпуса древненемецких текстов.
Преподаватели Илья Чечуро и Эльмира Мустакимова представляют проект «Вышка.Словари»
В отдельную группу можно выделить проект, связанны с автоматизацией загрузки оцифрованных дневников для ресурса «Прожито». Этот ресурс — пример успешного межсдисциплинарного сотрудничества исследователей из различных областей знания, в том числе и лингвистики, которую в команде «Прожито» представляет студентка магистратуры школы лингвистики и член Центра цифровых гуманитарных исследований НИУ ВШЭ Наташа Тышкевич.
Наташа Тышкевич и Михаил Мельниченко представляют проект «Прожито»
Сайт «Прожито» уже стал заметным явлением в русскоязычном Интернете, получил долю внимания медиа и исследовательского сообщества, привлек несколько сотен волонтеров к работе над оцифровкой письменных свидетельств прошедших эпох.
За два года работы мы сумели сделать корпус, где через расширенный поисковый интерфейс люди могут работать не только с конкретными дневниками, но и со всем массивом текстов эпохи. Например, посмотреть по тому или иному ключевому слову, что записано в личных дневниках жителей Киева 1 сентября 1939 года…
В результате сейчас команда не справляется с потоком данных и ищет возможности для автоматизации процесса, для чего и будут привлечены студенты школы лингвистики.
Историк Михаил Мельниченко представляет проект «Прожито»
После выбора мастерской студенты встречаются с кураторами и совместно разрабатывают план работы. Участие в проектах рассчитано на полугодовой цикл, в конце которого происходит представление результатов мастерских. Кроме того регулярной практикой является выступление с промежуточными итогами проектной работы на научных конференциях и подготовка публикаций.
Михаил Мельниченко
Историк, основатель проекта «Прожито»