Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4
Телефон: +7 (495) 772-95-90 доб. 22734
E-mail: ling@hse.ru
Редакторы сайта — Наталья Борисовна Пименова, Максим Олегович Бажуков, Константин Евгеньевич Сатдаров
Школа лингвистики была образована в декабре 2014 года. Сотрудники школы преподают на образовательных программах по теоретической и компьютерной лингвистике в бакалавриате и магистратуре. Лингвистика, которой занимаются в школе, — это не только знание иностранных языков, но прежде всего наука о языке и о способах его моделирования. Научные группы школы занимаются исследованиями в области типологии, социолингвистики и ареальной лингвистики, корпусной лингвистики и лексикографии, древних языков и истории языка. Кроме того, в школе создаются лингвистические технологии и ресурсы: корпуса, обучающие тренажеры, словари и тезаурусы, технологии для электронного представления текстов культурного наследия.
Apresyan V., Orlov A., Koncha K. et al.
Metaphor and Symbol. 2026. Vol. 41. No. 1. P. 5-38.
Марченко И. А., Ронько Р. В.
В кн.: Исследования по славянской диалектологии. Выпуск 25. Т. 25. М.: Институт славяноведения РАН, 2025. Гл. 5. С. 236-260.
arxiv.org. Computer Science. Cornell University, 2024

16 октября студенты магистерской программы Школы лингвистики «Цифровые методы в гуманитарных науках» встретились с руководителями ключевых партнерских организаций — Российской государственной библиотеки (РГБ) и Главного информационно-вычислительного центра (ГИВЦ) Министерства культуры РФ. Встреча прошла в рамках проектно-исследовательского семинара, где студенты получают практические навыки разработки цифровых гуманитарных ресурсов.
Проектно-исследовательские семинары являются важной частью программы ЦМГН, их цель — дать студентам опыт командной работы над реальными задачами, научить формулировать и решать исследовательские и прикладные проблемы, создавать продукты на стыке гуманитарных наук и IT.
Первым выступил Намиг Керимов, директор департамента искусственного интеллекта РГБ. Он рассказал о масштабных планах библиотеки по цифровизации фондов и внедрению в процессы ИИ. Студенты узнали о разработке и запуске собственной большой языковой модели (LLM) и перспективах ее использования.
Среди проектов, над которыми студенты могут работать в рамках ПИС, были задачи по применению LLM, VLM (Visual Language Model) и MLLM (Multimodal Large Language Model) для обработки библиографических записей, каталогизации, поиска и дедупликации книг.
Также были представлены амбициозные идеи по созданию «Библиотечного Shazam» для поиска по аудио фрагментам и системы автоматической маркировки контента, требующего возрастных и иных ограничений.
Затем Игорь Старков, руководитель управления цифрового развития Главного информационно-вычислительного центра Министерства культуры РФ, и его коллеги представили цифровые продукты и сервисы, которые ГИВЦ разрабатывает и предоставляет государственным учреждениям культуры по всей стране.
Они рассказали о текущих проектах, включая разработку инструментов для аналитики в сфере культуры. Студентам были предложены конкретные проектные задачи на стыке анализа данных и машинного обучения: создание инструмента для детекции доли ИИ-сгенерированного контента в больших текстовых массивах (например, книжных коллекциях) и разработка модели для прогнозирования музыкальных трендов на основе данных стриминговых площадок и других характеристик.
Встреча вызвала живой интерес у магистрантов, дав им возможность не только познакомиться с потенциальными проектами задачами, но и обсудить с экспертами практические аспекты применения цифровых методов в гуманитарной сфере. Подобные мероприятия — неотъемлемая часть программы, позволяющая будущим специалистам по Digital Humanities понимать реальные потребности отрасли и готовиться к решению актуальных задач на стыке культуры и технологий.