Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4
Телефон: +7 (495) 772-95-90 доб. 22734
E-mail: ling@hse.ru
Редакторы сайта — Наталья Борисовна Пименова, Максим Олегович Бажуков, Константин Евгеньевич Сатдаров
Школа лингвистики была образована в декабре 2014 года. Сотрудники школы преподают на образовательных программах по теоретической и компьютерной лингвистике в бакалавриате и магистратуре. Лингвистика, которой занимаются в школе, — это не только знание иностранных языков, но прежде всего наука о языке и о способах его моделирования. Научные группы школы занимаются исследованиями в области типологии, социолингвистики и ареальной лингвистики, корпусной лингвистики и лексикографии, древних языков и истории языка. Кроме того, в школе создаются лингвистические технологии и ресурсы: корпуса, обучающие тренажеры, словари и тезаурусы, технологии для электронного представления текстов культурного наследия.
Земичева С. С., Мороз Г. А., Наккарато М. К.
Вопросы языкознания. 2025. № 6. С. 7-34.
В кн.: Парад цифровых гуманитарных проектов. Красноярск: Сибирский федеральный университет, 2025. С. 34-40.
arxiv.org. Computer Science. Cornell University, 2024

С 2016 года на Колмогоровском семинаре по компьютерной лингвистике ежегодно встречаются, делают доклады и обмениваются опытом студенты и сотрудники как ВШЭ, так и других университетов, а также ведущие специалисты-практики в области компьютерной лингвистики. В этом году приглашёнными докладчиками были Валентин Малых (Huawei) и Борис Галицкий (НИУ ВШЭ, Oracle Inc.).
Валентин Малых рассказал об основных направлениях исследований лаборатории Noah's Ark компании Huawei. Участники семинара узнали, чем занимается лаборатория и в каких людях она заинтересована. А после Валентин представил проект “SumTitles: a Summarization Dataset with Low Extractiveness”. Идея заключается в том, чтобы автоматически создавать саммари обсуждений в чатах или комментариях — это позволит быстро получить самую важную информацию, не вникая в каждое из множества сообщений.
Борис Галицкий, работник Oracle и ассоциированный сотрудник Международной лаборатории интеллектуальных систем и структурного анализа, выступил с докладом “Discourse Trees for Dialogue Management”. Он рассказал о принципе работы “persistent chat-bot”, помогающего пользователю в форме диалога последовательно изучать ту или иную информацию сколь угодно долго и подробно до тех пор, пока у него совсем не останется вопросов. Главное преимущество бота состоит в том, что развитие диалога основывается не на семантике слов, а на структуре автоматически создаваемого дискурсивного дерева, по которому “продвигается” общение.
В семинаре также приняли участие два аспиранта Школы лингвистики. Иван Смирнов рассказал о системе автоматического исправления словообразовательных ошибок в текстах студентов, изучающих русский как иностранный, а Амир Бакаров представил доклад "Лингвистическая репрезентативность эмбеддингов слов".
В других докладах поднимались темы методов компьютерной обработки так называемых “low-resource languages”, исследования лингвистических моделей, методов классификации текстовых материалов, и много других увлекательных и пока не изведанных тем.
Записи всех докладов и презентации скоро будут доступны на странице семинара.