Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.
Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4
Телефон: +7 (495) 772-95-90 доб. 22734
E-mail: ling@hse.ru
Редакторы сайта — Наталья Борисовна Пименова, Татьяна Борисовна Казакова, Максим Олегович Бажуков, Юлия Геннадьевна Бадрызлова
Школа лингвистики была образована в декабре 2014 года. Сотрудники школы преподают на образовательных программах по теоретической и компьютерной лингвистике в бакалавриате и магистратуре. Лингвистика, которой занимаются в школе, — это не только знание иностранных языков, но прежде всего наука о языке и о способах его моделирования. Научные группы школы занимаются исследованиями в области типологии, социолингвистики и ареальной лингвистики, корпусной лингвистики и лексикографии, древних языков и истории языка. Кроме того, в школе создаются лингвистические технологии и ресурсы: корпуса, обучающие тренажеры, словари и тезаурусы, технологии для электронного представления текстов культурного наследия.
Bangkok: Association for Computational Linguistics, 2024.
Драгичевич Р., Королькова М. Д., Рыжова Д. А. и др.
Вопросы лексикографии. 2024. № 3. С. 43-60.
Afanasev I., Lyashevskaya O.
In bk.: Structuring Lexical Data and Digitising Dictionaries: Grammatical Theory, Language Processing and Databases in Historical Linguistics. Leiden; Boston: Brill, 2024. P. 13-35.
arxiv.org. Computer Science. Cornell University, 2024
Участниками воркшопа стали преподаватели, аспиранты (PhD students) и студенты магистратуры Вюрцбургского университета. Большинство из них входят в так называемую группу молодых исследователей (junior researh group, аналог НУГов в Вышке), занимающуюся компьютерными методами в литературоведении.
Центральными темами воркшопа стали извлечение упоминаний персонажей и связей между ними из художественных текстов, визуализация получившихся соцсетей (графов) и различные статистические метрики, применимые к этим сетям. В частности, участники научились работать в программе для визуализации графов Gephi и попрактиковались с подсчетом статистики с помощью библиотеки NetworkX для языка Python.
Большим плюсом стало наличие у многих участников воркшопа готовых высококачественных данных, извлеченных из корпусов художественных текстов. Благодаря этому удалось опробовать вышеупомянутые инструменты на настоящих данных, построить графы и измерить центральности для персонажей нескольких сотен европейских романов XIX века. Так, например, выглядит соцсеть для основных героев "Анны Карениной" (размер узла пропорционален его степени):