• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4

 

🧭 Как до нас добраться

 

Телефон: +7 (495) 772-95-90 доб. 22734

E-mail: ling@hse.ru

Руководство
Заместитель руководителя Ахапкина Яна Эмильевна

Редакторы сайта — Наталья Борисовна Пименова, Татьяна Борисовна Казакова, Максим Олегович Бажуков, Юлия Геннадьевна Бадрызлова

Книга
Proceedings of the 3rd Workshop on NLP Applications to Field Linguistics (Field Matters 2024)

Bangkok: Association for Computational Linguistics, 2024.

Статья
Новый большой сербско-русский словарь (общая концепция и проблемы лексикографического описания)

Драгичевич Р., Королькова М. Д., Рыжова Д. А. и др.

Вопросы лексикографии. 2024. № 3. С. 43-60.

Глава в книге
String Similarity Measures for Evaluating the Lemmatisation in Old Church Slavonic

Afanasev I., Lyashevskaya O.

In bk.: Structuring Lexical Data and Digitising Dictionaries: Grammatical Theory, Language Processing and Databases in Historical Linguistics. Leiden; Boston: Brill, 2024. P. 13-35.

Препринт
Exploring the Effectiveness of Methods for Persona Extraction
В печати

Konstantin Zaitsev.

arxiv.org. Computer Science. Cornell University, 2024

Соцсети Анны Карениной: преподаватели школы лингвистики провели воркшоп в Университете Вюрцбурга

Вюрцбургский университет Юлиуса – Максимилиана, один из старейших в Германии, пригласил преподавателей школы лингвистики Франка Фишера и Даниила Скоринкина провести трехдневный воркшоп по анализу соцсетей в художественных текстах.

Участниками воркшопа стали преподаватели, аспиранты (PhD students) и студенты магистратуры Вюрцбургского университета. Большинство из них входят в так называемую группу молодых исследователей (junior researh group, аналог НУГов в Вышке), занимающуюся компьютерными методами в литературоведении.

Центральными темами воркшопа стали извлечение упоминаний персонажей и связей между ними из художественных текстов, визуализация получившихся соцсетей (графов) и различные статистические метрики, применимые к этим сетям. В частности, участники научились работать в программе для визуализации графов Gephi и попрактиковались с подсчетом статистики с помощью библиотеки NetworkX для языка Python.

Большим плюсом стало наличие у многих участников воркшопа готовых высококачественных данных, извлеченных из корпусов художественных текстов. Благодаря этому удалось опробовать вышеупомянутые инструменты на настоящих данных, построить графы и измерить центральности для персонажей нескольких сотен европейских романов XIX века. Так, например, выглядит соцсеть для основных героев "Анны Карениной" (размер узла пропорционален его степени):