• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Программа школы

5 лекций, посвященные ключевым темам современной цифровой филологии

  • Роман Лейбов,  Тартуский университет, «Как и зачем измерять культурную память?»
  • Олег  Собчук, Артем Шеля, Тартуский университет, «Культурная эволюция и дальнее чтение: новая теория для новых методов»
  • Анастасия Бонч-Осмоловская, Школа лингвистики НИУ ВШЭ, «Что такое академическое издание в цифровую эпоху?»
  • Франк Фишер, Школа лингвистики НИУ ВШЭ, «Сетевой анализ драматических текстов»
  • Борис Орехов, Школа лингвистики НИУ ВШЭ, Майя Стравинская, группа Tolstoy Digital, «Визуализация текста как прием: исследовательские возможности инфографики»

5 тьюториалов, посвященных работе с филологическими данными

Олег Собчук, Артем Шеля

«Литературоведы против роботов: измеряя эволюцию поэзии в longue duree»

Как количественные данные, полученные в доцифровую эпоху, можно использовать сейчас? Что такое “репрезентативность выборки” в литературе и есть ли она? На воркшопе предлагается проверить некоторые выводы М.Л. Гаспарова о развитии русских поэтических форм XVIII - XX вв. с помощью поэтического подкорпуса НКРЯ и заставить корпус выдать больше информации, чем он умеет. В работе мы пройдем все этапы современного проекта по количественному литературоведению: от начальных гипотез – через создание и анализ базы данных – к визуализации полученных результатов.

Даниил Скоринкин, ABBYY

«Социальные сети классических произведений/ Строим соцсети по классике»

Персонажи классических романов и пьес не френдили друг друга в Facebook, но это не значит, что у  них не было социальных сетей. Герои “Гамлета” и “Ромео и Джульеты”, “Горя от ума” и “Евгения Онегина”,  “Войны и мира” и “Анны Карениной” - все они встречаются, разговаривают, сражаются и влюбляются друг в друга, выстраиваясь внутри этих произведений в сложные сетевые структуры. Анализ таких структур методами теории графов позволяет выявить неожиданные и неочевидные при чтении закономерности. Превращая роман или пьесу в граф, мы можем понять, какие “второстепенные” на первый взгляд герои на самом деле связывают текст воедино, без кого все главные персонажи теряют “контакт” друг с другом  а также преобразить “время” произведения в пространство на плоскости и охватить взглядом сюжет от начала до конца.

Роман Лейбов, Анастасия Бонч-Осмоловская

«Ключевые мотивы “наивной поэзии”»

Материалом для тьюториала будет служить гигантский поэтический корпус ресурса stihi.ru, на котором любой желающий может разместить свои стихи. Наша задача состоит в том, чтобы не читая отдельных текстов (прочесть их все невозможно), определить характерные черты “наивной поэзии”, а именно то, каким образом устроен “любительский” поэтический текст, на какие жанровые и стилистические образцы ориентируются авторы, что для них является признаками поэтического текста. Для исследования этих вопросов мы будем использовать алгоритмы тематического  моделирования, с помощью которых мы выделим кластеры похожих текстов. А дальше будем смотреть на повторяющиеся поэтические шаблоны, устойчивые лексические связи, доминантные рифмы и др. Работа с этим набором данных может рассматриваться как опытная площадка для последующего переформатирования поэтического подкорпуса НКРЯ.

Борис Орехов

«Дисперсионный анализ и Железный трон: что предскажет статистика в Вестеросе?»

Тьюториал будет посвящен тому, как с помощью анализа данных извлечь закономерности из текста «Песни льда и огня» Джорджа Мартина, как от этих закономерностей перейти на уровень поэтики и можно ли узнать, кто из персонажей умрет раньше.

Мария Левченко, РГПУ им. Герцена

«Как посчитать поэтику?»

На основе корпуса русских поэтических текстов начала ХХ века мы выясним, что дает дистрибутивная семантика в применении к анализу поэтических текстов: что можно узнать, посчитав и сравнив межсловные расстояния? Как контекстная мера близости определяет жанровые различия в текстах? Почему лошадь и конь в НКРЯ — это почти одно и то же, а в поэтическом корпусе — далекие друг от друга слова? Можно ли построить мотивный анализ русской поэзии на основании векторной семантической модели?