• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4

Как до нас добраться

Телефон: +7 (495) 772-95-90 *22734

E-mail: ling@hse.ru

Руководство

Руководитель Рахилина Екатерина Владимировна

Заместитель руководителя Ахапкина Яна Эмильевна

Digital Humanities

участвуют:
доценты школы лингвистики Б.В.Орехов, А.А. Бонч-Осмоловская,
аспирант школы лингвистики Д. Скоринкин
студенты: М.Картышева, Е.Сидорова, Е.Можаев, М.Колбасов, Л.Полянская

Digital Humanities - область, которая чрезвычайно интенсивно развивается на западе, но пока что мало представлена в России.
Основными задачи и идеи электронные гуманитарных наук состоят в следующем:

- перевод в электронный машиночитаемый формат источников, связанных с культурным наследием 
Это значит не просто оцифровка, но сохранение всех  метаданных в таком формате, чтобы эти метаданные могли бы обработаны и извлечены автоматически, а также создание специализированных баз данных и корпусов

- семантическая разметка значимых элементов
Семантическая разметка осуществляется с помощью специальных языков. Наиболее известным из них является язык TEI, предоставляющий безграничные возможности для сохранения информации, сопровождающей текст.  

- квантитативный анализ художественных текстов
Идеи структуралистов 60х годов получили принципиально новое развитие, благодаря появлению компьютерных технология анализа лингвистических данных и корпусов. Одним из ключевых концептом такого анализа является идея Distant Reading -  удаленного чтения, введенного Franco Moretti из Stanford Literary Lab

- популяризация гуманитарного знания через визуализации и разработку электронных продуктов
Открытость, доступность, понятность - один из основных принципов Digital Humanities  как  академического сообщества. Новые технологии дают возможность широкого доступа к культурному наследию, а также вовлечения самого широких кругов пользовалелей в тематику проектов

 Семантическая публикация 90-томного собрания сочинений Л.Н. Толстого 

Работа над элекронным семантическим изданием ПСС Л.Н.Толстого проводится сотрудниками и студентами школы лингвистики в рамках исследовательского проекта, поддержанного РФФИ (грант № 15-06-99523А). Цель проекта состоит в проектировании, разработке и реализации семантической разметки электронной публикации полного собрания сочинений Толстого. Семантическая разметка является современным способом сопровождения текста метаданными разных типов, а также связывания выделенных элементов текста с друг другом и с другими документами. Ключевое требование к семантической разметке состоит в ее машиночитаемости и соответствии ее формата общепринятым стандартам, прежде всего стандарту Text Encoding Initative (TEI).

Основная задача семантической разметки электронной публикации наследия Толстого состоит в воспроизведении на новом технологическом уровне метатекстовой информации, критического аппарата, комментариев и указателей, сопровождающих 90-томное полное собрание сочинений Толстого. Таким образом, читатели получат доступ не только к самому тексту Толстого, но и к необходимому для   его более глубокого понимания филологическому  научному аппарату. Не меньшую ценность ресурс будет представлять для исследователей, являясь своего рода электронной информационной базой данных, сопровождающей и структурирующей Толстовское наследие. Семантическая разметка дает возможность для неограниченного расширения связанного с документом контента, добавления библиографии, связывания конкретных элементов текста с комментариями или любыми другими текстами, в том числе и на других языках. 

Таким образом, семантическая публикация представляет собой наиболее современную технологическую платформу для глубокого филологического анализа.  Наконец, очень важной характеристикой выбранного подхода является то, что стандартная семантическая разметка совместима с множеством современных технологий, позволяющих создавать совершенно новые мультимедийные и инфографические продукты, которые вне всякого сомнения будут служить популяризации наследия Л.Н. Толстого. Побочным результатом проекта станет открытая библиотека утилит и программ, применимых для задач семантической разметки, которая заложит основу для последующих семантических публикаций научных собраний сочинений русских писателей и поэтов. Одним из первых таких продуктов стал разработанный студентами магистратуры по компьютерной лингвистике Еленой Сидоровой и Марией Картышевой транслитератор из старой орфографии в новую.

 Презентация проекта на конференции Диалог 2014 (PPTX, 2.68 Мб)



ВИДЕО сотрудников Школы лингвистики и приглашенных преподавателей:

Статьи:


2018

Skorinkin D., Fischer F., Palchikov G. Building a Corpus for the Quantitative Research of Russian Drama: Composition, Structure, Case Studies, in: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 30 мая — 2 июня 2018 г.) / Под общ. ред.: В. Селегей, И. М. Кобозева, Т. Е. Янко, И. Богуславский, Л. Л. Иомдин, М. А. Кронгауз, А. Ч. Пиперски. Вып. 17(24). М. : Издательский центр «Российский государственный гуманитарный университет», 2018. P. 662-682.

Schmunk S., Fischer F., Blümm M., Horstmann W. Interoperabel und partizipativ, in: Digitale Infrastrukturen für die germanistische Forschung. Berlin, Boston : De Gruyter, 2018. P. 53-72.

Бонч-Осмоловская А. А., Нестеренко Л. В. Сети как инструмент поиска и находок в мультиязычных параллельных корпусах // В кн.: ЕВРика! Сборник статей о поисках и находках к юбилею Е. В. Рахилиной / Под общ. ред.: Д. А. Рыжова, Б. В. Орехов, Н. Р. Добрушина, Т. И. Резникова, А. А. Бонч-Осмоловская, А. С. Выренкова, М. В. Кюсева. М. : Лабиринт, 2018.

Бонч-Осмоловская А. А. Имена времени: эпитеты десятилетий в Национальном корпусе русского языка как проекция культурной памяти // Шаги/Steps. 2018. № 4. С. 115-146.

Орехов Б. В., Успенский П. Ф. // Гальванизация автора, или эксперимент с нейронной поэзией. Новый мир. 2018. № 6. С. 139-158.

Скоринкин Д. А. Модель семантической разметки художественного текста для цифровых исследований в филологии //  Естественнонаучные методы в цифровой гуманитарной среде: Материалы всероссийской научной конференции с международным участием (г. Пермь, 15–18 мая 2018 г.). Пермь: ПГНИУ, 2018. С. 107-111.

Skorinkin D. Extracting Character Networks to Explore Literary Plot Dynamics, in: Компьютерная лингвистика и интеллектуальные технологии: По мате­риалам ежегодной международной конференции «Диалог» (Москва, 31 мая — 3 июня 2017 г.). Вып. 16 (23): В 2 т. / Науч. ред.: В. Селегей. Т. 1. М. : Изд-во РГГУ, 2017. P. 257-270.

2017

Скоринкин Д. А., Бонч-Осмоловская А. А. «Особые приметы» в речи художественных персонажей: количественный анализ диалогов в «Войне и мире» Л. Н. Толстого // Электронный научно-образовательный журнал "История". 2017. Т. 7. № 7. 

Skorinkin D. Extracting Character Networks to Explore Literary Plot Dynamics, in: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 31 мая — 3 июня 2017 г.). Вып. 16 (23): В 2 т. / Науч. ред.: В. Селегей. Т. 1. М. : Изд-во РГГУ, 2017. P. 257-270.

2016

Fischer F. , Göbel M., Kampkaspar D., Trilcke P.  Theatre Plays as ‘Small Worlds’? Network Data on the History and Typology of German Drama, 1730–1930 , in:  Digital Humanities 2016. Conference Abstracts (Jagiellonian University & Pedagogical University, Kraków, 11–16 July 2016). Kraków :, 2016. P. 385-387.

Skorinkin D., Bonch-Osmolovskaya A. Text mining War and Peace: Automatic extraction of character traits from literary pieces // Digital Scholarship in the Humanities. 2016 

Skorinkin D., Можаев Е. А. TEI markup for the 90-volume edition of Leo Tolstoy’s complete works, in: TEI Conference and Members’ Meeting 2016 Book of Abstracts. Wien : Austrian Centre for Digital Humanities, 2016. P. 107-109.

2015

Skorinkin D., Bonch-Osmolovskaya A. A. Automatic semantic tagging of Leo Tolstoy’s works, in: DH 2015 Global Digital Humanities Conference Abstracts., 2015.

Bonch-Osmolovskaya A. A., Kolbasov M. Tolstoy digital: Mining biographical data in literary heritage editions, in: 1st Conference on Biographical Data in a Digital World 2015, BD 2015; Amsterdam; Netherlands; 9 April 2015. Амстердам : CEUR-WS.org, 2015. P. 48-52. 

Бонч-Осмоловская А. А. Культуромика в национальном корпусе русского языка, к постановке задачи: три века русских дорог. // Труды института русского языка им. В.В. Виноградова. 2015. Т. 4. № 6. С. 605-641.

Книги

Leo philologiae. Фестшрифт в честь 70-летия Льва Иосифовича Соболева / Под общ. ред.: А. А. Бонч-Осмоловская, М. А. Кучерская, К. М. Поливанов, А. А. Зубов, Майофис Мария Львовна. М. : [б.и.], 2016.

ГРАНТЫ:

Поддержанные заявки по конкурсу индивидуальных исследовательских проектов 2016/2017 гг.

Бонч-Осмоловская Анастасия Александровна. Средние данные в гуманитарных исследованиях (Medium data for humanities) (16-01-0109).

Гранты РФФИ

Грант 15-06-99523 «Семантическая публикация полного собрания сочинений Л.Н.Толстого: модель, технологии и реализация»

УЧЕБНЫЕ КУРСЫ по теме исследований
(бакалавриат):

Научно-исследовательский семинар «Теория стиха»

 

По выбору; 2-й курс, 3, 4 модуль

 

УЧЕБНЫЕ КУРСЫ по теме исследований (магистратура):

Магистерская программа «Компьютерная лингвистика»

Гуманитарные науки в цифровую эпоху

По выбору; 2-й курс, 1, 2 модуль

SocialNetworks

По выбору; английский; 2-й курс, 1, 2 модуль

Магистерская программа «Цифровые методы в гуманитарных науках»

https://ling.hse.ru/Projects_DigHum