• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4

Как до нас добраться

 

Телефон: +7 (495) 772-95-90 доб. 22734

E-mail: ling@hse.ru

По вопросам, связанным с сайтом: portalhseling@gmail.com

Руководство
Заместитель руководителя Ахапкина Яна Эмильевна
Книга
Proceedings of Third Workshop "Computational linguistics and language science",

Wohlgenannt G., von Waldenfels R., Toldova S. et al.

Iss. 4. EasyChair, 2019.

Статья
Нейрошағир

Orekhov B.

Ватандаш. 2019. No. 2. P. 136-139.

Глава в книге
Genre Classification Problem: in Pursuit of Systematics on a Big Webcorpus

Shavrina T.

In bk.: Proceedings of Third Workshop "Computational linguistics and language science",. Iss. 4. EasyChair, 2019. P. 70-83.

Digital Humanities

участвуют:
доценты школы лингвистики Б.В.Орехов, А.А. Бонч-Осмоловская,
аспирант школы лингвистики Д. Скоринкин
студенты: М.Картышева, Е.Сидорова, Е.Можаев, М.Колбасов, Л.Полянская

Digital Humanities - область, которая чрезвычайно интенсивно развивается на западе, но пока что мало представлена в России.
Основными задачи и идеи электронные гуманитарных наук состоят в следующем:

- перевод в электронный машиночитаемый формат источников, связанных с культурным наследием 
Это значит не просто оцифровка, но сохранение всех  метаданных в таком формате, чтобы эти метаданные могли бы обработаны и извлечены автоматически, а также создание специализированных баз данных и корпусов

- семантическая разметка значимых элементов
Семантическая разметка осуществляется с помощью специальных языков. Наиболее известным из них является язык TEI, предоставляющий безграничные возможности для сохранения информации, сопровождающей текст.  

- квантитативный анализ художественных текстов
Идеи структуралистов 60х годов получили принципиально новое развитие, благодаря появлению компьютерных технология анализа лингвистических данных и корпусов. Одним из ключевых концептом такого анализа является идея Distant Reading -  удаленного чтения, введенного Franco Moretti из Stanford Literary Lab

- популяризация гуманитарного знания через визуализации и разработку электронных продуктов
Открытость, доступность, понятность - один из основных принципов Digital Humanities  как  академического сообщества. Новые технологии дают возможность широкого доступа к культурному наследию, а также вовлечения самого широких кругов пользовалелей в тематику проектов

 Семантическая публикация 90-томного собрания сочинений Л.Н. Толстого 

Работа над элекронным семантическим изданием ПСС Л.Н.Толстого проводится сотрудниками и студентами школы лингвистики в рамках исследовательского проекта, поддержанного РФФИ (грант № 15-06-99523А). Цель проекта состоит в проектировании, разработке и реализации семантической разметки электронной публикации полного собрания сочинений Толстого. Семантическая разметка является современным способом сопровождения текста метаданными разных типов, а также связывания выделенных элементов текста с друг другом и с другими документами. Ключевое требование к семантической разметке состоит в ее машиночитаемости и соответствии ее формата общепринятым стандартам, прежде всего стандарту Text Encoding Initative (TEI).

Основная задача семантической разметки электронной публикации наследия Толстого состоит в воспроизведении на новом технологическом уровне метатекстовой информации, критического аппарата, комментариев и указателей, сопровождающих 90-томное полное собрание сочинений Толстого. Таким образом, читатели получат доступ не только к самому тексту Толстого, но и к необходимому для   его более глубокого понимания филологическому  научному аппарату. Не меньшую ценность ресурс будет представлять для исследователей, являясь своего рода электронной информационной базой данных, сопровождающей и структурирующей Толстовское наследие. Семантическая разметка дает возможность для неограниченного расширения связанного с документом контента, добавления библиографии, связывания конкретных элементов текста с комментариями или любыми другими текстами, в том числе и на других языках. 

Таким образом, семантическая публикация представляет собой наиболее современную технологическую платформу для глубокого филологического анализа.  Наконец, очень важной характеристикой выбранного подхода является то, что стандартная семантическая разметка совместима с множеством современных технологий, позволяющих создавать совершенно новые мультимедийные и инфографические продукты, которые вне всякого сомнения будут служить популяризации наследия Л.Н. Толстого. Побочным результатом проекта станет открытая библиотека утилит и программ, применимых для задач семантической разметки, которая заложит основу для последующих семантических публикаций научных собраний сочинений русских писателей и поэтов. Одним из первых таких продуктов стал разработанный студентами магистратуры по компьютерной лингвистике Еленой Сидоровой и Марией Картышевой транслитератор из старой орфографии в новую.

 Презентация проекта на конференции Диалог 2014 (PPTX, 2.68 Мб)



ВИДЕО сотрудников Школы лингвистики и приглашенных преподавателей:

Статьи:


2018

Skorinkin D., Fischer F., Palchikov G. Building a Corpus for the Quantitative Research of Russian Drama: Composition, Structure, Case Studies, in: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 30 мая — 2 июня 2018 г.) / Под общ. ред.: В. Селегей, И. М. Кобозева, Т. Е. Янко, И. Богуславский, Л. Л. Иомдин, М. А. Кронгауз, А. Ч. Пиперски. Вып. 17(24). М. : Издательский центр «Российский государственный гуманитарный университет», 2018. P. 662-682.

Schmunk S., Fischer F., Blümm M., Horstmann W. Interoperabel und partizipativ, in: Digitale Infrastrukturen für die germanistische Forschung. Berlin, Boston : De Gruyter, 2018. P. 53-72.

Бонч-Осмоловская А. А., Нестеренко Л. В. Сети как инструмент поиска и находок в мультиязычных параллельных корпусах // В кн.: ЕВРика! Сборник статей о поисках и находках к юбилею Е. В. Рахилиной / Под общ. ред.: Д. А. Рыжова, Б. В. Орехов, Н. Р. Добрушина, Т. И. Резникова, А. А. Бонч-Осмоловская, А. С. Выренкова, М. В. Кюсева. М. : Лабиринт, 2018.

Бонч-Осмоловская А. А. Имена времени: эпитеты десятилетий в Национальном корпусе русского языка как проекция культурной памяти // Шаги/Steps. 2018. № 4. С. 115-146.

Орехов Б. В., Успенский П. Ф. // Гальванизация автора, или эксперимент с нейронной поэзией. Новый мир. 2018. № 6. С. 139-158.

Скоринкин Д. А. Модель семантической разметки художественного текста для цифровых исследований в филологии //  Естественнонаучные методы в цифровой гуманитарной среде: Материалы всероссийской научной конференции с международным участием (г. Пермь, 15–18 мая 2018 г.). Пермь: ПГНИУ, 2018. С. 107-111.

Skorinkin D. Extracting Character Networks to Explore Literary Plot Dynamics, in: Компьютерная лингвистика и интеллектуальные технологии: По мате­риалам ежегодной международной конференции «Диалог» (Москва, 31 мая — 3 июня 2017 г.). Вып. 16 (23): В 2 т. / Науч. ред.: В. Селегей. Т. 1. М. : Изд-во РГГУ, 2017. P. 257-270.

2017

Скоринкин Д. А., Бонч-Осмоловская А. А. «Особые приметы» в речи художественных персонажей: количественный анализ диалогов в «Войне и мире» Л. Н. Толстого // Электронный научно-образовательный журнал "История". 2017. Т. 7. № 7. 

Skorinkin D. Extracting Character Networks to Explore Literary Plot Dynamics, in: Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог» (Москва, 31 мая — 3 июня 2017 г.). Вып. 16 (23): В 2 т. / Науч. ред.: В. Селегей. Т. 1. М. : Изд-во РГГУ, 2017. P. 257-270.

2016

Fischer F. , Göbel M., Kampkaspar D., Trilcke P.  Theatre Plays as ‘Small Worlds’? Network Data on the History and Typology of German Drama, 1730–1930 , in:  Digital Humanities 2016. Conference Abstracts (Jagiellonian University & Pedagogical University, Kraków, 11–16 July 2016). Kraków :, 2016. P. 385-387.

Skorinkin D., Bonch-Osmolovskaya A. Text mining War and Peace: Automatic extraction of character traits from literary pieces // Digital Scholarship in the Humanities. 2016 

Skorinkin D., Можаев Е. А. TEI markup for the 90-volume edition of Leo Tolstoy’s complete works, in: TEI Conference and Members’ Meeting 2016 Book of Abstracts. Wien : Austrian Centre for Digital Humanities, 2016. P. 107-109.

2015

Skorinkin D., Bonch-Osmolovskaya A. A. Automatic semantic tagging of Leo Tolstoy’s works, in: DH 2015 Global Digital Humanities Conference Abstracts., 2015.

Bonch-Osmolovskaya A. A., Kolbasov M. Tolstoy digital: Mining biographical data in literary heritage editions, in: 1st Conference on Biographical Data in a Digital World 2015, BD 2015; Amsterdam; Netherlands; 9 April 2015. Амстердам : CEUR-WS.org, 2015. P. 48-52. 

Бонч-Осмоловская А. А. Культуромика в национальном корпусе русского языка, к постановке задачи: три века русских дорог. // Труды института русского языка им. В.В. Виноградова. 2015. Т. 4. № 6. С. 605-641.

Книги

Leo philologiae. Фестшрифт в честь 70-летия Льва Иосифовича Соболева / Под общ. ред.: А. А. Бонч-Осмоловская, М. А. Кучерская, К. М. Поливанов, А. А. Зубов, Майофис Мария Львовна. М. : [б.и.], 2016.

ГРАНТЫ:

Поддержанные заявки по конкурсу индивидуальных исследовательских проектов 2016/2017 гг.

Бонч-Осмоловская Анастасия Александровна. Средние данные в гуманитарных исследованиях (Medium data for humanities) (16-01-0109).

Гранты РФФИ

Грант 15-06-99523 «Семантическая публикация полного собрания сочинений Л.Н.Толстого: модель, технологии и реализация»

УЧЕБНЫЕ КУРСЫ по теме исследований
(бакалавриат):


Цифровая грамотность

По выбору


Научно-исследовательский семинар "Теория стиха"

По выбору

Sampling People, Networks and Records

По выбору

 

УЧЕБНЫЕ КУРСЫ по теме исследований (магистратура):

Магистерская программа «Компьютерная лингвистика»


Social Networks

По выбору


Магистерская программа «Цифровые методы в гуманитарных науках»

Введение в науку о данных

Обязательный

 

Цифровые гуманитарные науки

Обязательный

 

Evolution of the Humanities

Обязательный

 

Проектно-исследовательский семинар "Проектирование цифровых гуманитарных ресурсов и систем"

Обязательный

 

 

 

 

https://ling.hse.ru/Projects_DigHum