• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Книга
Verba sonandi : Représentation linguistique des cris d’animaux

Presses Universitaires de Provence, 2017.

Статья
Cкорости речи носителей кубанского диалекта кабардино-черкесского языка: устный дискурс vs. чтения текста

Мороз Г. А.

Томский журнал лингвистических и антропологических исследований. 2017. №  2. С. 9-17.

Глава в книге
Network Dynamics, Plot Analysis: Approaching the Progressive Structuration of Literary Texts
В печати

Fischer F., Göbel M., Kampkaspar D. et al.

In bk.: Digital Humanities 2017 (Montréal, 8–11 August 2017). Book of Abstracts. Montréal: McGill University, 2017.

Digital Humanities

участвуют:
доценты школы лингвистики Б.В.Орехов, А.А. Бонч-Осмоловская,
аспирант школы лингвистики Д. Скоринкин
студенты: М.Картышева, Е.Сидорова, Е.Можаев, М.Колбасов, Л.Полянская

Digital Humanities - область, которая чрезвычайно интенсивно развивается на западе, но пока что мало представлена в России.
Основными задачи и идеи электронные гуманитарных наук состоят в следующем:

- перевод в электронный машиночитаемый формат источников, связанных с культурным наследием 
Это значит не просто оцифровка, но сохранение всех  метаданных в таком формате, чтобы эти метаданные могли бы обработаны и извлечены автоматически, а также создание специализированных баз данных и корпусов

- семантическая разметка значимых элементов
Семантическая разметка осуществляется с помощью специальных языков. Наиболее известным из них является язык TEI, предоставляющий безграничные возможности для сохранения информации, сопровождающей текст.  

- квантитативный анализ художественных текстов
Идеи структуралистов 60х годов получили принципиально новое развитие, благодаря появлению компьютерных технология анализа лингвистических данных и корпусов. Одним из ключевых концептом такого анализа является идея Distant Reading -  удаленного чтения, введенного Franco Moretti из Stanford Literary Lab

- популяризация гуманитарного знания через визуализации и разработку электронных продуктов
Открытость, доступность, понятность - один из основных принципов Digital Humanities  как  академического сообщества. Новые технологии дают возможность широкого доступа к культурному наследию, а также вовлечения самого широких кругов пользовалелей в тематику проектов

 Семантическая публикация 90-томного собрания сочинений Л.Н. Толстого 

Работа над элекронным семантическим изданием ПСС Л.Н.Толстого проводится сотрудниками и студентами школы лингвистики в рамках исследовательского проекта, поддержанного РФФИ (грант № 15-06-99523А). Цель проекта состоит в проектировании, разработке и реализации семантической разметки электронной публикации полного собрания сочинений Толстого. Семантическая разметка является современным способом сопровождения текста метаданными разных типов, а также связывания выделенных элементов текста с друг другом и с другими документами. Ключевое требование к семантической разметке состоит в ее машиночитаемости и соответствии ее формата общепринятым стандартам, прежде всего стандарту Text Encoding Initative (TEI).

Основная задача семантической разметки электронной публикации наследия Толстого состоит в воспроизведении на новом технологическом уровне метатекстовой информации, критического аппарата, комментариев и указателей, сопровождающих 90-томное полное собрание сочинений Толстого. Таким образом, читатели получат доступ не только к самому тексту Толстого, но и к необходимому для   его более глубокого понимания филологическому  научному аппарату. Не меньшую ценность ресурс будет представлять для исследователей, являясь своего рода электронной информационной базой данных, сопровождающей и структурирующей Толстовское наследие. Семантическая разметка дает возможность для неограниченного расширения связанного с документом контента, добавления библиографии, связывания конкретных элементов текста с комментариями или любыми другими текстами, в том числе и на других языках. 

Таким образом, семантическая публикация представляет собой наиболее современную технологическую платформу для глубокого филологического анализа.  Наконец, очень важной характеристикой выбранного подхода является то, что стандартная семантическая разметка совместима с множеством современных технологий, позволяющих создавать совершенно новые мультимедийные и инфографические продукты, которые вне всякого сомнения будут служить популяризации наследия Л.Н. Толстого. Побочным результатом проекта станет открытая библиотека утилит и программ, применимых для задач семантической разметки, которая заложит основу для последующих семантических публикаций научных собраний сочинений русских писателей и поэтов. Одним из первых таких продуктов стал разработанный студентами магистратуры по компьютерной лингвистике Еленой Сидоровой и Марией Картышевой транслитератор из старой орфографии в новую.

 Презентация проекта на конференции Диалог 2014 (PPTX, 2.68 Мб)



ВИДЕО сотрудников Школы лингвистики и приглашенных преподавателей:

НЕКОТОРЫЕ ПУБЛИКАЦИИ:

Статьи:

Fischer F. , Göbel M., Kampkaspar D., Trilcke P.  Theatre Plays as ‘Small Worlds’? Network Data on the History and Typology of German Drama, 1730–1930 , in:  Digital Humanities 2016. Conference Abstracts (Jagiellonian University & Pedagogical University, Kraków, 11–16 July 2016). Kraków :, 2016. P. 385-387.

Skorinkin D., Bonch-Osmolovskaya A. Text mining War and Peace: Automatic extraction of character traits from literary pieces // Digital Scholarship in the Humanities. 2016 

Skorinkin D., Можаев Е. А. TEI markup for the 90-volume edition of Leo Tolstoy’s complete works, in: TEI Conference and Members’ Meeting 2016 Book of Abstracts. Wien : Austrian Centre for Digital Humanities, 2016. P. 107-109.

2015

Skorinkin D., Bonch-Osmolovskaya A. A. Automatic semantic tagging of Leo Tolstoy’s works, in: DH 2015 Global Digital Humanities Conference Abstracts., 2015.

Bonch-Osmolovskaya A. A., Kolbasov M. Tolstoy digital: Mining biographical data in literary heritage editions, in: 1st Conference on Biographical Data in a Digital World 2015, BD 2015; Amsterdam; Netherlands; 9 April 2015. Амстердам : CEUR-WS.org, 2015. P. 48-52. 

Бонч-Осмоловская А. А. Культуромика в национальном корпусе русского языка, к постановке задачи: три века русских дорог. // Труды института русского языка им. В.В. Виноградова. 2015. Т. 4. № 6. С. 605-641.

Книги:

Leo philologiae. Фестшрифт в честь 70-летия Льва Иосифовича Соболева / Под общ. ред.: А. А. Бонч-Осмоловская, М. А. Кучерская, К. М. Поливанов, А. А. Зубов, Майофис Мария Львовна. М. : [б.и.], 2016.

ГРАНТЫ:

Поддержанные заявки по конкурсу индивидуальных исследовательских проектов 2016/2017 гг.

Бонч-Осмоловская Анастасия Александровна. Средние данные в гуманитарных исследованиях (Medium data for humanities) (16-01-0109).

Гранты РФФИ

Грант 15-06-99523 «Семантическая публикация полного собрания сочинений Л.Н.Толстого: модель, технологии и реализация»

УЧЕБНЫЕ КУРСЫ по теме исследований
(бакалавриат):

Формальный анализ стиха

По выбору; 3-й курс - 1,2 модуль

Информационный поиск и извлечение данных

Обязательный; 4-й курс - 1 модуль

Базы данных

По выбору; 3-й курс, 4-й курс

УЧЕБНЫЕ КУРСЫ по теме исследований (магистратура):

Гуманитарные науки в цифровую эпоху

По выбору 1-й курс 2,3 модуль


Компьютерная лингвистика

Обязательный 1-й курс 1-3 модуль, 2-й курс 1,2 модуль


Проектирование лингвистических ресурсов и систем

Обязательный 2-й курс 1-4 модуль


Цифровые гуманитарные технологии: ресурсы, инструменты, кейсы

По выбору 1-й курс 3,4 модуль

https://ling.hse.ru/Projects_DigHum