• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4

 

🧭 Как до нас добраться

 

Телефон: +7 (495) 772-95-90 доб. 22734

E-mail: ling@hse.ru

Руководство
Заместитель руководителя Ахапкина Яна Эмильевна
Школа лингвистики: Менеджер Дьячкова Анна Евгеньевна

Редакторы сайта — Наталья Борисовна Пименова, Татьяна Борисовна Казакова, Максим Олегович Бажуков

Книга
Шугнанские этюды. Сборник статей о шугнанском языке

Хорог: Институт гуманитарных наук НАНТ, 2025.

Статья
Русское всё равно: парадоксы незавершенной морфологизации

Киреев Н. И., Плунгян В. А.

Вопросы языкознания. 2025. № 5. С. 91-117.

Глава в книге
Variation in a Narrative Corpus of Mano and Kpelle: Contact-Induced or Not?.

Khachaturyan M., Konoshenko M., Moroz G. et al.

In bk.: N’yng-dyuumgu, n’yng-ngafq: Festschrift for Ekaterina Gruzdeva. Vol. 126. Helsinki: Studia Orientalia, 2025. P. 35-59.

Препринт
You shall know a piece by the company it keeps. Chess plays as a data for word2vec models

Orekhov B.

arxiv.org. Computer Science. Cornell University, 2024

Преподаватель школы лингвистики выступил на международной TEI Conference 2016

На минувшей неделе в Вене прошла ежегодная конференция консорциума TEI (Text Encoding Initiative). Преподаватель школы лингвистики Даниил Скоринкин выступил с докладом о разметке произведений Л.Н. Толстого.

Работа над цифровым изданием собрания сочинений  Л.Н. Толстого ведется Школой лингвистики в рамках исследовательского проекта, поддержанного РФФИ (грант № 15-06-99523А). Тексты писателя снабжаются детальной текстологической и семантической разметкой в соответствии с общпринятым международным стандартом TEI. Такая разметка позволит в дальнейшем выполнять сложные поисковые запросы, интерактивно отображать различные варианты, использовать различные инструменты для цифровой публикации и создания веб-приложений, разработанные сообществом Text Encoding initiative. 

Основная часть доклада была посвящена оцифровке различных редакторских примечаний, сделанных в бумажном издании собрания сочинений. 90 томов писателя содержат около 80 тыс. подстраничных сносок — указания на зачеркивания, позднейшие вставки, редакторские исправления описок, восполнения пропусков, Стандарт разметки текстов TEI позволяет детально кодировать все эти типы (напр, удаление текста и вставку вместо него другого текста), однако для этого необходимо научиться классифицировать примечания автоматически и выработать процедуру преобразования в TEI-разметку. 

Помимо стандартных типов сносок встречааются и более сложные маргинальные случаи вроде Последнее предложение вписано между строк, чернилами другого цвета и почерком несомненно другого времени или После этого слова нарисован миниатюрный рисунок женской головы с длинным носом. Их также необходимо разметить специальным способом в TEI.