Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4
Телефон: +7 (495) 772-95-90 доб. 22734
E-mail: ling@hse.ru
Редакторы сайта — Наталья Борисовна Пименова, Максим Олегович Бажуков, Константин Евгеньевич Сатдаров
Школа лингвистики была образована в декабре 2014 года. Сотрудники школы преподают на образовательных программах по теоретической и компьютерной лингвистике в бакалавриате и магистратуре. Лингвистика, которой занимаются в школе, — это не только знание иностранных языков, но прежде всего наука о языке и о способах его моделирования. Научные группы школы занимаются исследованиями в области типологии, социолингвистики и ареальной лингвистики, корпусной лингвистики и лексикографии, древних языков и истории языка. Кроме того, в школе создаются лингвистические технологии и ресурсы: корпуса, обучающие тренажеры, словари и тезаурусы, технологии для электронного представления текстов культурного наследия.
Рахилина Е. В., Казкенова А.
Russian Language Journal. 2025. Т. 75. № 1. С. 1-26.
В кн.: Парад цифровых гуманитарных проектов. Красноярск: Сибирский федеральный университет, 2025. С. 34-40.
arxiv.org. Computer Science. Cornell University, 2024
Работа над цифровым изданием собрания сочинений Л.Н. Толстого ведется Школой лингвистики в рамках исследовательского проекта, поддержанного РФФИ (грант № 15-06-99523А). Тексты писателя снабжаются детальной текстологической и семантической разметкой в соответствии с общпринятым международным стандартом TEI. Такая разметка позволит в дальнейшем выполнять сложные поисковые запросы, интерактивно отображать различные варианты, использовать различные инструменты для цифровой публикации и создания веб-приложений, разработанные сообществом Text Encoding initiative.
Основная часть доклада была посвящена оцифровке различных редакторских примечаний, сделанных в бумажном издании собрания сочинений. 90 томов писателя содержат около 80 тыс. подстраничных сносок — указания на зачеркивания, позднейшие вставки, редакторские исправления описок, восполнения пропусков, Стандарт разметки текстов TEI позволяет детально кодировать все эти типы (напр, удаление текста и вставку вместо него другого текста), однако для этого необходимо научиться классифицировать примечания автоматически и выработать процедуру преобразования в TEI-разметку.
Помимо стандартных типов сносок встречааются и более сложные маргинальные случаи вроде Последнее предложение вписано между строк, чернилами другого цвета и почерком несомненно другого времени или После этого слова нарисован миниатюрный рисунок женской головы с длинным носом. Их также необходимо разметить специальным способом в TEI.