Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.
Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4
Телефон: +7 (495) 772-95-90 доб. 22734
E-mail: ling@hse.ru
Редакторы сайта — Наталья Борисовна Пименова, Татьяна Брисовна Казакова, Максим Олегович Бажуков, Юлия Геннадьевна Бадрызлова
Школа лингвистики была образована в декабре 2014 года. Сотрудники школы преподают на образовательных программах по теоретической и компьютерной лингвистике в бакалавриате и магистратуре. Лингвистика, которой занимаются в школе, — это не только знание иностранных языков, но прежде всего наука о языке и о способах его моделирования. Научные группы школы занимаются исследованиями в области типологии, социолингвистики и ареальной лингвистики, корпусной лингвистики и лексикографии, древних языков и истории языка. Кроме того, в школе создаются лингвистические технологии и ресурсы: корпуса, обучающие тренажеры, словари и тезаурусы, технологии для электронного представления текстов культурного наследия.
Белов Н. В., Бойцов М. А., Виноградов А. Ю. и др.
М.: Издательский дом НИУ ВШЭ, 2024.
Савчук С. О., Архангельский Т. А., Бонч-Осмоловская А. А. и др.
Вопросы языкознания. 2024.
Creissels D., Zúñiga F., Moroz G.
In bk.: Applicative Constructions in the World's Languages. Berlin: De Gruyter Mouton, 2024. P. 61-73.
Chistyakova K., Kazakova Tatiana.
Linguistics. WP BRP. НИУ ВШЭ, 2023. No. 115.
Наша проектная группа разрабатывает цифровое издание литературного журнала XIX века «Отечественные записки». Хотя данный литературный журнал является значимым для понимания русской культурной и общественной жизни XIX века, его выпуски нельзя найти онлайн в адекватной машиночитаемой форме. В Интернете встречаются либо нераспознанные изображения, либо разрозненные PDF-документы с текстовым слоем неприемлемого качества.
Таким образом, корпус текстов журнала с учетом старой и новой орфографии в машиночитаемой форме позволит проводить корпусные исторические, лингвистические, филологические и междисциплинарные исследования. Более того, вычитка текста и удаление опечаток, возникающих при OCR-распознавании томов журнала, занимает много сил и времени. Поэтому, кроме полнотекстового поиска, на сайте цифрового архива будет доступна возможность онлайн-редактирования текстов журнала через удобный фреймворк. Возможно, в дальнейшей работе будут придуманы и добавлены новые инструменты.
С сентября по декабрь удалось выполнить следующие пункты:
Несмотря на первые результаты, уже сейчас понятна важность цифрового архива не только для самого журнала, но и в целом для классической русской периодики. Цифровое издание «Отечественных записок» позволит не только сохранить столь значимый для культуры объект, но и станет «полем» для исследователей, позволив находить новые знания.