• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4

 

🧭 Как до нас добраться

 

Телефон: +7 (495) 772-95-90 доб. 22734

E-mail: ling@hse.ru

Руководство
Заместитель руководителя Ахапкина Яна Эмильевна

Редакторы сайта — Наталья Борисовна Пименова, Татьяна Борисовна Казакова, Максим Олегович Бажуков, Юлия Геннадьевна Бадрызлова

Книга
Митрополиты, мудрецы, переводчики в cредневековой Европе

Белов Н. В., Бойцов М. А., Виноградов А. Ю. и др.

М.: Издательский дом НИУ ВШЭ, 2024.

Статья
Древнеисландское rekkr ‘муж, воин’ и дифференциация синонимов в общегерманском поэтическом языке

Пименова Н. Б.

Индоевропейское языкознание и классическая филология. 2024. Т. XXVIII. № 2. С. 1974-1989.

Глава в книге
Тест на распознавание книжных заголовков для младших школьников: пилотное исследование

Урывская Д. А., Староверова В. Н., Лопухина А. А. и др.

В кн.: Наука и образование: проблемы и перспективы [Электронный ресурс]: Материалы XXVI Международной научно-практической конференции молодых ученых и студентов, посвящённой 85-летию АГГПУ им. В. М. Шукшина (Бийск, 5 апреля 2024 г.). Бийск: АГГПУ им. В.М. Шукшина, 2024. С. 240-244.

Препринт
Grammar in Language Models: BERT Study

Chistyakova K., Kazakova Tatiana.

Linguistics. WP BRP. НИУ ВШЭ, 2023. No. 115.

До Варшавы и в Кракóве: доклад Георгия Мороза о падежах названий польских городов

Преподаватель школы лингвистики Георгий Мороз рассказал о распределении падежей, в которых употребляются названия городов Польши в польском корпусе. Результаты исследования представлены в виде интерактивной карты.

Исследование было проведено с помощью двух лингвистических инструментов, разработанных самим докладчиком, — лингвистического пакета lingtypology и API для национального корпуса польского языка (НКПЯ). Первый из них позволяет создавать типологические карты, второй - передавать запросы в польский корпус и анализировать полученные результаты в языке R.

С помощью API были получены примеры употребления для 116 польских городов с указанием грамматических характеристик, в том числе падежа. Далее эти данные были преобразованы в таблицу и проанализированы с помощью стандартных средств языка R.

Визуализация результатов с помощью гистаграмм распределения падежей и метода главных компонент показала несколько примечательных фактов. Во-первых,  падежи делятся на те, которые чаще имеют маленькую долю (винительны, дательный, творительный, звательный), и на те, которые чаще имеют долю в промежутке между 0.2 и 0.6 (родительный, именительны, местный).

Как отметил докладчик, это распределение выглядит объяснимо, если учесть, что в польском языке латив и элатив маркируется предлогами do и z, управляющими родительным падежом, а эссив маркируется предлогом w, управляющий местным падежом. Во-вторых, города не делятся по распределению падежей на явно выраженные кластеры, т.е. нельзя, например, поделить города на те, что употреблялись бы заметно чаще в местном падеже ([жить] в Варшаве) и те, что тяготеют к родительному ([ехать] до/з Варшавы).

Падежи в названиях польских городов - PCA

Скорее на графике главных компонент можно увидеть ядро с наиболее типичным распределением и несколько небольших периферийных групп.

Падежи в названиях польских городов - PCA 2

Интерактивная карта (ее можно увидеть здесь) показывает, что эти “периферийные” города не являются периферией географически. Однако географическая интерпретация данных все же возможна: так, у участников научного семинара возникло предположение (нуждающееся в дальнейшей проверке) о корреляции распределения падежей с экономическим и культурным развитием городов.  

Подробнее об исследовании можно прочитать здесь