• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4

 

🧭 Как до нас добраться

 

Телефон: +7 (495) 772-95-90 доб. 22734

E-mail: ling@hse.ru

Руководство
Заместитель руководителя Ахапкина Яна Эмильевна

Редакторы сайта — Наталья Борисовна Пименова, Татьяна Брисовна Казакова, Максим Олегович Бажуков, Юлия Геннадьевна Бадрызлова

Глава в книге
Тест на распознавание книжных заголовков для младших школьников: пилотное исследование

Урывская Д. А., Староверова В. Н., Лопухина А. А. и др.

В кн.: Наука и образование: проблемы и перспективы [Электронный ресурс]: Материалы XXVI Международной научно-практической конференции молодых ученых и студентов, посвящённой 85-летию АГГПУ им. В. М. Шукшина (Бийск, 5 апреля 2024 г.). Бийск: АГГПУ им. В.М. Шукшина, 2024. С. 240-244.

Препринт
Grammar in Language Models: BERT Study

Chistyakova K., Kazakova Tatiana.

Linguistics. WP BRP. НИУ ВШЭ, 2023. No. 115.

Доклад Ольги Ляшевской на научном семинаре Школы лингвистики

3 апреля Ольга Ляшевская выступила с докладом «Компьютер как новый
"несовершенный" носитель языка (на данных корпуса автоматических
расшифровок устной русской речи)».

В последнее время большую популярность приобрели корпуса так

называемых «несовершенных» говорящих, включающие, например, тексты
носителей эритажного языка, ответы на экзамене по иностранному языку,
первые опусы студентов в жанре академического письма или перевода.
Ошибки таких авторов признаны ценным эмпирическим материалом, который
восполняет лакуну negative evidence в корпусной лингвистике и
проливает свет на многие теоретические вопросы.

В докладе Ольги Ляшевской речь шла о корпусе расшифровок устной

речи, полученных с помощью сервиса SpeechKit Cloud (Яндекс) и
снабженных параллельным слоем ручной разметки. Несмотря на
то, что технологии автоматического распознавания активно развиваются,
дополняют акустическую модель параметрами синтаксической,
семантической, доменной и т.п. дистрибуции, полнота и точность
письменной кодировки речевого сигнала все еще далека от идеала. Взяв
за основу параллельные данные автоматической и ручной расшифровки,
О.Ляшевская предложила типологию таких ошибок и показала, как они
помогают нам понять, что же позволяет человеку более точно настраивать
свой аппарат речевого распознавания. Кроме того, обсуждались вопросы
создания корпуса расшифровок, а именно, проблемы выравнивания
параллельных расшифровок (автоматической и ручной) и детекции ошибок.