• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Мероприятия
Книга
Рукописи. Редкие издания. Архивы. Из фондов Отдела редких книг и рукописей

Лифшиц А. Л., Мастерков А., Мастеркова А. и др.

Вып. 10. М.: Новый хронограф, 2017.

Статья
Акциональный DOM в мокшанском языке и проблема циклов грамматикализации
В печати

Козлов А. А.

Acta Linguistica Petropolitana. Труды института лингвистических исследований. 2017. Т. XIII. № 2.

Глава в книге
Easy Linavis (Simple Network Visualisation for Literary Texts)
В печати

Fischer F., Milling C., Shlosman E. et al.

In bk.: Digital Humanities Russia 2017. Vol. 1. Krasnoyarsk: Siberian Federal University, 2017.

Препринт
Nonverbal Predication in Chukchi

Kasyanova P. A.

Linguistics. WP BRP. НИУ ВШЭ, 2017

Доклад Ольги Ляшевской на научном семинаре Школы лингвистики

3 апреля Ольга Ляшевская выступила с докладом «Компьютер как новый
"несовершенный" носитель языка (на данных корпуса автоматических
расшифровок устной русской речи)».

В последнее время большую популярность приобрели корпуса так

называемых «несовершенных» говорящих, включающие, например, тексты
носителей эритажного языка, ответы на экзамене по иностранному языку,
первые опусы студентов в жанре академического письма или перевода.
Ошибки таких авторов признаны ценным эмпирическим материалом, который
восполняет лакуну negative evidence в корпусной лингвистике и
проливает свет на многие теоретические вопросы.

В докладе Ольги Ляшевской речь шла о корпусе расшифровок устной

речи, полученных с помощью сервиса SpeechKit Cloud (Яндекс) и
снабженных параллельным слоем ручной разметки. Несмотря на
то, что технологии автоматического распознавания активно развиваются,
дополняют акустическую модель параметрами синтаксической,
семантической, доменной и т.п. дистрибуции, полнота и точность
письменной кодировки речевого сигнала все еще далека от идеала. Взяв
за основу параллельные данные автоматической и ручной расшифровки,
О.Ляшевская предложила типологию таких ошибок и показала, как они
помогают нам понять, что же позволяет человеку более точно настраивать
свой аппарат речевого распознавания. Кроме того, обсуждались вопросы
создания корпуса расшифровок, а именно, проблемы выравнивания
параллельных расшифровок (автоматической и ручной) и детекции ошибок.