• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4

 

🧭 Как до нас добраться

 

Телефон: +7 (495) 772-95-90 доб. 22734

E-mail: ling@hse.ru

Руководство
Заместитель руководителя Ахапкина Яна Эмильевна

Редакторы сайта — Наталья Борисовна Пименова, Татьяна Борисовна Казакова, Максим Олегович Бажуков, Юлия Геннадьевна Бадрызлова

Книга
Proceedings of the 3rd Workshop on NLP Applications to Field Linguistics (Field Matters 2024)

Bangkok: Association for Computational Linguistics, 2024.

Статья
История стиховедения и формализм

Орехов Б. В.

Слово.ру: балтийский акцент. 2024. Т. 15. № 4. С. 147-157.

Глава в книге
The Parallel Corpus of Russian and Ruska Romani Languages

Koncha K., Куканова А. Д., Kazakova T. et al.

In bk.: Proceedings of the 3rd Workshop on NLP Applications to Field Linguistics (Field Matters 2024). Bangkok: Association for Computational Linguistics, 2024. Ch. 1. P. 1-5.

Препринт
Exploring the Effectiveness of Methods for Persona Extraction
В печати

Konstantin Zaitsev.

arxiv.org. Computer Science. Cornell University, 2024

Транслитератор для языка идиш

Графика языка идиш основана на еврейском квадратном письме, и в настоящее время для публикации светских изданий в подавляющем большинстве случаев используется стандартная орфография, разработанная Институтом YIVO (the Institute for Jewish Research) в 1938 году, которой соответствует стандартная транслитерация YIVO. Однако при взгляде в недавнее прошлое, а также на ультраортодоксальные источники, мы видим не просто неустоявшуюся орфографию, а целый ряд орфографических систем, основанных на разных принципах. Более того, внутри этих систем каждый издатель следовал своей орфографической практике (и не всегда был последователен). В связи с этим встаёт проблема нормализации таких текстов, которую и призван решить настоящий транслитератор. Помимо непосредственных целей (удобство чтения и произношения), нормализованную транслитерацию можно использовать в электронных ресурсах. Так, к пониманию того, что такой транслитератор для идиша необходим, авторы пришли в ходе работы над корпусом языка идиш. Пока в КЯИ преобладает современная пресса и недостаточно текстов, написанных классиками литературы, не хватает и текстов других жанров. Теперь проблема дисбаланса может быть успешно решена.

Транслитератор находится по адресу:  http://web-corpora.net/YiddishTransliterator/, также доступны англо- и идишеязычная версии страницы.

Проект был представлен на международной конференции по компьютерной лингвистике "Диалог-2014".

Научный руководитель проекта - Б.В. Орехов.