• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4

 

🧭 Как до нас добраться

 

Телефон: +7 (495) 772-95-90 доб. 22734

E-mail: ling@hse.ru

Руководство
Заместитель руководителя Ахапкина Яна Эмильевна

Редакторы сайта — Наталья Борисовна Пименова, Татьяна Борисовна Казакова, Максим Олегович Бажуков, Юлия Геннадьевна Бадрызлова

Книга
Proceedings of the 3rd Workshop on NLP Applications to Field Linguistics (Field Matters 2024)

Bangkok: Association for Computational Linguistics, 2024.

Статья
Проект словаря новоарамейских глаголов

Шведова Е. Е.

Вопросы лексикографии. 2024. № 34. С. 42-61.

Глава в книге
String Similarity Measures for Evaluating the Lemmatisation in Old Church Slavonic

Afanasev I., Lyashevskaya O.

In bk.: Structuring Lexical Data and Digitising Dictionaries: Grammatical Theory, Language Processing and Databases in Historical Linguistics. Leiden; Boston: Brill, 2024. P. 13-35.

Препринт
Exploring the Effectiveness of Methods for Persona Extraction
В печати

Konstantin Zaitsev.

arxiv.org. Computer Science. Cornell University, 2024

Транслитератор для языка идиш

Графика языка идиш основана на еврейском квадратном письме, и в настоящее время для публикации светских изданий в подавляющем большинстве случаев используется стандартная орфография, разработанная Институтом YIVO (the Institute for Jewish Research) в 1938 году, которой соответствует стандартная транслитерация YIVO. Однако при взгляде в недавнее прошлое, а также на ультраортодоксальные источники, мы видим не просто неустоявшуюся орфографию, а целый ряд орфографических систем, основанных на разных принципах. Более того, внутри этих систем каждый издатель следовал своей орфографической практике (и не всегда был последователен). В связи с этим встаёт проблема нормализации таких текстов, которую и призван решить настоящий транслитератор. Помимо непосредственных целей (удобство чтения и произношения), нормализованную транслитерацию можно использовать в электронных ресурсах. Так, к пониманию того, что такой транслитератор для идиша необходим, авторы пришли в ходе работы над корпусом языка идиш. Пока в КЯИ преобладает современная пресса и недостаточно текстов, написанных классиками литературы, не хватает и текстов других жанров. Теперь проблема дисбаланса может быть успешно решена.

Транслитератор находится по адресу:  http://web-corpora.net/YiddishTransliterator/, также доступны англо- и идишеязычная версии страницы.

Проект был представлен на международной конференции по компьютерной лингвистике "Диалог-2014".

Научный руководитель проекта - Б.В. Орехов.