We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.
A corpus-oriented and corpus-based description of Russian grammar with HSE school of linguistics as one of the main contributors
Unified synonyms dictionary
Large synonyms database for Russian aggregated from five dictionaries; has advanced search capabilities
Unified antonyms dictionary
Large antonyms database for Russian aggregated from four dictionaries;
Open-source web-service for distributional semantices; API available.
RNC Sketches
Syntactic word sketches (based on the Russian national corpus)
Russian Constructicon
Construction grammar for Russian (jointly with the University of Tromsø and the University of Gothenburg)
All Russian POS-taggers/morphological parsers in one place (work in progress).
Ru-Syntax Syntactic parser
Outputs syntactic trees in CoNLL format
Variational Study Repository
Studies of Russian language variations with auto-generated infographics. Users can specify demographic parameters and add their own data to the repository.
Orthography converter (pre-reform to contemporary and vice versa)
Converts between Russian pre-reform and contemporary orthographic norms.
Russian Learner Corpus (RLC)
Texts by those learning Russian as a foreign language, as well as by 'heritage' speakers
Learner Corpus
Corpus of study texts (school essays and alike) by russian native speakers
Russian adjectives with sentiment markup
Sentinet crowdsourcing game
A game to gather new data for Sentinet
Метафорические и неметафорические употребления глаголов
Аннотированные примеры метафорических и неметафорических употреблений 10 русских глаголов. Можно посмотреть онлайн или скачать.
http://web-corpora.net/~badryzlova/CORPUS%20FILES/ (скачиваемые файлы)
Корпус устьянского русского
Мультимедийный корпус одного из севернорусских диалектов.
Чанкер для русского языка
Веб-сервис, позволяющий приблизительно разбить русские предложения на составляющие.
Фейсбук прошлого
База данных по письмам русских писателей (Грибоедова, Достоевского, Лермонтова, Тютчева, Шолохова) с возможностью увидеть построенный на основе писем каждого писателя его социальный граф.
1 bln corpus with built in syntactic sketch engine
Atlas of Multilingualism in Daghestan
This site introduces the future Atlas of multilingualism in Daghestan, a project based on extensive field study of the language repertoires among residents of rural highland Daghestan.
Yiddish Transliterator
Transliterates Yiddish text written in Hebrew alphabet into Latin
Yiddish Corpus
Corpus of contemporary spoken Yiddish (latin transcription); audio recordings, search by lemma, word and/or grammatical features
Проект «Языки России»
Коллекции текстов на языках России из Интернета и Вконтакте. Коллекции можно полностью скачать; в настоящее время доступны тексты на 48 языках.
Определитель языков России
Веб-сервис, позволяющий ввести в форму текст на одном из языков России и определить язык этого текста. Сейчас поддерживается 32 языка.
Удмуртский корпус
Корпус удмуртского языка более 7 миллионов словоупотреблений. Поиск по словоформам, леммам, переводам, грамматический поиск.
База данных моделей управления в нахско-дагестанских языках
База данных словарного типа с информацией о глаголах нахско-дагестанских языках. Содержит информацию о семантике глагола, о падежах аргументов, примеры. Возможен поиск и межъязыковое сравнение.
Мегебский словарь
Словарь мегебских имен и глаголов: аудио, морфологическая информация, перевод. Можно скачать.
Адыгский атлас
Карта адыгских идиомов России.