• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Electronic resources

For Russian language 

Rusgram
A corpus-oriented and corpus-based description of Russian grammar with HSE school of linguistics as one of the main contributors

Unified synonyms dictionary 
Large synonyms database for Russian aggregated from five dictionaries; has advanced search capabilities 

Unified antonyms dictionary 
Large antonyms database for Russian aggregated from four dictionaries; 

RusVectōrēs
Open-source web-service for distributional semantices; API available.

RNC Sketches
Syntactic word sketches (based on the Russian national corpus

Russian Constructicon
Construction grammar for Russian (jointly with the University of Tromsø and the University of Gothenburg)

MyStem+
All Russian POS-taggers/morphological parsers in one place (work in progress).

Ru-Syntax Syntactic parser
Outputs syntactic trees in CoNLL format  

Variational Study Repository
Studies of Russian language variations with auto-generated infographics. Users can specify demographic parameters and add their own data to the repository. 

Orthography converter (pre-reform to contemporary and vice versa)
Converts between Russian pre-reform and contemporary orthographic norms. 

Russian Learner Corpus (RLC)
Texts by those learning Russian as a foreign language, as well as by 'heritage' speakers

Learner Corpus 
Corpus of study texts (school essays and alike) by russian native speakers 

Sentinet
Russian adjectives with sentiment markup

Sentinet crowdsourcing game
A game to gather new data for Sentinet

Метафорические и неметафорические употребления глаголов
Аннотированные примеры метафорических и неметафорических употреблений 10 русских глаголов. Можно посмотреть онлайн или скачать.
http://web-corpora.net/tools/brat/#/YBadryzlova/Diploma/public_html/
http://web-corpora.net/~badryzlova/CORPUS%20FILES/ (скачиваемые файлы)

Корпус устьянского русского
Мультимедийный корпус одного из севернорусских диалектов.
http://parasolcorpus.org/Pushkino/login.php

Чанкер для русского языка
Веб-сервис, позволяющий приблизительно разбить русские предложения на составляющие.
http://web-corpora.net/wsgi/chunker.wsgi/npchunker/

Фейсбук прошлого
База данных по письмам русских писателей (Грибоедова, Достоевского, Лермонтова, Тютчева, Шолохова) с возможностью увидеть построенный на основе писем каждого писателя его социальный граф.
http://web-corpora.net/Facebook_of_the_Past/facebook.html

Skell
1 bln corpus with built in syntactic sketch engine 

For English


REALEC
Corpus of mistakes by Russian learners of English 

For languages of Russia

Atlas of Multilingualism in Daghestan
This site introduces the future Atlas of multilingualism in Daghestan, a project based on extensive field study of the language repertoires among residents of rural highland Daghestan.

Yiddish Transliterator 
Transliterates Yiddish text written in Hebrew alphabet into Latin

Yiddish Corpus
Corpus of contemporary spoken Yiddish (latin transcription); audio recordings, search by lemma, word and/or grammatical features

Проект «Языки России»
Коллекции текстов на языках России из Интернета и Вконтакте. Коллекции можно полностью скачать; в настоящее время доступны тексты на 48 языках.
http://web-corpora.net/wsgi3/minorlangs/

Определитель языков России
Веб-сервис, позволяющий ввести в форму текст на одном из языков России и определить язык этого текста. Сейчас поддерживается 32 языка.
http://smyek.ru/ld/language_definer.html

Удмуртский корпус
Корпус удмуртского языка более 7 миллионов словоупотреблений. Поиск по словоформам, леммам, переводам, грамматический поиск.
http://web-corpora.net/UdmurtCorpus/search/?interface_language=ru

База данных моделей управления в нахско-дагестанских языках
База данных словарного типа с информацией о глаголах нахско-дагестанских языках. Содержит информацию о семантике глагола, о падежах аргументов, примеры. Возможен поиск и межъязыковое сравнение.
http://dag-languages.org/argument_structure/dag_site/

Мегебский словарь
Словарь мегебских имен и глаголов: аудио, морфологическая информация, перевод. Можно скачать.
http://mehwebdict.wc.lt/

Адыгский атлас
Карта адыгских идиомов России.
http://web-corpora.net/~agricolamz/maps/adyghe_atlas/adyghe_atlas.html

Typology and languages of the world


Письменности мира
Карта письменностей мира на базе GoogleMaps.
https://www.google.com/maps/d/viewer?authuser=0&authuser=0&hl=ru&hl=ru&mid=zOIHAHv4D6bY.kdF33hsH7WiA

База данных признаковой лексики
База по лексической типологии прилагательных: можно узнать об особенностях конкретного прилагательного в конкретном языке, проводить межъязыковые сравнения или изучать устройство признаковых полей.
http://web-corpora.net/wsgi/adj_database.wsgi/

Звуки Му
Типологическая база данных по семантической зоне звуков, издаваемых животными. Представлены данные более 20 языков разных языковых семей.
http://nevmenandr.net/cgi-bin/zvukimu.py
http://www.web-corpora.net/zvukimu/

lingtypology
R package with access to Glottolog database (v. 2.7) that allows easy linguistic cartography. The package is inspired by the idea of the Cross-Linguistic Linked Data project

MLexT
Moscow lexical typology group website