• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Научно-учебная группа «Мультиязыковая база данных синонимов»

Новости

5

14 декабря 2016

База данных завершена и доступна в сети

База данных, созданная в рамках НУГ, завершена и доступна по адресу http://web-corpora.net/wsgi3/synonyms2016/
По этому же адресу доступны векторные модели и корпусы, собранные компьютерной группой НУГа.

7 ноября 2016

Консультации участников НУГ с Дирком Герартсом

16 ноября состоится консультация участников НУГ с Дирком Герартсом, доктором наук университета Лёвена (Бельгия), специалистом в области когнитивной лингвистики, социиолингвистики, лексикологии и лексикографии.
Темы консультации - синонимический ряд ДАЛЕКИЙ, база данных синонимов, а также лексические тренажеры

26 октября 2016

Семинар 12

В рамках НУГ руководитель группы В.Ю. Апресян представила результаты корпусного исследования семантического поля ‘продолжения’.

18 октября 2016

Семинар 11

18 октября состоялся скайп-семинар НУГ, в рамках которого прошло обсуждение индивидуальных и общих промежуточных результатов. Были обсуждены общая теоретическая статья про синонимический ряд ДАЛЁКИЙ, которая в данный момент готовится к подаче и статья про тренажёры. Мария Зарифян представила первоначальное описание ряда БУБНИТЬ. По синонимическому ряду ПРОДОЛЖАТЬ готовится статья руководителя НУГ В.Ю. Апресян. Н. Микулин представил первую бета-версию базы данных на примере ряда ДАЛЁКИЙ.

17 октября 2016

Доклад Елизаветы Кузьменко "Сравнение словарных и автоматически сгенерированных синонимических рядов"

Участник НУГ Елизавета Кузьменко выступила на конференции "Корпусные технологии.
Digital Humanities и современное знание" в Нижнем Новгороде с докладом "Сравнение словарных и автоматически сгенерированных синонимических рядов".

О проекте

Цель проекта – сравнение теоретических и компьютерных подходов к изучению синонимии и семантических полей. В проекте используется лексикографический, а также векторно-статистический подход к описанию указанных явлений. В качестве результата ожидается создание базы данных синонимов для нескольких семантических полей в ряде европейских языков, разработка статистических критериев оценки лингвоспецифичности, создание лексических тренажеров для изучения иностранных языков.

About

The main research aim of the current project is to align theoretical and computer methodologies of establishing boundaries and describing structures of semantic fields across languages, in an attempt to advance theoretical knowledge of semantics and lexical typology, as well as with the practical purpose of developing interactive lexical exercises for foreign language learners.

The project puts forward the following hypotheses: 1) semantic fields of concrete and abstract lexicon have different structures and might therefore exhibit different cross-linguistic behavior. It is expected that concrete semantic fields will demonstrate greater cross-linguistic universality than abstract fields; 2) it is further hypothesized that fields that display greater cross-linguistic universality would present fewer difficulties for a language learner than those that are more at variance across languages; 3) methods of theoretical and computer semantics will produce different results in establishing the relation of synonymy between words. It is expected that computer methods are quite efficient in capturing close synonymy (as in surprise—astonishment), yet would be unable to reconstruct the entire composition of a semantic field in the way theoretical models do, based on the analysis of differences and similarities of semantic structures of synonyms (as in surprise-astonishment-amazement-wonder-marvel-stupefaction). Instead, the prediction is that computer models would establish the semantic relations of words on the levels of antonymy (as in lie-truth) and, in particular, co-hyponymy (as in surprise-delight-admiration-annoyance-disgust); 4) the linguospecificity of words is a parameter established for each pair of languages under comparison and can be expressed as a numerical index calculated on the basis of the number of possible translations from the source language into the target language.

The project employs methods of theoretical semantics, lexical typology and vector semantic models to tackle the issues under consideration.

The expected results include compiling a database of synonyms for several semantic fields in several European languages that incorporates and compares results received by theoretical and computer methods, developing statistical criteria for assessing linguospecificity, and creating synonyms-oriented interactive exercises in several European languages to train the lexical competence of learners.

История проекта

Научно-учебная группа «Мультиязыковая база данных синонимов: теоретические и компьютерные модели» создана в 2016 году в рамках конкурса научно-исследовательскихпроектов научно-учебных групп Научного фонда НИУ ВШЭ. Инициаторами создания группы были преподаватели Школы лингвистики Факультета гуманитарных наук доценты Валентина Юрьевна Апресян, Анастасия Сергеевна Выренкова, Борис Валерьевич Орехов, Татьяна Исидоровна Резникова. В.Ю. Апресян в течение многих лет занималась теоретической семантикой и обладает богатым опытом в области лексикографирования синонимии. Т.И. Резникова – известный специалист в области лексической типологии, и она исследует проблему синонимии и семантических полей в типологическом аспекте. Б.В. Орехов развивает компьютерно-статистические методы оценки синонимии, а также занимается составлением корпусов текстов и другими лингвистическими базами данных; А.С. Выренкова имеет научный и прикладной опыт в области развития лексической компетенции у изучающих иностранные языки, в том числе опыт создания синонимических тренажеров. Членами группы являются студенты бакалавриата, занимающиеся исследованием синонимии и семантических полей в разных языках, созданием баз данных и языковых корпусов, семантическими векторами.