• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4

 

🧭 Как до нас добраться

 

Телефон: +7 (495) 772-95-90 доб. 22734

E-mail: ling@hse.ru

Руководство
Заместитель руководителя Ахапкина Яна Эмильевна

Редакторы сайта — Наталья Борисовна Пименова, Татьяна Брисовна Казакова, Максим Олегович Бажуков, Юлия Геннадьевна Бадрызлова

Статья
Adversarial Attacks and Defenses in Fault Detection and Diagnosis: A Comprehensive Benchmark on the Tennessee Eastman Process
В печати

Pozdnyakov V., Kovalenko A., Makarov I. et al.

IEEE Open Journal of the Industrial Electronics Society. 2024. No. 5. P. 428-440.

Глава в книге
Тест на распознавание книжных заголовков для младших школьников: пилотное исследование

Урывская Д. А., Староверова В. Н., Лопухина А. А. и др.

В кн.: Наука и образование: проблемы и перспективы [Электронный ресурс]: Материалы XXVI Международной научно-практической конференции молодых ученых и студентов, посвящённой 85-летию АГГПУ им. В. М. Шукшина (Бийск, 5 апреля 2024 г.). Бийск: АГГПУ им. В.М. Шукшина, 2024. С. 240-244.

Препринт
Grammar in Language Models: BERT Study

Chistyakova K., Kazakova Tatiana.

Linguistics. WP BRP. НИУ ВШЭ, 2023. No. 115.

Кто дал дуба и где здесь древнегреческий: студенты школы сходили на мастер-класс в ABBYY

Студенты магистратуры «Компьютерная лингвистика» побывали на мастер-классе в компании ABBYY и узнали, что «под капотом» технологии Compreno.

Компания ABBYY известна в первую очередь своими программами для распознавания текста, а также электронными словарями.  Однако параллельно с разработкой FineReader и Lingvo компания достаточно давно ведет исследования в области автоматической обработки языка. Изначально в центре внимания ABBYY был машинный перевод, теперь — извлечение информации, при этом в основе всех разработок лежит одна и та же технология, известная под названием Compreno и идеологически восходящая к модели «Смысл <=> Текст» И. А. Мельчука.

В конце февраля с этой технологией познакомились студенты магистерской программы «Компьютерная лингвистика».  Во время мастер-класса в офисе ABBYY они получили возможность заглянуть «под капот» Compreno и получить представление об основных компонентах системы.  Мастер-класс включал в себя рассказ об универсальной семантической иерархии, на базе которой построена вся лингвистическая модель Compreno, а также демонстрацию модуля извлечения информации.

Мастер-класс проводил преподаватель школы лингвистики Даниил Скоринкин, с 2013 по 2016 год работавший в группе извлечения информации ABBYY. О синтактико-семантическом анализаторе, лежащем в основе технологии Compreno, рассказывал Константин Дружкин, руководитель группы лингвистической экспертизы в ABBYY, а в прошлом — выпускник магистратуры школы лингвистики. Он же ответил на большую часть вопросов участников мастер-класса. В частности, Костя рассказал о том, как описаны идиоматические словосочетания и каким образом переводчик на базе Compreno находит верный перевод для предложений вроде «Он дал дуба».

После рассказа о технологиях для студентов была организована небольшая экскурсия по офису. Наибольший интерес вызвала доска рядом с кабинетом техподдержки, на которой сотрудники компании вывешивают наиболее примечательные письма пользователей — как гневные («срочно сделайте поддержку древнегреческого!»), так и благодарственные.