• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4

 

🧭 Как до нас добраться

 

Телефон: +7 (495) 772-95-90 доб. 22734

E-mail: ling@hse.ru

Руководство
Заместитель руководителя Ахапкина Яна Эмильевна
Школа лингвистики: Менеджер Дьячкова Анна Евгеньевна

Редакторы сайта — Наталья Борисовна Пименова, Татьяна Борисовна Казакова, Максим Олегович Бажуков

Книга
Шугнанские этюды. Сборник статей о шугнанском языке

Хорог: Институт гуманитарных наук НАНТ, 2025.

Статья
Features of Perception of a Person’s Own Name Compared to the Perception of Names with Similar and Different Sounds: Analysis of Event-Related Potentials
В печати

Oknina L. B., Podlepich V. V., Vologdina Y. O. et al.

Human Physiology. 2025. Vol. 51. No. 2. P. 79-88.

Глава в книге
Стандартизация шугнанского алфавита: теория и практика

Меленченко М. Г.

В кн.: Шугнанские этюды. Сборник статей о шугнанском языке. Хорог: Институт гуманитарных наук НАНТ, 2025. С. 18-38.

Препринт
You shall know a piece by the company it keeps. Chess plays as a data for word2vec models

Orekhov B.

arxiv.org. Computer Science. Cornell University, 2024

Алгоритм для выявления коррупциогенности: магистрант Школы лингвистики одержал победу на хакатоне в Нижнем Новгороде

Алгоритм для выявления коррупциогенности: магистрант Школы лингвистики одержал победу на хакатоне в Нижнем Новгороде

С 10 по 12 сентября в Нижнем Новгороде на территории строительного колледжа проводился очередной этап хакатона по искусственному интеллекту. 16 команд занимались разработкой аналитической системы, позволяющей выявлять и классифицировать возможные коррупциогенные факторы в нормативно-правовых актах Российской Федерации. Целью хакатона являлось сокращение трудозатрат при проведении антикоррупционной экспертизы.

Победителем четвертого хакатона по искусственному интеллекту стала команда «Наносемантика» (Москва). Участники команды: Александр Туманов (студент 1 курса магистратуры НИИ ВШЭ факультета Компьютерной лингвистики, Junior DS Наносемантика), Павел Сухачев (Team Lead DS Наносемантика).

Команда представила алгоритм машинного обучения, который определяет по строке законодательного документа присутствует ли в ней коррупциогенный фактор. Итоговый результат был оформлен в виде веб-сервиса, в который загружается текст закона, а выходом являются фрагменты документа с размеченными коррупциогенными факторами. Среди прочего, победа была достигнута за счет таких особенностей алгоритма, как синтез текста для устранения дисбаланса классов, мета-алгоритм для лучшей разметки датасета, использования бустинга на решающих деревьях, использование active learning при обучении.