• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4

 

🧭 Как до нас добраться

 

Телефон: +7 (495) 772-95-90 доб. 22734

E-mail: ling@hse.ru

Руководство
Заместитель руководителя Ахапкина Яна Эмильевна

Редакторы сайта — Наталья Борисовна Пименова, Татьяна Борисовна Казакова, Максим Олегович Бажуков, Юлия Геннадьевна Бадрызлова

Книга
Митрополиты, мудрецы, переводчики в cредневековой Европе

Белов Н. В., Бойцов М. А., Виноградов А. Ю. и др.

М.: Издательский дом НИУ ВШЭ, 2024.

Статья
Building an Open Corpus and a Morphological Parser for Corpus Annotation for Standard Dargwa

Svetlana Iu. Toldova, Elena O. Sokur.

Journal of Siberian Federal University. Series: Humanities & Social Sciences. 2024. Vol. 17. No. 5. P. 905-915.

Глава в книге
SmurfCat at PAN 2024 TextDetox: Alignment of Multilingual Transformers for Text Detoxification

Rykov E., Zaytsev K., Anisimov I. et al.

In bk.: CLEF 2024 Working Notes. CEUR Workshop Proceedings, 2024. P. 2866-2871.

Препринт
Exploring the Effectiveness of Methods for Persona Extraction
В печати

Konstantin Zaitsev.

arxiv.org. Computer Science. Cornell University, 2024

В школе лингвистики прошел Gensim Coding Sprint

10 ноября студенты школы поучаствовали в хакатоне Gensim Coding Sprint. Его проводил один из разработчиков библиотеки gensim, эксперт в области автоматической обработки языка Лев Константиновский.

Python-библиотека gensim — популярный инструмент для автоматической обработки языка, основанный на машинном обучении. Он активно используется как коммерческими компаниями, так и академическими исследователями. В gensim реализованы алгоритмы дистрибутивной семантики word2vec и doc2vec, он позволяет решать задачи тематического моделирования (topic modeling) и выделять основные темы текста или документа (например, веб-страницы).

От школы лингвистики в хакатоне участвовали как магистры программы «Компьютерная лингвистика», так и бакалавры старших курсов. Кроме того, к ним присоединились представители МФТИ.

хакатон Gensim Coding Sprint

Участники хакатона могли выбирать между заданиями двух типов: исправлять ошибки (баги) непосредственно в коде или читать и улучшать обучающие материалы по gensim. Как отметил организатор хакатона Лев Константиновский, студентам школы лингвистики удалось внести свой вклад в оба дела.

 Спасибо большое за организацию вчера. Было приятно познакомиться со студентами школы лингвистики. И конечно же, несколько багов исправили! Удалось поговорить со студентами об их курсовых проектах. Есть интересные, и некоторые используют gensim

Лев Константиновский
разработчик и community-менеджер gensim

После хакатона Лев выразил готовность помочь студентам школы с проектами, использующими библиотеку gensim. Получить его консультации можно, приняв участие в бесплатной (но крайне требовательной) студенческой программе обучения Data Science.