• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4

 

🧭 Как до нас добраться

 

Телефон: +7 (495) 772-95-90 доб. 22734

E-mail: ling@hse.ru

Руководство
Заместитель руководителя Ахапкина Яна Эмильевна

Редакторы сайта — Наталья Борисовна Пименова, Татьяна Борисовна Казакова, Максим Олегович Бажуков, Юлия Геннадьевна Бадрызлова

Книга
Proceedings of the 3rd Workshop on NLP Applications to Field Linguistics (Field Matters 2024)

Bangkok: Association for Computational Linguistics, 2024.

Глава в книге
Mathematicon: A corpus-based platform for teachers and students of RFL
В печати

Anna Leonteva, Toldova S., Fedorov D. et al.

In bk.: Teaching Russian Through STEM: Contexts, Tools, and Approaches. Vol. 1st Edition. L.: Taylor & Francis, 2024.

Препринт
Exploring the Effectiveness of Methods for Persona Extraction
В печати

Konstantin Zaitsev.

arxiv.org. Computer Science. Cornell University, 2024

Хакатон Gensim Coding Sprint

Мероприятие завершено
Школа лингвистики совместно с RaRe Technologies проводит мастер-класс ("хакатон") по библиотеке для обработки естественного языка Gensim. Ведущий хакатона – разработчик Gensim и эксперт по автоматической обработке языка Лев Константиновский. От школы лингвистики будут участвовать профессор Ольга Ляшевская, преподаватели Елизавета Кузьменко, Эльмира Мустакимова, Даниил Скоринкин.

Python-библиотека Gensim — популярный инструмент для автоматической обработки языка, основанный на машинном обучении и используемый как коммерческими компаниями, так и академическими исследователями. В Gensim реализованы алгоритмы дистрибутивной семантики word2vec и doc2vec, он позволяет решать задачи тематического моделирования (topic modeling) и выделять основные темы текста или документа.

Требования к участникам

Хакатон открыт для начинающих разработчиков приложений, работающих с текстами на естественном языке, знаний в области машинного обучения не требуется. Необходимы базовые навыки Python, например, понимание того, как устроены в Python циклы. Участие в мероприятии будет полезно студентам-лингвистам, специализирующимся на компьютерной лингвистике и автоматической обработке языка. 

Участники будут работать в Python 3. Желательно установить библиотеки/пакеты genism, sklearn, pandas, matplotlib, nltk, pyemd, а также Cython и Jupyter notebook.

Информация об организаторе

Лев Константиновский — эксперт в автоматической обработке языка, имеющий богатый опыт программирования на Python и Java. В качестве менеджера RaRe Technologies Лев осуществляет поддержку Gensim и управляет сообществом разработчиков вокруг него.

Место

ул. Старая Басманная, д 21/4, аудитория 506