Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.
Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4
Телефон: +7 (495) 772-95-90 доб. 22734
E-mail: ling@hse.ru
Редакторы сайта — Наталья Борисовна Пименова, Татьяна Борисовна Казакова, Максим Олегович Бажуков, Юлия Геннадьевна Бадрызлова
Школа лингвистики была образована в декабре 2014 года. Сотрудники школы преподают на образовательных программах по теоретической и компьютерной лингвистике в бакалавриате и магистратуре. Лингвистика, которой занимаются в школе, — это не только знание иностранных языков, но прежде всего наука о языке и о способах его моделирования. Научные группы школы занимаются исследованиями в области типологии, социолингвистики и ареальной лингвистики, корпусной лингвистики и лексикографии, древних языков и истории языка. Кроме того, в школе создаются лингвистические технологии и ресурсы: корпуса, обучающие тренажеры, словари и тезаурусы, технологии для электронного представления текстов культурного наследия.
Bangkok: Association for Computational Linguistics, 2024.
Труды института русского языка им. В.В. Виноградова. 2024. № 4 (42). С. 102-118.
В кн.: Будь в курсе цифровых гуманитарных исследований. Красноярск: Сибирский федеральный университет, 2024. С. 164-181.
arxiv.org. Computer Science. Cornell University, 2024
HSE Data Science Hack проводился впервые. Задача и датасет были предоставлены сотрудниками Центра искусственного интеллекта НИУ ВШЭ. Участникам хакатона было предложено решить задачу по оценке этической репутации банков на основе текстовой информации — отзывов клиентов банков, оставленных на различных онлайн-площадках.
Хакатон проводился на платформе Yandex DataSphere — это сервис для ML-разработки с динамически масштабируемыми облачными ресурсами для полного цикла разработки машинного обучения.
Хакатон (буквально "марафон для хакеров") -- форум для разработчиков, во время которого специалисты из разных областей разработки программного обеспечения (программисты, дизайнеры, менеджеры) сообща решают какую-либо задачу на время.
В качестве экспертов в мероприятии приняли участие:
— Дмитрий Сошников, эксперт в области машинного обучения, эксперт Клуба хакатонщиков ФКН;
— Артем Макеенок, ML Product manager, Yandex Cloud;
— Дмитрий Рыбалко, эксперт по DataScience, Yandex Cloud;
— Сергей Ткаченко, скрам-мастер функциональной группы, МТС Диджитал;
— Андрей Никулкин, CEO IQnix Tech, региональный ED-Tech Московской области (МАИТ/МОКИТ);
— Анна Козырева, директор Центра координации проекта по межотраслевым технологиям ИИ и ИИ для отраслей экономики и социальной сферы;
— Максим Сторчевой, доцент Санкт-Петербургской школы экономики и менеджмента, НИУ ВШЭ Санкт-Петербург;
— Дарья Гвоздева, амбассадор Яндекса в НИУ ВШЭ;
— Алёна Васильева, ментор Клуба хакатонщиков ФКН.
С полным перечнем приглашенных экспертов можно ознакомиться на странице хакатона. Мероприятие открыл руководитель Клуба хакатонщиков ФКН Александр Поповкин. Для участников проводились мастер-классы от экспертов ФКН и Яндекса:
— Yandex Data Sphere больше, чем Jupyter Notebook
— Полезные тулзы для ML
— Кто такой амбассадор Яндекса?
— Стажировка в Яндексе
— Жизнь после хакатона, или как мы решили упростить работу с талантами?
По решению жюри победителями HSE Data Science Hack стали следующие команды:
Первое место: Синтаксическая ошибка (Ахмед Дугричилов, Арина Замышевская, Мария Иванина и Ярослав Соколов, второй курс бакалавриата «Фундаментальная и компьютерная лингвистика» НИУ ВШЭ);
Второе место: Fit predict (Владислав Баранов, Михаил Гончаров, Никита Ятченко, Татьяна Яковлева, Михаил Ященко, первый курс магистратуры «Финансовые технологии и анализ данных» НИУ ВШЭ);
Третье место: ШыШъ (Даниил Сидоров, Павел Гуревич, Богдан Карпович, Артем Подвальный, Искандер Шамигулов, третий курс бакалавриата «Биотехнологии» МФТИ);
Приз зрительских симпатий: NAMM (Максим Егоров, четвертый курс бакалавриата «Системный анализ и управление» МАИ; Арслан Шахназаров, четвертый курс бакалавриата «Международная программа по экономике и финансам» НИУ ВШЭ; Сергей Кушнерюк, четвертый курс бакалавриата «Прикладная математика и информатика» МФТИ; Никита Курдюков, четвертый курс бакалавриата «Электроника и наноэлектроника» НИУ МЭИ).
Для всей нашей команды это первый опыт участия в хакатоне. Нас больше всего порадовало, что нам помогли сориентироваться в теме и сразу после постановки задачи мы смогли понять, куда двигаться.
А еще хакатон стал отличным шансом понять, что я действительно готова заниматься этим направлением профессионально. Было круто)
Было очень интересно поучаствовать в хакатоне на тему NLP, и решать на практике задачи, связанные с нашей будущей специальностью - компьютерной лингвистикой. Спасибо организаторам за такой опыт, всем удачи и успехов!
Опыт первого хакатона всем понравился, Вышка тоже! Организация порадовала, всегда находились люди, готовые ответить на вопросы. Здорово, что оперативно решались проблемы с датасферой, неидеальными данными, локальными нуждами участников. Призовой мерч классный. Атмосфера тоже такая, уютная но и рабочая одновременно.
Было бы здорово увидеть подобное мероприятие в более масштабном формате. И будет круто, если получится устроить хакатон с ночью.
Так что в целом все в команде довольны, что приехали, прониклись атмосферой хакатона, так что огромное спасибо за организацию этого действа!
Я был рад выступить на хакатоне в качестве эксперта. В течение двух дней у студентов была возможность поэкспериментировать с различными подходами для решения задачи текстовой аналитики и познакомиться с такими новыми инструментами для обучения и деплоя ML-моделей как, например, Yandex DataSphere.
Было интересно делиться с участниками своим опытом в решении ML-задач, и с не меньшим удовольствием я послушал про подходы и модели, которые представили участники. Хочется отметить, что многие команды не только рассказывали о качестве моделей, но и демонстрировали различные способы их использования, например в качестве веб-сервиса. Я уверен, что участие в хакатоне полезно и участникам, и экспертам, потому что это опыт, новые навыки, живое общение, реальные отзывы. Желаю нам всем побольше таких мероприятий!
Директор центра координации проекта по межотраслевым технологиям ИИ и ИИ для отраслей экономики и социальной сферы
Задача, которую решали участники хакатона является частью реальной разработки, создаваемой исследователями центра ИИ в рамках проекта «Индекс этичности компаний». Таким образом, ребята фактически попробовали свои силы в проработке решения, которое может быть востребовано российскими компаниями для оценки этической репутации и социальной ответственности на основе машинного анализа открытых текстовых данных.