• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
ФКН
Контакты

Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4

 

🧭 Как до нас добраться

 

Телефон: +7 (495) 772-95-90 доб. 22734

E-mail: ling@hse.ru

Руководство
Заместитель руководителя Ахапкина Яна Эмильевна
Статья
После, через, спустя во временны́х контекстах: из наблюдений над текстами казахско-русских билингвов

Ахапкина Я. Э., Рахилина Е. В., Казкенова А. К.

Вестник Томского государственного университета. Филология. 2021. Т. 73. С. 93-113.

Глава в книге
Quantitative Analysis of Passives with Agent Phrase Based on Multilingual Parallel Data

Нестеренко Л. В.

In bk.: Post-Proceedings of the 5th Conference Digital Humanities in the Nordic Countries (DHN 2020). Iss. 2865. 2021. P. 5-15.

Препринт
Effort versus performance tradeoff in lemmatisation for Uralic languages

Tyers F. M., Bibaeva M.

Proceedings of the Sixth International Workshop on Computational Linguistics of Uralic Languages. 2020.iwclul-1.2. Association for Computational Linguistics, 2020

Fear and Loathing and DH: чем запомнился участникам четвёртый хакатон Центра цифровых гуманитарных исследований НИУ ВШЭ

13 ноября состоялся уже четвёртый хакатон DH-центра. Весь день с утра и до позднего вечера исследователи составляли образ врача на основе упоминаний в соцсетях, знакомились с трендами мем-культуры за последние десять лет и даже ненадолго попробовали себя в роли тренера покемонов.

13 ноября 2021 года в 11:00 стартовал четвёртый по счёту хакатон, организованный и проведённый на базе Центра цифровых гуманитарных исследований НИУ ВШЭ. Более десяти команд попробовали свои силы в программировании, анализе данных, визуализации и машинном обучении на разнообразном наборе датасетов. Данные действительно были всякие: корпус эволюции законопроектов между чтениями в Госдуме; оцифрованная коллекция почтовых открыток «Пишу тебе», предоставленная интернет-изданием “Системный Блокъ”; корпус дневниковых записей, собранный проектом «Прожито»; тексты о врачах от НИИ здравоохранения и медицинского менеджмента ДЗМ г. Москвы; коллекция мемов с сайта imgflip и корпус интервью проекта «Народная история России».

Это уже второй хакатон, проведённый в онлайн-формате. Как показывает практика, онлайн не только не помешал коммуникации, но и расширил горизонты. Участники были самого разного возраста и представляли множество организаций из разных городов: были как первокурсники-бакалавры из Школы лингвистики, так и аспиранты-программисты; участники подключались из Москвы, Перми, Самары, Казани и даже Тувы. Некоторые участники объединились в команды заранее, кто-то предпочёл работать в одиночестве, а кто-то нашёл себе команду прямо на месте.
Перед командами стояло множество задач, варьирующихся в зависимости от датасета. В основном это были задачи, поставленные самими участниками, но были и предложенные организаторами. Команды, работающие с датасетом о врачах, должны были собрать информацию об образе медицинского работника в соцсетях и по возможности предложить возможности его поддержания и улучшения.

Те, кто работал с открытками, заинтересовались корреляцией между геоданными и содержанием.

Исследователи мемов и дневников провели частотную аналитику текстов своих корпусов, а команды “Народной истории России” заинтересовались историей исчезнувших географических объектов и сконструировали социокультурную модель Москвы.

Самым популярным оказался датасет законопроектов; исследователи определяли взаимосвязь между темой закона и скоростью его принятия, отслеживали корреляцию между активностью депутата и его шансами быть избранным повторно и даже обучили свой генератор законопроектов.

В основном исследования проводились с помощью языка программирования Python, но использовали и R, и Excel, и даже Word.

В конце хакатона участники представили результаты своей работы на общей зум-встрече. Хакатон успешно завершили десять команд и три исследователя-одиночки. Мы узнали много нового: например, что самые активные отправители и получатели открыток в России живут в южных регионах.

Оказалось, что самым популярным мемом за последние 10 лет является “ну тот, где офисного работника выкидывают из окна”; что больше всего исчезнувших объектов находится в центре Москвы; что активных депутатов не всегда переизбирают; что о врачах часто говорят в религиозном контексте...

Мы узнали, что в большинстве районов Москвы жители часто обсуждают места отдыха, а кому-то даже удалось пособирать покемонов с помощью анализа дневников. 

Несмотря на упорную работу, общая атмосфера на хакатоне оставалась дружелюбной и ненапряженной. Участники поддерживали друг друга, и уже выступившие команды часто с удовольствием оставались послушать других. Хакатон чуть-чуть не дотянул до полуночи, продлившись 12 часов и 50 минут.

Вот как отзываются о прошедшем хакатоне его участники:

Командная работа, возможность взаимодействия с коллегами. Понравилось смотреть результат других команд, смотреть другие проекты/датасеты. Море положительных эмоций и заряд энергии. Дружеская атмосфера
  • Николай Попов, команда “ЮННА”, магистратура “Цифровые методы в гуманитарных науках”, НИУ ВШЭ Пермь
Понравились наборы данных, открытость организаторов, командный дух и в общем-то отсутствие каких-то излишне жестких регламентов и духа соперничества -- думаю, это было плюсом.
  • Елена Клячко, команда “Альфа”, аспирант Школы лингвистики, НИУ ВШЭ Москва
Понравился формат вольных кейсов, когда можешь что-то сделать свое по заданной секции, исходя из временных, человеческих ресурсов и навыков/знаний. Организация очень хорошая, царит атмосфера дружелюбия и взаимопощи. Я для себя сделал такую большую работу, что собираюсь дальше ее развивать и писать статьи по исследованию. Собственно, за этим я и пришел в ВШЭ. Хакатон позволил мне проверить себя, и теперь я  могу еще объективнее судить о своих навыках. Это и понравилось на хакатоне - ты открываешь в себе что-то новое и резюмируешь для себя свои навыки и знания.
  • Ахмед Магомедов, исследователь-одиночка, магистратура “Цифровые методы в гуманитарных науках”, НИУ ВШЭ Москва
Интересная задача, к которой можно было подойти с разных сторон. Хорошая вводная по задаче со стороны кураторов кейса. Спасибо организаторам за помощь в поиске команды.
  • Евгений Типсин, команда “DiarysGo”, Atlas Biomed Group

Большое спасибо всем огранизаторам и участникам хакатона, а также организациям, предоставившим данные для анализа!