• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4

 

🧭 Как до нас добраться

 

Телефон: +7 (495) 772-95-90 доб. 22734

E-mail: ling@hse.ru

Руководство
Заместитель руководителя Ахапкина Яна Эмильевна

Редакторы сайта — Наталья Борисовна Пименова, Татьяна Брисовна Казакова, Максим Олегович Бажуков, Юлия Геннадьевна Бадрызлова

Глава в книге
Тест на распознавание книжных заголовков для младших школьников: пилотное исследование

Урывская Д. А., Староверова В. Н., Лопухина А. А. и др.

В кн.: Наука и образование: проблемы и перспективы [Электронный ресурс]: Материалы XXVI Международной научно-практической конференции молодых ученых и студентов, посвящённой 85-летию АГГПУ им. В. М. Шукшина (Бийск, 5 апреля 2024 г.). Бийск: АГГПУ им. В.М. Шукшина, 2024. С. 240-244.

Препринт
Grammar in Language Models: BERT Study

Chistyakova K., Kazakova Tatiana.

Linguistics. WP BRP. НИУ ВШЭ, 2023. No. 115.

Fear and Loathing and DH: чем запомнился участникам четвёртый хакатон Центра цифровых гуманитарных исследований НИУ ВШЭ

13 ноября состоялся уже четвёртый хакатон DH-центра. Весь день с утра и до позднего вечера исследователи составляли образ врача на основе упоминаний в соцсетях, знакомились с трендами мем-культуры за последние десять лет и даже ненадолго попробовали себя в роли тренера покемонов.

13 ноября 2021 года в 11:00 стартовал четвёртый по счёту хакатон, организованный и проведённый на базе Центра цифровых гуманитарных исследований НИУ ВШЭ. Более десяти команд попробовали свои силы в программировании, анализе данных, визуализации и машинном обучении на разнообразном наборе датасетов. Данные действительно были всякие: корпус эволюции законопроектов между чтениями в Госдуме; оцифрованная коллекция почтовых открыток «Пишу тебе», предоставленная интернет-изданием “Системный Блокъ”; корпус дневниковых записей, собранный проектом «Прожито»; тексты о врачах от НИИ здравоохранения и медицинского менеджмента ДЗМ г. Москвы; коллекция мемов с сайта imgflip и корпус интервью проекта «Народная история России».

Это уже второй хакатон, проведённый в онлайн-формате. Как показывает практика, онлайн не только не помешал коммуникации, но и расширил горизонты. Участники были самого разного возраста и представляли множество организаций из разных городов: были как первокурсники-бакалавры из Школы лингвистики, так и аспиранты-программисты; участники подключались из Москвы, Перми, Самары, Казани и даже Тувы. Некоторые участники объединились в команды заранее, кто-то предпочёл работать в одиночестве, а кто-то нашёл себе команду прямо на месте.
Перед командами стояло множество задач, варьирующихся в зависимости от датасета. В основном это были задачи, поставленные самими участниками, но были и предложенные организаторами. Команды, работающие с датасетом о врачах, должны были собрать информацию об образе медицинского работника в соцсетях и по возможности предложить возможности его поддержания и улучшения.

Те, кто работал с открытками, заинтересовались корреляцией между геоданными и содержанием.

Исследователи мемов и дневников провели частотную аналитику текстов своих корпусов, а команды “Народной истории России” заинтересовались историей исчезнувших географических объектов и сконструировали социокультурную модель Москвы.

Самым популярным оказался датасет законопроектов; исследователи определяли взаимосвязь между темой закона и скоростью его принятия, отслеживали корреляцию между активностью депутата и его шансами быть избранным повторно и даже обучили свой генератор законопроектов.

В основном исследования проводились с помощью языка программирования Python, но использовали и R, и Excel, и даже Word.

В конце хакатона участники представили результаты своей работы на общей зум-встрече. Хакатон успешно завершили десять команд и три исследователя-одиночки. Мы узнали много нового: например, что самые активные отправители и получатели открыток в России живут в южных регионах.

Оказалось, что самым популярным мемом за последние 10 лет является “ну тот, где офисного работника выкидывают из окна”; что больше всего исчезнувших объектов находится в центре Москвы; что активных депутатов не всегда переизбирают; что о врачах часто говорят в религиозном контексте...

Мы узнали, что в большинстве районов Москвы жители часто обсуждают места отдыха, а кому-то даже удалось пособирать покемонов с помощью анализа дневников. 

Несмотря на упорную работу, общая атмосфера на хакатоне оставалась дружелюбной и ненапряженной. Участники поддерживали друг друга, и уже выступившие команды часто с удовольствием оставались послушать других. Хакатон чуть-чуть не дотянул до полуночи, продлившись 12 часов и 50 минут.

Вот как отзываются о прошедшем хакатоне его участники:

Командная работа, возможность взаимодействия с коллегами. Понравилось смотреть результат других команд, смотреть другие проекты/датасеты. Море положительных эмоций и заряд энергии. Дружеская атмосфера
  • Николай Попов, команда “ЮННА”, магистратура “Цифровые методы в гуманитарных науках”, НИУ ВШЭ Пермь
Понравились наборы данных, открытость организаторов, командный дух и в общем-то отсутствие каких-то излишне жестких регламентов и духа соперничества -- думаю, это было плюсом.
  • Елена Клячко, команда “Альфа”, аспирант Школы лингвистики, НИУ ВШЭ Москва
Понравился формат вольных кейсов, когда можешь что-то сделать свое по заданной секции, исходя из временных, человеческих ресурсов и навыков/знаний. Организация очень хорошая, царит атмосфера дружелюбия и взаимопощи. Я для себя сделал такую большую работу, что собираюсь дальше ее развивать и писать статьи по исследованию. Собственно, за этим я и пришел в ВШЭ. Хакатон позволил мне проверить себя, и теперь я  могу еще объективнее судить о своих навыках. Это и понравилось на хакатоне - ты открываешь в себе что-то новое и резюмируешь для себя свои навыки и знания.
  • Ахмед Магомедов, исследователь-одиночка, магистратура “Цифровые методы в гуманитарных науках”, НИУ ВШЭ Москва
Интересная задача, к которой можно было подойти с разных сторон. Хорошая вводная по задаче со стороны кураторов кейса. Спасибо организаторам за помощь в поиске команды.
  • Евгений Типсин, команда “DiarysGo”, Atlas Biomed Group

Большое спасибо всем огранизаторам и участникам хакатона, а также организациям, предоставившим данные для анализа!