• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
ФКН
Контакты

Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4

 

🧭 Как до нас добраться

 

Телефон: +7 (495) 772-95-90 доб. 22734

E-mail: ling@hse.ru

Руководство
Заместитель руководителя Ахапкина Яна Эмильевна
Книга
Number in the World's Languages
В печати

Под редакцией: P. Acquaviva, M. Daniel.

Berlin: De Gruyter Mouton, 2022.

Глава в книге
Русские итеративные наречия: штрихи к лексикографическому портрету

Апресян В. Ю., Шмелев А. Д.

В кн.: Компьютерная лингвистика и интеллектуальные технологии: по материалам международной конференции «Диалог 2022», выпуск 21. Вып. 21. Изд-во РГГУ, 2022. Гл. 3. С. 18-32.

Препринт
mGPT: Few-Shot Learners Go Multilingual

Shliazhko O., Fenogenova A., Tikhonova M. et al.

Statistical mechanics. arXie. arXive, 2022

Fear and Loathing and DH: чем запомнился участникам четвёртый хакатон Центра цифровых гуманитарных исследований НИУ ВШЭ

13 ноября состоялся уже четвёртый хакатон DH-центра. Весь день с утра и до позднего вечера исследователи составляли образ врача на основе упоминаний в соцсетях, знакомились с трендами мем-культуры за последние десять лет и даже ненадолго попробовали себя в роли тренера покемонов.

13 ноября 2021 года в 11:00 стартовал четвёртый по счёту хакатон, организованный и проведённый на базе Центра цифровых гуманитарных исследований НИУ ВШЭ. Более десяти команд попробовали свои силы в программировании, анализе данных, визуализации и машинном обучении на разнообразном наборе датасетов. Данные действительно были всякие: корпус эволюции законопроектов между чтениями в Госдуме; оцифрованная коллекция почтовых открыток «Пишу тебе», предоставленная интернет-изданием “Системный Блокъ”; корпус дневниковых записей, собранный проектом «Прожито»; тексты о врачах от НИИ здравоохранения и медицинского менеджмента ДЗМ г. Москвы; коллекция мемов с сайта imgflip и корпус интервью проекта «Народная история России».

Это уже второй хакатон, проведённый в онлайн-формате. Как показывает практика, онлайн не только не помешал коммуникации, но и расширил горизонты. Участники были самого разного возраста и представляли множество организаций из разных городов: были как первокурсники-бакалавры из Школы лингвистики, так и аспиранты-программисты; участники подключались из Москвы, Перми, Самары, Казани и даже Тувы. Некоторые участники объединились в команды заранее, кто-то предпочёл работать в одиночестве, а кто-то нашёл себе команду прямо на месте.
Перед командами стояло множество задач, варьирующихся в зависимости от датасета. В основном это были задачи, поставленные самими участниками, но были и предложенные организаторами. Команды, работающие с датасетом о врачах, должны были собрать информацию об образе медицинского работника в соцсетях и по возможности предложить возможности его поддержания и улучшения.

Те, кто работал с открытками, заинтересовались корреляцией между геоданными и содержанием.

Исследователи мемов и дневников провели частотную аналитику текстов своих корпусов, а команды “Народной истории России” заинтересовались историей исчезнувших географических объектов и сконструировали социокультурную модель Москвы.

Самым популярным оказался датасет законопроектов; исследователи определяли взаимосвязь между темой закона и скоростью его принятия, отслеживали корреляцию между активностью депутата и его шансами быть избранным повторно и даже обучили свой генератор законопроектов.

В основном исследования проводились с помощью языка программирования Python, но использовали и R, и Excel, и даже Word.

В конце хакатона участники представили результаты своей работы на общей зум-встрече. Хакатон успешно завершили десять команд и три исследователя-одиночки. Мы узнали много нового: например, что самые активные отправители и получатели открыток в России живут в южных регионах.

Оказалось, что самым популярным мемом за последние 10 лет является “ну тот, где офисного работника выкидывают из окна”; что больше всего исчезнувших объектов находится в центре Москвы; что активных депутатов не всегда переизбирают; что о врачах часто говорят в религиозном контексте...

Мы узнали, что в большинстве районов Москвы жители часто обсуждают места отдыха, а кому-то даже удалось пособирать покемонов с помощью анализа дневников. 

Несмотря на упорную работу, общая атмосфера на хакатоне оставалась дружелюбной и ненапряженной. Участники поддерживали друг друга, и уже выступившие команды часто с удовольствием оставались послушать других. Хакатон чуть-чуть не дотянул до полуночи, продлившись 12 часов и 50 минут.

Вот как отзываются о прошедшем хакатоне его участники:

Командная работа, возможность взаимодействия с коллегами. Понравилось смотреть результат других команд, смотреть другие проекты/датасеты. Море положительных эмоций и заряд энергии. Дружеская атмосфера
  • Николай Попов, команда “ЮННА”, магистратура “Цифровые методы в гуманитарных науках”, НИУ ВШЭ Пермь
Понравились наборы данных, открытость организаторов, командный дух и в общем-то отсутствие каких-то излишне жестких регламентов и духа соперничества -- думаю, это было плюсом.
  • Елена Клячко, команда “Альфа”, аспирант Школы лингвистики, НИУ ВШЭ Москва
Понравился формат вольных кейсов, когда можешь что-то сделать свое по заданной секции, исходя из временных, человеческих ресурсов и навыков/знаний. Организация очень хорошая, царит атмосфера дружелюбия и взаимопощи. Я для себя сделал такую большую работу, что собираюсь дальше ее развивать и писать статьи по исследованию. Собственно, за этим я и пришел в ВШЭ. Хакатон позволил мне проверить себя, и теперь я  могу еще объективнее судить о своих навыках. Это и понравилось на хакатоне - ты открываешь в себе что-то новое и резюмируешь для себя свои навыки и знания.
  • Ахмед Магомедов, исследователь-одиночка, магистратура “Цифровые методы в гуманитарных науках”, НИУ ВШЭ Москва
Интересная задача, к которой можно было подойти с разных сторон. Хорошая вводная по задаче со стороны кураторов кейса. Спасибо организаторам за помощь в поиске команды.
  • Евгений Типсин, команда “DiarysGo”, Atlas Biomed Group

Большое спасибо всем огранизаторам и участникам хакатона, а также организациям, предоставившим данные для анализа!