• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4

 

🧭 Как до нас добраться

 

Телефон: +7 (495) 772-95-90 доб. 22734

E-mail: ling@hse.ru

Руководство
Заместитель руководителя Ахапкина Яна Эмильевна

Редакторы сайта — Наталья Борисовна Пименова, Татьяна Борисовна Казакова, Максим Олегович Бажуков, Юлия Геннадьевна Бадрызлова

Книга
Proceedings of the 3rd Workshop on NLP Applications to Field Linguistics (Field Matters 2024)

Bangkok: Association for Computational Linguistics, 2024.

Статья
История стиховедения и формализм

Орехов Б. В.

Слово.ру: балтийский акцент. 2024. Т. 15. № 4. С. 147-157.

Глава в книге
The Parallel Corpus of Russian and Ruska Romani Languages

Kirill Koncha, Abina Kukanova, Kazakova Tatiana et al.

In bk.: Proceedings of the 3rd Workshop on NLP Applications to Field Linguistics (Field Matters 2024). Bangkok: Association for Computational Linguistics, 2024. Ch. 1. P. 1-5.

Препринт
Exploring the Effectiveness of Methods for Persona Extraction
В печати

Konstantin Zaitsev.

arxiv.org. Computer Science. Cornell University, 2024

«А еще нужно не бояться»: Мария Шеянова и Фрэнсис Тайерс рассказали о Google Summer of Code

Минувшим летом студентка бакалавриата школы лингвистики Мария Шеянова участвовала в программе Google Summer of Code, а теперь поделилась опытом с другими студентами. Вместе с ней выступил Фрэнсис Тайерс — разработчик платформы Apertium, участвующей в программе Google.

В этот четверг мы устроили встречу, на которой рассказали всем желающим о том, что такое Google Summer of Code и как принять в нём участие. Фрэнсис Тайерс (Francis Tyers) — ментор от организации Apertium, которая занимается машинным переводом, основанным на правилах. Я сейчас учусь на четвёртом курсе бакалавриата, и участвовала в GSoC после третьего курса. Кроме меня, этим летом от Вышки в Apertium было 3 студента магистратуры, а моя однокурсница Саша Чащина участвовала в GSoC с другой организацией. Вот основные вещи, о которых мы рассказывали на встрече. 

Что такое GSoC?

Google Summer of Code — это студенческая программа, в которой студенты работают на организации с открытым исходным кодом и получают деньги от Google. За лето можно заработать $5500: $500 в мае, в самом начале работы; $2250 в середине лета, после промежуточной оценки работы (midterm evaluation), и $2750 в конце лета, после того как станет известно, что организация приняла проект. В конце зимы опенсорсные организации подаются для участия, их заявки рассматривают и часть принимают. После этого студенты выбирают проекты и подают заявки (proposals), а организации выбирают лучших из них для работы летом. 

Когда всё происходит?

27 февраля станут известны списки принятых организаций. С этого момента студенты выбирают себе организацию и проект по вкусу, и общаются со своими потенциальными менторами. С 20 марта по 3 апреля студенты могут подавать пропозалы. 4 мая опубликуют список принятых проектов, после этого момента будет чуть меньше месяца до начала работы. Это время называется Community Bonding Period — период времени, когда студенты интегрируются в сообщество, читают документацию и осваивают необходимые инструменты. Официально работа начинается 30 мая и заканчивается 29 августа.

Что хорошего может дать GSoC?

GSoC прекрасен не только тем, что с его помощью можно заработать. Для меня очень важным было, то что в течение работы нужно много учиться. Я за эти весну и лето научилась работать с командной строкой Linux, писать небольшие скрипты на Bash, сильно подтянула и расширила умение программировать на языке Python и узнала много про то, как работает правиловый машинный перевод (rule-based machine translation). Наверняка я что-нибудь забыла: думаю, большую часть новых умений трудно классифицировать. А ещё это бесценный опыт работы над индивидуальным проектом в организации разработчиков и шанс внести вклад в системы, которыми реально пользуются.

Что нужно, чтобы принять участие?

Чтобы вы могли принять участие в этой программе, вам должно быть как минимум 18 лет, и на момент подачи вы должны быть студентом (бакалавриата, магистратуры или PhD).

Чего ожидать?

Вот основные вещи, к которым стоит быть готовым: 

  • В первую очередь надо помнить, что это полная (fulltime) занятость, то есть работа по 30-40 часов в неделю. Нельзя забросить проект и за неделю до midterm evaluation быстро наверстать упущенное: объём будет не тот, что уж говорить о качестве. 
  • Из предыдущего пункта и того, что GSoC проходит полностью онлайн, вытекает то, что нужно уметь самостоятельно организовывать свою работу. Мне кажется, хороший подход – завести себе какое-то подобие ежедневного графика и стараться его придерживаться. 
  • Быть всё время на связи и постоянно отчитываться о проделанной работе. От вас могут потребовать, чтобы вы во время работы были доступны на канале организации в IRC. “Consider it as your office” – сказал мне Фрэнсис в самом начале GSoC 2016. 
  • Нужно быть готовым к тому, что в процессе работы придётся много учиться. Поэтому способность быстро освоить новый инструмент/разобраться в принципах работы какой-то системы – очень важное качество. 
  • Все официальные дедлайны GSoC строгие, и подходить к ним стоит серьёзно, даже если речь идёт о заполнении небольшой формы с ответами. Я помню, как в общую рассылку писал студент, проект которого аннулировали исключительно потому, что он отложил какой-то несложный, но обязательный шаг на последний день, а в последний день запутался в часовых поясах и пропустил дедлайн. К внутренним дедлайнам вашей организации, в том числе тем дедлайнам, которые вы себе поставили сами, тоже нужно подходить ответственно.

Советы по подаче в GSoC

Наверное, главный ключ к успеху при подаче на GSoC – как бы тривиально это ни звучало, начать делать всё заранее: начать узнавать, какие организации обычно участвуют в GSoC, до публикации списков (это можно сделать в архивах GSoC прошлых годов), начать связываться с организациями и разбираться в их софте чем раньше, тем лучше, написать заявление на участие (proposal) заранее (и обязательно показать его вашим потенциальным менторам!), и так далее. Так вы не только выиграете значительное время чтобы справиться с трудностями, но и покажете организациям вашу заинтересованность и серьёзность намерений. Ещё один хороший совет – внимательно отнестись к требованиям организации, к тому, что составляет основную сферу их интересов и в чём заключается их философия. Понимание того, что важно организации, в которую вы подаётесь, может стать значительным преимуществом.  

А ещё нужно не бояться. Если вам очень хочется участвовать, есть время и силы, но вы боитесь, что недостаточно хороши: вы ничего не потеряете, если попробуете! Обидно, обладая, может быть, лучшими навыками, уступать своё место тем, кто просто не испугался.

Мои впечатления от встречи

Я рада, что на встречу пришло много студентов, а ещё многие хотели прийти. Приятно осознавать, что рассказываешь людям о чём-то полезном и важном как им самим, так и опенсорсным проектам. В прошлом году я узнала о GSoC от Кати Агеевой, которая к тому моменту участвовала там дважды, и тогда очень вдохновилась её рассказом. Надеюсь, что в этом году мне тоже удастся сподвигнуть людей принять участие в Google Summer of Code!