• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты

Адрес: 105066, г. Москва,
Старая Басманная ул., д. 21/4

 

🧭 Как до нас добраться

 

Телефон: +7 (495) 772-95-90 доб. 22734

E-mail: ling@hse.ru

Руководство
Заместитель руководителя Ахапкина Яна Эмильевна
Статья
После, через, спустя во временны́х контекстах: из наблюдений над текстами казахско-русских билингвов

Ахапкина Я. Э., Рахилина Е. В., Казкенова А. К.

Вестник Томского государственного университета. Филология. 2021. Т. 73. С. 93-113.

Глава в книге
Quantitative Analysis of Passives with Agent Phrase Based on Multilingual Parallel Data

Нестеренко Л. В.

In bk.: Post-Proceedings of the 5th Conference Digital Humanities in the Nordic Countries (DHN 2020). Iss. 2865. 2021. P. 5-15.

Препринт
Effort versus performance tradeoff in lemmatisation for Uralic languages

Tyers F. M., Bibaeva M.

Proceedings of the Sixth International Workshop on Computational Linguistics of Uralic Languages. 2020.iwclul-1.2. Association for Computational Linguistics, 2020

Отчет о деятельности проектных групп студентов и аспирантов

В конце сентября 2021 года руководители студенческих проектных групп, которые завершили свою работу осенью, отчитались о полученных результатах. Таким образом, можно подвести итоги первого конкурса студенческих проектов, который состоялся на ФГН в 2020-21 годах.

Image by <a href="https://pixabay.com/users/tumisu-148124/?utm_source=link-attribution&utm_medium=referral&utm_campaign=image&utm_content=2061635">Tumisu</a> from <a href="https://pixabay.com/?utm_source=link-attribution&utm_medium=referral&utm_campaign=image&utm_content=2061635">Pixabay</a>

Image by Tumisu from Pixabay
Free

Лингвоспецифическая разметка китайских текстов в Русско-китайском параллельном корпусе НКРЯ

О своих достижениях рассказали участники проекта «Лингвоспецифическая разметка китайских текстов в Русско-китайском параллельном корпусе НКРЯ». В проекте работало девять человек — студенты бакалавриата и магистратуры Школы лингвистики. Все поставленные задачи выполнены, как и ключевая: создан алгоритм более качественной разметки китайских текстов нежели предыдущий.

Елена Вольф - руководитель проекта, студентка 4 курса бакалавриата ОП «Фундаментальная и компьютерная лингвистика»

«Мы хотели улучшить разметку текстов в русско-китайском параллельном корпусе. Так как объем довольно большой, разметка присваивается автоматически. Мы разрабатывали алгоритм, который принимал бы на вход текст на китайском языке, разделял на слова и присваивал каждому PoS-метку и транскрипцию в системе пиньинь. Также планировали выступить с докладами на конференциях и написать статьи о проделанной работе. Всё это нам удалось: улучшили алгоритм (код и документация доступны в репозитории), переразметили весь корпус и выступили с докладами на семи конференциях».

Материалы проекта

Разработка материалов для школьной олимпиады по античной истории и культуре

Александр Соловьев - руководитель проекта, студент 1 курса ОП «Античность»

«Проект по разработке Олимпиады по античной культуре стал для восьми участников нашей команды, студентов третьего курса ОП «Античность», испытанием. С одной стороны, неясно было, на какие проекты ориентироваться – прочие российские олимпиады по античности предполагают знание древних языков. С другой – на какую аудиторию мы должны работать? Какие школьники будут готовы участвовать в не самой практичной олимпиаде?

Мы пришли к выводу, что должны создать некоторую информационную среду – небольшие популярные эссе, списки книг, ТОП-ы, которая должна привлекать школьников как старших, так и младших классов (несмотря на то, что на олимпиаде мы ждем преимущественно 6-7 классы), демонстрировать им широту вопросов, которые можно задавать античной культуре, давать выход их интересу и не позволять ему угасать. Сама олимпиада в конечном итоге стала лишь одним из элементов этой системы, пожалуй, даже не самым важным. Кроме того, стало ясно, что стоит разговаривать также и с родителями или учителями нашей аудитории – объяснять им практичность и перспективность интереса к античной культуре.

Конечно, понять это нам удалось не сразу, и сходу произвести огромное количество качественного контента оказалось невозможным – за год нам удалось сделать далеко не всё из того, что мы планировали. Однако с завершением проекта мы не собираемся останавливаться, и надеемся, что в конце этого или начале следующего учебного года проведем олимпиаду, а вскоре начнем размещать те материалы, над которыми работали во время проекта. И работать над олимпиадой мы будем каждый следующий год – в этом году успехом для нас будет, если в нашей олимпиаде примет участие хотя бы несколько десятков человек.

Наш проект долгоиграющий и рассчитан, при удачном стечении обстоятельств, на несколько лет вперед, так что, несмотря на скромные первые результаты, основными плодами проекта можно считать разработанную концепцию олимпиады и первые наброски того, как могли бы выглядеть сама олимпиада, и информационное поле вокруг нее. Надеюсь, скоро нам удастся опробовать их на практике».

Материалы проекта

Компьютерные и лингвистические ресурсы для поддержки шугнанского языка

Проект «Компьютерные и лингвистические ресурсы для поддержки шугнанского языка», под руководством Степана Михайлова, стажера-исследователя НУЛ по формальным моделям в лингвистике, реализуется девятью студентами Школы лингвистики и Института классического Востока и античности.

 

Юрий Макаров - секретарь проекта, студент 3 курса ОП «Фундаментальная и компьютерная лингвистика»

«Основной целью проекта было создание компьютерных ресурсов для изучения шугнанского языка и поддержания его витальности. Мы разработали электронную версию «Шугнанско-русского словаря» Д. Карамшоева, автоматический грамматический анализатор, корпус размеченных текстов, а также издали ограниченным тиражом русско-шугнанский и англо-шугнанский разговорник. С этими и другими результатами можно ознакомиться на сайте, который мы планируем существенно обновить, благодаря продолжению поддержки нашего проекта в рамках программы студенческих проектов ФГН».

Цифровой архив литературного журнала XIX века "Отечественные Записки"

 

Евгения Заковоротная - руководитель проекта, стажер-исследователь Института статистических исследований и экономики знаний

«Целью нашего проекта было приведение материалов указанного журнала в адекватный машиночитаемый формат и предоставление доступа к ним для проведения гуманитарных и междисциплинарных исследований. Цель осуществляется в несколько этапов. Часть из них заключается в OCR-распознавании и вычитке выпусков журнала от побочных ошибок, другая — в разработке удобного пользовательского интерфейса (веб-сайта), через который пользователи смогут осуществлять следующие функции:

  • выполнять поиск по корпусу,
  • изучать результаты поиска в дореформенной и современной орфографии,
  • скачивать размеченные в XML-выпуски журнала,
  • исправлять онлайн опечатки в распознанных OCR томах.

На данный момент создано две версии веб-сайта, тестовая и финальная, с отлаженной работой всех перечисленных функций. Обе версии веб-сайта подключены к базе данных, где хранится корпус. Объем корпуса на данный момент составляет 20 томов, в каждом из которых от 800 до 1100 страниц (~10 мил. словоформ).

На начальном этапе работы над проектом не было ничего, кроме доступа к выпускам журнала "Отечественные Записки" на сайте РНБ. С нуля был выстроен процесс работы, обработаны и вычитаны тома, создана база данных и сайт. Кроме того, на материале очищенных от ошибок выпусков журнала был обучен спеллчекер, программа для автоматического исправления опечаток. Спеллчекер был интегрирован на сайт для удаления простых ошибок и облегчения процесса вычитки.

Данная версия цифрового архива журнала "Отечественные Записки" является результатом огромной работы не только участников студенческой проектной группы (магистры Заковоротная Е.М., Ким Ю. Л. и бакалавры Волошина Е. Ю. и Кудрявцева П. С.), но и колоссальных стараний более 30 волонтеров и корректоров, принявших участие в проекте через Ярмарку Проектов НИУ ВШЭ. Именно благодаря их усилиям была решена одна из главных проблем проекта — вычитка объемных томов литературного журнала и удаление опечаток и побочных символов, возникших в тексте при распознавании. Данный проект имеет большой потенциал для дальнейшего развития как в плане увеличения объема корпуса, так и расширении функционала и возможностей сайта».

Результаты проекта

Патрон, клиент и брокер. Неформальные социальные связи в истории России в XVIII-начале XX в. как фактор ее развития

У проекта «Патрон, клиент и брокер. Неформальные социальные связи в истории России в XVIII-начале XX в. как фактор ее развития» также много значимых достижений. За время работы команды из девяти человек проведены три научно-исследовательских семинара с историками-специалистами из ЕУСПб и НИУ ВШЭ, участники группы сделали восемь докладов на всероссийских и международных научных конференциях по различным сюжетам истории патрон-клиентских отношений: от анализа отдельных исторических источников до разбора отдельных кейсов из истории регионального управления, придворной жизни и научной жизни, опубликовано пять статей в сборниках РИНЦ.

 

Денис Сметанин - руководитель проекта, стажер-исследователь Проектной лаборатории развития интеллектуальных состязаний

«Мне кажется, что главными достижениями проекта стали не столько публикации или выступления на конференциях (хотя безусловно это важный показатель KPI), но то, что "старые" темы из политической истории Российской империи заиграли новыми красками перспективности и полноты изучения. Фактически, мы показали на "старом" материале – например, деятельности М. С. Воронцова или внутренней кухне дипломатических представительств  при Екатерине II – что при изучении этих исследовательских вопросов очень важно учитывать фактор неформальных связей и патрон-клиентских отношений, неформальных практик управления, которые если и не играли главную роль, то по крайней мере образовывали синтез с формальными практиками управления и связями, с законодательными актами и материалами делопроизводства. Также можно сказать, что своей деятельностью мы "популяризируем" направление исторической науки, занимающееся изучением роли неформальных патрон-клиентских отношений. Думаю, что это главный исследовательский результат проекта. Перспектив у него много, и самая главная – раскрытие новых сюжетов и явлений через призму неформальных связей, постановку новых вопросов в контексте изучения отдельного предмета исследования, а также в планах закончить перевод классического труда по истории патроната Ш. Кеттеринг и издать его в НЛО или издательстве ВШЭ. Нам кажется, что это важно сделать для российской исторической науки, потому что перевод позволит создать или открыть диалог о конвенциональности используемой исследователями терминологии на русском языке, обсудить проблему понятий и договориться о тех базовых принципах их использования, которые есть. Не менее важно также, на наш взгляд, провести научную конференции или семинар, на котором будет возможность обсудить последние результаты исследований практики неформальных связей и методов управления с именитыми российскими учеными и другими студентами, которые занимаются подобными "штудиями"».

 

Поздравляем всех участников проектных групп с успешным завершением работы
и желаем дальнейших успехов!

Материал подготовила Ирина Глущенко.