Научно-учебная лаборатория методов анализа больших данных — Екатерина Трофимова

Lab Project in Moscow — это серия интервью с сотрудниками 10-ти лабораторий и исследовательских центров московской Вышки. 

Вооружившись Зумом студенты всех четырех кампусов брали интервью у экономистов, юристов, социологов, философов, лингвистов и аналитиков больших данных. Из цикла интервью ты узнаешь, как выглядят научные лаборатории изнутри, над какими проектами работают стажёры и сотрудники, а также как можно начать работать в лаборатории уже сегодня!

Из интервью с Екатериной Трофимовой ты узнаешь:

🔹 Что такое электромагнитные ливни и как их изучают с помощью анализа данных;

🔹 Что нужно знать студенту для работы в лаборатории (даже если Data Science для тебя что-то новое);

🔹 Разрушение мифов: мало ли зарабатывают ученые;

🔹 Почему профессия ученого привлекательнее работы в компании?


N.B.: Расскажи о том, какую должность ты занимаешь в лаборатории и чем ты занимаешься.

Я стажер-исследователь, мои проекты в основном посвящены анализу данных в физике. С детства меня интересовали точные науки, поэтому я пришла в эту лабораторию. 

N.B.: Расскажи подробнее о проектах, в которых ты участвуешь.

Деятельность лаборатории можно разделить на две части: непосредственно рисерч и менторская деятельность. Например, у меня есть два проекта, в которых я курирую студентов, бакалавров и магистров, которые работают в лаборатории. 

Основной мой проект на сегодняшний день связан с физикой высоких энергий. Мне нужно разделить электромагнитные ливни между друг другом. Электромагнитные ливни это такая структура, которая образуется во время попадания элементарной частицы в детектор, происходит её распад, и продукты распада соприкасаются с материей. При этом остаются следы древовидной формы, называющиеся ливнями, которые анализируют физики для определения типа частицы. 

Проблема заключается в том, что в детекторе эти ливни сильно пересекаются, поэтому чтобы лучше восстановить свойства изначальной частицы, надо разделить эти ливни между собой. Это как раз задача анализа данных, решение которой в перспективе поможет учёным определить изначальные свойства частицы и, возможно, даже пригодится в поиске темной материи. 

N.B.: Ого, как круто! 

В лаборатории есть ещё студенческие проекты, один из которых тоже связан детекторами и физикой высоких энергий. Ученые делают симуляции появления следов – дорогостоящий, долгий процесс, который используется вообще в науке. Для того, чтобы уменьшить его себестоимость, можно создать компьютерную симуляцию с помощью современных генеративных моделей. Один из проектов студентов связан как раз с этим. 

Задачей второго студенческого проекта является разделение галактических скоплений на небе друг от друга и добавление новых данных с новых телескопов в прошлые группы галактик. 

N.B.: Это супер интересно! Мне кажется, что поэтому люди и идут в науку, потому что это так интересно. 

Да, преимущество науки как раз в том, что ты свободен в принятии решений. Нет определенной задачи, которая имеет точный срок выполнения, и монотонной работы. 

Конечно же, в самом процессе исследования есть некая монотонность. Например, в моем первом проекте с ливнями уже завершили исследование, и сейчас происходит момент тестирования, то есть мы доказываем, что исследование действительно достоверно, что все верно, а значит появляется много муторных экспериментов, которые надо повторять. Хорошо, что некоторые из них можно прогнать по одному и тому же алгоритму несколько раз. 

N.B.: Как ты попала в лабораторию? Где ты училась до этого? 

Мой путь в анализ данных был довольно долгим. Изначально, с детства, я была фанатом математики, любила физику, участвовала в олимпиадах. Все вело к тому, что мне надо идти учиться на техническую специальность. Однако в связи с семейными обстоятельствами, я поступила сначала в филиал МГУ, где основной упор на математику был на факультете экономики, куда я и пошла. Потом я поняла, что из экономики самое интересное это финансы, занялась финансами, поступила в центр матфинансов при МГУ. Там как раз была программа анализа данных, еще пилотная. 

На тот момент у меня была мечта заниматься алготрейдингом – алгоритмической торговлей. Но через какое-то время я от этого отошла, потому что трейдинг показался мне негуманным. По сути это раздувание финансового пузыря и получение денег из пустоты. Ты пишешь какие-то алгоритмы, и пока человек нажимает на кнопочку, ты можешь уже на нее нажать дважды, потому что у тебя лучше соединение. В общем, это очень интересно, прибыльно, нужно экономике, но тем не менее, мне кажется, это менее гуманно, чем анализ данных, который может спасать людей от рака и находить применение в науке. 

Так я решила, что хочу заниматься анализом данных. Для этого я закончила магистратуру в Вышке. Поступая туда, я сразу выбрала для себя именно нашу лабораторию, потому что узнала, что LAMBDA занимается прикладными задачами в науке, и более того, что они сотрудничают с CERNом. Я попала в LAMBD-у и решила остаться в аспирантуре в Вышке, чтобы продолжать развитие в научной карьере. 

N.B.: А вот ты рассказываешь, что сразу же работала в лаборатории, ты бы ни за что не пошла работать в компанию?

Сейчас уже нет, потому что я работала аналитиком в крупном банке, это было очень хорошо: социальный пакет, статус и тд. Я просто понимаю, что это не моё. В лаборатории есть много преимуществ. Во-первых, это само исследование, которым ты можешь заниматься, потому что именно оно тебе нравится, не какие-то задачи, а интересные моменты, интригующие. Тем более, физика высоких энергий и космос это очень романтично и очень заманчиво. Променять это на какое-то предсказание дефолта очень сложно. Все, что ты хочешь – ты делаешь. Во-вторых, в лаборатории ты постоянно развиваешься, потому что постоянно читаешь статьи. То есть, ты не зациклен на каком-то пуле работы, а тебя постоянно стимулируют. У нас недавно появился клуб чтения, где мы созваниваемся для того, чтобы обсудить новые статьи. И еще, это гибкий график. Не нужно сидеть в офисе с 10 до 18 каждый день, ты можешь работать, когда хочешь. 

N.B.: А страх, что ученые зарабатывают гроши, это правда?

На самом деле, нет. Когда ты еще аспирант, ты можешь получить стипендию. У меня есть академическая стипендия, которая дает хорошую надбавку к зарплате. Более того, у нас зарплата создается из основной части, которую платит университет, это небольшая часть, а остальное это гранты. Если ты занимаешься проектом, который подходит под грант, и успешно его делаешь в течение какого-то периода, то у тебя получаются хорошие надбавки. 

Вообще, я не могу сказать, что мои коллеги очень жалуются на низкие зарплаты. Для меня как для человека, который пришел из другой области и не сразу имел хорошую базу по сравнению с коллегами, это постоянная мотивация. Потому что ребята настолько классные и уникальные, что их успехи меня мотивируют. А в компании обычно нет такого сосредоточения людей. 

Например там, где я работала, аналитический отдел вообще был очень маленький. Понятно, что в крупных технических компаниях как Яндекс или Google тоже будет крутое коммьюнити, но, мне кажется, там может быть аспект конкуренции.

Лаборатория – это больше про сообщество.

Ты можешь подойти спокойно к коллеге, который занимается такой же задачей, занять его время, а он с удовольствием с тобой всем поделится, все расскажет и направит тебя. 

N.B.: А какими качествами или опытом нужно обладать студенту, чтобы попасть в проект?

Когда много студентов приходит, мы смотрим на их резюме. Бывает, грубо говоря, два типа студентов. 

Первый тип, это тот, кто генерирует идеи, кто имеет какое-то предметное знание. У меня в прошлом проекте был парень, у которого были знания в физике, при этом он аналитик. Конечно, ему было проще генерировать идеи в физике высоких энергий.

А есть те, которые очень хорошие аналитики: ребята-программисты, которые могут написать хороший код, воспроизвести результаты, но при этом им сложно генерировать идеи, потому что они не знают предметную область. Очень здорово, когда такие ребята встречаются вместе. То есть, когда есть те, кто знают вглубь задачу и могут придумать, и те, кто могут очень хорошо это воспроизвести, выполнить и т. д.

N.B.: Итак, а как это все поменялось с пандемией?

Бывает, что день состоит из многих созвонов. В понедельник у нас научный семинар, потом у меня еще аспирантский семинар. В неделю как минимум 2 звонка со студентами, ридинг клаб. Наши семинары это как раз то, что нас связывает, а в остальное время ты работаешь над своим проектом и связываешься со своими коллегами, с куратором для обсуждения результатов. 

LAMBDA

N.B.: А что ты особенно ценишь в лаборатории?

В первую очередь эту атмосферу и людей, которые тебя мотивируют, возможность заниматься такими фантастическими проектами.Чувство того, что ты делаешь что-то для науки, для человечества в целом — тоже очень ценно. 

N.B.: А ты ездишь на различные конференции, выступаешь?

Чтобы ездить на конференции, надо иметь классные проекты. Мы выступили на конференции Computer Science and Physics, которая была организована Вышкой и коллегами-университетами. Она международная, но, тем не менее, это не самая крутая конференция, которая есть. 

Вообще да, я мечтаю съездить на основные конференции в анализе данных в физике. Но для этого надо сначала хорошо завершить свои проекты. С основным своим проектом я не планирую идти на конференцию, а хочу опубликовать результаты в журнале. 

То есть, можно публиковать свои работы через конференции, можно просто через журналы. В первую очередь, конференции дают возможность посмотреть на другие работы, следить за мировыми тенденциями. Для этого не обязательно быть докладчиком и сейчас классно, что можно посещать мероприятия онлайн. 

N.B.: Ты говоришь, что хочешь выступить на этих крутых конференциях. Скажи, может у тебя есть еще какие-то планы на будущее в долгосрочной перспективе?

В моих целях стать международным сотрудником, параллельно поступить в аспирантуру в Европе. В идеале хотелось бы, чтобы была совместная аспирантура, надеюсь поступить в следующем году. Еще в целях стать частью какой-то международной лаборатории, наша лаборатория организует международную лабораторию совместно с европейскими университетами.

В будущем я себя вижу научным сотрудником. Может, через какое-то время это будет не полная ставка, потому что есть семья. А так, мне кажется, что академическое развитие это именно то, что мне нужно. Возможно, это будет чтение лекций в университете, а может только рисерч. Но, я думаю, рисерч граничит с преподавательской деятельностью, потому что когда ты доходишь до какого-то уровня, тебе есть чем поделиться со студентами, и это тоже здорово. 

N.B.: И у меня последний вопрос, немного абстрактный. В чем миссия вашей лаборатории?

Мне кажется, у нас есть несколько миссий. Одна из них это популяризация науки. У наших руководителей есть цель распространять деятельность нашей лаборатории, поэтому у нас есть Инстаграм, и мы активно участвуем во всяких мероприятиях.

Еще миссия – это развитие фундаментальной науки за счет применения анализа данных. Потому что многие сферы наук тормозятся, люди не могут найти, что может сдвинуть c места их эксперименты или что может дать толчок для развития. Как раз сюда приходит Data Science, который ищет закономерности в данных, которые могут быть не видны, строит сложные модели, не всегда прозрачные для пользователя, но все же решающие вопросы.

Над интервью работали: Валерия Кука, Мария Кучеренко, Мария Арефьева, Марина Федорова, Екатерина Микуляева, Надежда Горбова

Вставить формулу как
Блок
Строка
Дополнительные настройки
Цвет формулы
Цвет текста
#333333
Используйте LaTeX для набора формулы
Предпросмотр
\({}\)
Формула не набрана
Вставить
%d такие блоггеры, как: