Как начать карьеру в Data Science

Как начать карьеру в Data Science

Подкаст «Выхожу с понедельника» — выпуск № 7
4 минуты2461

Можно ли войти в дата-аналитику в 35 лет? Ну да… если в 25 вы начнёте выбирать конкретное направление. Есть Data Science, есть Data Engineering, есть Data Analytics. А ещё где-то в районе искусственного интеллекта маячит просто Big Data.

Чтобы муки выбора не затянулись, в этом выпуске подкаста «Выхожу с понедельника» мы обсудим начало карьеры в сфере данных с двумя опытными дата-аналитиками из Сбербанка. Вероника Голубева — главный инженер банка по разработке в сфере Data Analytics, специализируется на Data Science, преподаёт Python в GeekBrains и ведёт вебинары. Никита Васильев работает больше в сфере Data Engineering, но в GeekBrains также преподаёт Python. А ещё Hadoop и библиотеки Python для Data Science.

Седьмой выпуск подкаста можно послушать на разных платформах:

В этом посте мы собрали интересные цитаты из выпуска.

   

О разнице в специальностях

— Data Science — это больше об алгоритмах, которые строит модель. Дата-аналитик — человек, который будет искать источники данных, выбирать их, анализировать и представлять результат финансовой модели в графиках для бизнеса. А дата-инженер — тот, кто будет создавать пайплайны данных для дата-сайентистов, на которых будет происходить обучение.

— Мне кажется, что для гуманитариев ближе всего дата-аналитика, потому что она сама по себе намного ближе к бизнесу. То есть не финансовая аналитика, а именно аналитика данных.

— Я не вижу проблем для гуманитариев заниматься Data Science на любой из трёх позиций, с этим связанных. Здесь важно, что ближе. Если хочется разбираться в новых языках программирования, изучать фреймворки, читать документацию на английском языке, разбираться в вопросах, которые не найдёшь на Stack Overflow, — вам прямая дорога в дата-инжиниринг. Возьмём второе направление, дата-аналитику: здесь попроще, есть свобода выбора. Ты можешь строить графики, делать презентации или красиво говорить о продукте.

— Условное разделение на дата-аналитика, дата-инженера и дата-сайентиста во многих компаниях не работает. По факту бывает, что дата-аналитик и дата-сайентист или дата-аналитик и дата-инженер — один человек.

— Когда я приходила в компанию, где работаю, product owner сказал, что у нас вообще нет разделения на DA, DE, DS — и я буду DX. 

— По опыту могу сказать, что в основном на позициях дата-сайентистов спрашивают о смысле моделей, а у них у всех математический подтекст. У метрик тоже математический подтекст, нужно хорошо понимать, что делает та или иная модель. 

О базовых скилах дата-аналитика

— Мне кажется, что для джуна на позиции дата-аналитика важно знать SQL на базовом уровне — не рекурсивные запросы. Сейчас, если джун знает Python, обладает базовыми навыками (и он не разработчик), умеет пользоваться библиотекой Pandas — это будет плюсом и на стартовую позицию вполне можно пройти.

— Если мы говорим про компании большой четвёрки, они до сих пор строят аналитику в Excel. Если у вас есть данные, укладывающиеся в миллион строк, вам Excel за глаза хватит. Если у вас данных больше, чем миллион строк, здесь уже не обойтись без базы, в которой вы это сделаете намного быстрее.

— Важный навык для джуна — это умение гуглить и думать головой. Ты можешь не работать со всеми библиотеками в Python, но должен уметь правильно поставить вопрос, найти хорошие материалы, прочитать документацию или рекомендации классных чуваков на Stack Overflow — этого достаточно, чтобы покрыть все задачи. 

— Главное — это умение разговаривать и не бояться показаться глупым, не понимать и задавать вопросы. На встречах очень часто бизнес говорит непонятными терминами, поэтому нужно просить разъяснений — со временем вы поймёте, как они работают. Там ничего сложного нет.

У него в резюме было написано, что он был фрилансером в течение двух-трёх лет. А на самом деле чувак в это время кальяны забивал или что-то такое.

— Вы можете рассказать о себе всё что угодно и, как показывает практика, 80% приписывают себе больше, чем умеют.

— Когда мы начинали с одногруппником впервые искать работу, я считал, что он умнее меня раза в два, но получалось так, что меня приглашали в компанию, а его нет. Так было только потому, что мне было проще расслабиться и найти общий язык, а он, зная больше в технической части, не мог защитить свои решения и рассказать о них так, чтобы другой человек понял.

— Само собеседование — это игра. Компания ищет сотрудника, который умеет как можно больше, чтобы заплатить ему как можно меньше. А сотрудник, который нанимается, хочет делать как можно меньше и получать как можно больше. И каждый тянет одеяло на себя. 

— С дата-аналитики можно спокойно перейти в смежную область — как в дата-инжиниринг, так и в дата-сайенс, и наоборот, из других направлений можно перескочить в соседнее. 

— Про Excel, наверное, никто не спросит, но он вам пригодится. Возможно, вы столкнётесь с ним на работе и будет сложновато, если вы не работали в нём до этого. Но если вы быстро схватываете, всё будет отлично. 

Про ошибки дата-специалистов на собеседованиях

— Мне кажется, что зря не указывают курсы. Нужно обязательно указывать все курсы, которые вы проходили, расписывать полученные навыки. Укажите то, с чем вы так или иначе сталкивались, даже если это тот же Microsoft Access. Если это ваше первое резюме джуна, расскажите там всё и в конце напишите, что вы классный, чтобы было интересно.

— Я бы посоветовал на первом этапе проходить собеседования в компании, куда вы не особо хотите устроиться. Нужно походить, осознать, что это такое, сделать выводы, понять, что вы что-то знаете, и пробоваться туда, где вам интереснее.

— Не старайтесь изучить всё по верхам, сделайте упор на базу. По опыту, 80% людей не могли решить банальную задачу, где я рисую две таблицы на бумажке и прошу сказать, какой результат мне вернёт left, right и inner join. С этого начинаются соединения в базах данных, и на такой простой вопрос мне не могут ответить.

Интересно? По ссылкам в начале статьи вы сможете послушать полную версию и подписаться на обновления подкаста ;) Оставайтесь с нами, впереди много классных выпусков!

big-data-analyticsпрограммирование
Нашли ошибку в тексте? Напишите нам.
Спасибо,
что читаете наш блог!
Posts popup