Дата-аналитика в России и за рубежом

Прощупываем разницу в работе и обучении. Подкаст «Выхожу с понедельника» — выпуск № 10

Десятый выпуск подкаста задумывался как пособие для гуманитариев, которые хотят, простите за банальность, войти в IT. Но «шоу пошло не так». Наша героиня Екатерина Староверова показывает, что нельзя вешать на людей ярлыки, и рассказывает о своём пути — от журналистки в российской местной газете до дата-сайентиста Siemens, а ещё студентки в магистратуре Пражского экономического университета. И конечно же, до преподавателя Python и дата-аналитики — на факультете продуктовой аналитики в GeekBrains.

Десятый выпуск подкаста, как и остальные, можно послушать на разных платформах:

В этом посте мы собрали интересные цитаты из выпуска.

О развитии в Data Science

— Я стараюсь не делить людей на гуманитариев, технарей, физиков. Есть два типа людей: те, кто любит сложные задачи, и те, кто предпочитает прикрываться образованием, бэкграундом, чем угодно, только не ленью.

— DataCamp — это онлайн-обучение, но весьма специфическое. Оно для программистов, которые работают с данными. Там куча заданий. Это всё проверяется онлайн и ты узнаёшь, правильно написал код или нет. По сути это онлайн-обучение с валидацией результата, как тест. 

— DataCamp — это хорошая штука, потому что там много интересных датасетов. Но если ты хочешь развиваться в этой сфере, не обязательно платить 240 долларов в год за DataCamp. Можно пойти в Kaggle. Это комьюнити дата-сайентистов и дата-аналитиков, там тоже множество датасетов — и от частных компаний, и от государственных служб. Их можно бесплатно скачать, поработать с ними и посмотреть, что другие люди сделали с тем же набором данных. Возможностей очень много.

— Ты сначала показываешь пример, а потом уже объясняешь, что за ним стоит. Пример должен быть максимально близок к реальности. То есть ты объясняешь, что такое доверительные интервалы, не как это написано в учебнике, а с точки зрения того, как рассчитать рекламную кампанию. 

О технологиях в Data Science

— Я использовала Excel скорее для учебных целей и никогда не делала там больших отчётов. Я знаю, что люди проворачивают в нём невероятные дела, но я предпочитаю Python. Excel — достаточно мощная штука, и там можно решать очень серьёзные задачи. Но Python или R удобнее, если ты хочешь что-то автоматизировать. 

— С SQL спорный вопрос, потому что всё зависит от того, где хранятся данные. Если в базе, из которой их нужно извлекать, то да, знания SQL пригодятся. Чтобы сделать обновление в Jira, нужно что-то вроде LightSQL. Но если ты хочешь заниматься аналитикой, его знать не обязательно, зависит от задач.

— Множество библиотек, связанных с медициной и биологией, написано для R. Один из моих коллег раньше работал в университете, он биолог. Он изначально писал на R, сейчас больше работает с Python. Также многие библиотеки в области финансов и демографии написаны для R. В демографии много своих подходов, функций, одни Population Projections Tables чего стоят. Не знаю, как перевести на русский, но это когда подсчитывается потенциальное количество мужчин, женщин, населения вообще с помощью специальных техник. И для этого есть библиотеки на R.

— Я знаю, что на физтехе [МФТИ] был создан большой набор библиотек, с помощью которого можно анализировать тексты. Это iPavlov — международный проект по созданию разговорного искусственного интеллекта, реализуемый лабораторией нейронных систем и глубокого обучения МФТИ в рамках Национальной технологической инициативы при индустриальной поддержке Сбербанка. Очень круто, что это делают наши люди.

— Если тебе жмут ботинки, иди и купи нормальные, а эти отдай кому-нибудь. Если вам не нравится, как в вашей компании описывают вакансии, идите в HR и перепишите. В чём проблема?

О зарубежных университетах

— Мне очень нравилась Чехия. Здесь много IT-компаний и можно найти работу. Очень много стажировок, и я на первом курсе сразу пошла стажироваться. Я переехала в Прагу в сентябре прошлого года. Это очень интересно, и я рекомендую всем, у кого есть такая возможность, поехать куда-то учиться. За это время со мной случилось всё, что только могло. Я изучила новый язык программирования, два раза сдала сессию, подтянула английский, выучила чешский до третьего уровня, нашла друзей, отсидела карантин, переболела ковидом. 

— Я знаю, что в экономическом университете Праги сложно учиться и очень серьёзный контроль знаний. Он гораздо сильнее, чем в магистратурах российских вузов. Это я знаю со слов коллег, которые учились в российской магистратуре. Чтобы сдать здесь предмет, часто нужно написать пять работ, десять эссе и ещё держать экзамен. Например, по IT-аудиту у нас было пять или шесть практических работ, потом письменный экзамен с билетами и презентация команды. И так почти на всех предметах.

— Чтобы тебя релоцировали, надо быть очень крутым дата-аналитиком. Если у тебя начальный уровень, самый простой путь — поступить в магистратуру и пойти работать интерном, как это было со мной, а потом уже получить контракт. Начинающий специалист, junior, никому не нужен. Компании это невыгодно. Легко найти здесь студентов, которые будут работать за копейки. Релокация возможна только для крутых специалистов. В Европе, чтобы взять на работу иностранца, нужно доказать, что он такой специалист, которого ты не можешь найти на внутреннем рынке. Например, в Чехии компании вывешивают вакансии и, если не находят местного, могут взять тебя.

— Следите за языком и шутками. Особенно это касается мальчиков и сексистского юмора, который прокатывает в России, всех этих фраз про девочек и программирование. Здесь за это можно пострадать. Никакого сексизма и национализма. В Россию это тоже со временем придёт. Это может шокировать. Улыбаемся, машем, избегаем тупых шуток — и всё будет хорошо.

— Один мой друг-европеец на полном серьёзе советовал не шутить про Россию и Путина, чтобы не подумали, что я русская шпионка. Есть люди, которые боятся русских. Однокурсница сказала мне, что была напугана, когда поняла, что на курсе есть русскоязычные. Она на тот момент не знала, что я русская. Она грузинка и очень боится русских, и это не шутка. И никто не любит шутки про Крым. Нужно быть готовыми к таким особенностям и понимать, какое представление о тебе может быть в головах у других людей.

— Русские, которые переехали, иногда жалуются, что офис пустеет в пять часов и непонятно, чем заниматься. Особенно одиноким парням это непривычно. Они начинают бегать, заниматься велоспортом, ходить куда-то.

— В магистратуре есть два типа людей. Первый — такие, как я, которые копили деньги и поступили, обычно им около 30 лет. И второй тип — это ребята после бакалавриата, за которых платят родители. И они очень разные: это и те, кто уже работал, и может, даже занимал серьёзную должность, и люди, которые не работали никогда. Это может вызывать конфликтные ситуации.

Интересно? По ссылкам в начале статьи вы сможете послушать полную версию и подписаться на обновления подкаста ;) Оставайтесь с нами, впереди много классных выпусков!

Освоить востребованную профессию в Data Science можно всего за полтора года на курсах GeekBrains. 
После учёбы вы сможете работать по специальностям Data Scientist, Data Analyst, Machine Learning, Engineer Computer Vision-специалист или NLP-специалист.

Освоить востребованную профессию в Аналитике больших данных можно всего за полтора года на курсах GeekBrains.

программированиеbig-data-analytics
Нашли ошибку в тексте? Напишите нам.
Спасибо,
что читаете наш блог!