Специальности в Школе

В 2018 году Школа анализа данных провела реформу: теперь студенты будут проходить обучение в рамках четырёх профессиональных направлений.
Конкурс общий, студенты распределяются с учётом своих пожеланий. Абитуриентам рекомендуется внимательно изучить программу и решить, какие курсы интереснее. В течение первого семестра можно сменить направление.
В филиалах ШАД в Минске, Екатеринбурге и Нижнем Новгороде, а также на заочном отделении студенты могут обучаться на профессиональных направлениях Data Scientist и Разработчик машинного обучения.

Data Scientist

В разных компаниях (и даже в разных командах внутри одной компании) за этим именем могут скрываться разные люди. Для нас дата-сайентист — это человек, который отлично разбирается в машинном обучении и статистике, а также умеет применять их на практике.
Выпускник этого направления сможет решать практические вопросы с помощью анализа данных: правильно поставит задачи, определит метрики, добудет данные, предложит решение и оценит его эффективность не только в синтетическом эксперименте, но и в реальных условиях. К примеру, он сможет оптимизировать удаление дубликатов из поисковой выдачи и ускорить поиск похожих изображений, распознать мошеннические клики по рекламным объявлениям или разобраться, будет ли толк от добавления новой функциональности в сервис.

Разработчик машинного обучения

Чтобы создавать высокотехнологичные продукты (например, Алису или Яндекс.Переводчик), нужно, с одной стороны, глубоко понимать машинное обучение, уметь оптимизировать существующие алгоритмы и придумывать новые, а с другой — уметь реализовывать свои идеи и писать эффективный промышленный код. Это направление подойдёт тем, кому нравится программировать и тем, у кого есть желание самому делать сервисы и приложения, которыми смогут пользоваться тысячи и миллионы людей.

Инфраструктура больших данных

Для работы с большими данными нужны быстрые и надёжные системы хранения и обработки. Создание и поддержание таких систем — нелёгкое и творческое дело. С одной стороны, важно знать алгоритмы, понимать дизайн системной архитектуры и возможных приложений. С другой — нужно вникать в происходящее на самом низком уровне, разбираться в устройстве файловой системы, дисков, сети и процессора.
Направление идеально подойдёт тем, кто любит алгоритмы, работу с данными и получает удовольствие от программирования, но не хотел бы связывать свою жизнь с машинным обучением.

Анализ данных в прикладных науках

Data science проникает во все науки и предметные области: её применяют физики и биологи, нефтяники и финансисты. Специалист по data science, работающий с прикладными задачами, неизменно сталкивается с неформально описанными наблюдениями, которые необходимо превратить, например, в вектора в заданном евклидовом пространстве. Более того, к ним необходимо добавить метки, которые указывают их принадлежности к классам, а также обеспечить признаками, благодаря которым формируется адекватное многомерное пространство.
Обучить этому можно только на примерах успешно решенных практических задач, и, в особенности, через самостоятельное решение хотя бы одной новой такой задачи, поэтому в рамках этого направления второй год обучения целиком отводится на самостоятельное практическое исследование.