Data Science

Решение задач по сбору и анализу данных, возникающих в большинстве современных сервисов: от Алисы до Яндекс.Погоды.
Для кого
Для тех, кто хочет ставить задачи с помощью анализа данных, предлагать решения и оценивать их эффективность не только в синтетическом эксперименте, но и в реальных условиях.
Чему мы учим
Статистике, машинному обучению и работе с разными типами данных.
Где применять эти знания
Данные лежат в основе большинства современных сервисов и продуктов: от приложений по предсказанию погоды до беспилотных автомобилей. Data Scientist проводит эксперименты, строит метрики, умеет оптимизировать работу сервисов и понимает, где находятся их точки роста.

Программа

В течение семестра каждый учащийся должен успешно пройти как минимум три курса. Например, если в основной программе их два, то необходимо выбрать какой-нибудь из спецкурсов.

Знания проверяются в первую очередь с помощью домашних заданий — экзамены и контрольные проводятся только по некоторым предметам.

Первый семестр
Обязательные
Алгоритмы и структуры данных, часть 1
01
Сложность и модели вычислений. Анализ учетных стоимостей (начало)
02
Анализ учетных стоимостей (окончание)
03
Алгоритмы Merge-Sort и Quick-Sort
04
Порядковые статистики. Кучи (начало)
05
Кучи (окончание)
06
Хеширование
07
Деревья поиска (начало)
08
Деревья поиска (продолжение)
09
Деревья поиска (окончание). Система непересекающихся множеств
10
Задачи RMQ и LCA
11
Структуры данных для геометрического поиска
12
Задача о динамической связности в ненаправленном графе
Теория вероятностей (полусеместровый курс)
01
Основные комбинаторные величины и простейшие комбинаторные формулы
02
Комбинаторные тождества и формула Мёбиуса
03
Оценки и асимптотики для комбинаторных величин
04
Разбиения чисел на слагаемые
05
Рекуррентные соотношения и производящие функции
06
Основы теории графов и перечислительные задачи на графах
07
Элементы общего асимптотического анализа
08
Дискретная и геометрическая вероятность
09
Случайные величины и распределения
10
Законы больших чисел
11
Предельные теоремы
12
Основы статистики
Язык Python
01
Основы языка (часть 1)
02
Основы языка (часть 2)
03
Объектно-ориентированное программирование
04
Обработка ошибок
05
Оформление и тестирование кода
06
Работа со строками
07
Модель памяти
08
Функциональное программирование
09
Обзор библиотек (часть 1)
10
Обзор библиотек (часть 2)
11
Параллельные вычисления в Python
12
Расширенная работа с объектами
На выбор
Дискретная математика (полусеместровый курс)
или
Линейная алгебра (полусеместровый курс)
Второй семестр
Обязательные
Машинное обучение, часть 1
01
Основные понятия и примеры прикладных задач
02
Метрические методы классификации
03
Логические методы классификации и решающие деревья
04
Градиентные линейные методы классификации
05
Метод опорных векторов
06
Многомерная линейная регрессия
07
Нелинейная и непараметрическая регрессия, нестандартные функции потерь
08
Прогнозирование временных рядов
09
Байесовские методы классификации
10
Логистическая регрессия
11
Поиск ассоциативных правил
Основы статистики в машинном обучении
01
Введение
02
Основные задачи и методы теории статистических выводов
03
Оценка распределения и статистические функционалы
04
Моделирование Монте-Карло, бутстреп
05
Параметрическое оценивание
06
Проверка гипотез
07
Снижение размерности многомерных данных
08
Оценка чувствительности модели
09
Линейная и логистическая регрессия
10
Методы планирования экспериментов (Design of Experiments)
11
Различные типы регуляризации в линейной регрессии
12
Нелинейные методы построения регрессионных зависимостей
13
Непараметрическое оценивание
14
Байесовский подход к оцениванию
15
Байесовский подход к регрессии
16
Байесовский подход к регрессии и оптимизации
17
Использование модели случайных гауссовских полей в задачах анализа данных
18
Использование статистических моделей и методов в задачах суррогатного моделирования и оптимизации
Третий семестр
Обязательные
Машинное обучение, часть 2
01
Нейросетевые методы классификации и регрессии
02
Композиционные методы классификации и регрессии
03
Критерии выбора моделей и методы отбора признаков
04
Ранжирование
05
Обучение с подкреплением
06
Обучение без учителя
07
Задачи с частичным обучением
08
Коллаборативная фильтрация
09
Тематическое моделирование
На выбор
Автоматическая обработка текстов
или
Компьютерное зрение
Четвёртый семестр
Рекомендуемые спецкурсы
Глубинное обучение
Обучение с подкреплением
Self Driving Cars
Информационный поиск