Стоимость курса
78 000 рубЗаказать
Вы научитесь:
-
Дать обзор технологиям Больших Данных.
-
Практически продемонстрировать популярные подходы к организации обработки Больших Данных.
-
Продемонстрировать современные алгоритмы машинного обучения и указать сферы их применения.
-
Практически показать работу с популярной платформой Anaconda для разработок в области машинного обучения.
- Продемонстрировать применение важнейших библиотек и инструментов для анализа данных: NumPy, Pandas, Scikit, Matplotlib, TensorFlow.
Аудитория:
Для специалистов в области анализа данных, для проектировщиков систем машинного обучения и для специалистов, занимающихся поддержкой систем обработки Больших Данных.Требования к предварительной подготовке слушателя:
Минимальное знакомство с Linux и Python приветствуется, но не обязательно. Базовое техническое образование обязательно.Содержание курса
- Описание методов, задач обработки и области применения технологий Big Data.
- Основные характеристики больших данных и их влияние на сбор, хранение, обработку и анализ данных.
- Критерии аналитических задач, решение которых предпочтительно с использованием технологий Big Datа.
- Кластеры Hadoop и алгоритмический базис MapReduce.
- Практический пример: построение кластера Hadoop и работа с ним.
- Платформа Anaconda как удобный инструмент работы с машинным обучением.
- Практический пример: возможности библиотек Python NumPy и Pandas.
- Обзор методов бизнес-аналитики.
- Методы машинного обучения (задача классификации и кластеризации, в частности задача формирования статистических выборок).
- Введение в бизнес-аналитику с использованием методов класса machine learning.
- Практический пример: Scikit.
- Языки и модели программирования, используемые в технологиях Big Data.
- Средства визуализации.
- Практический пример: использование Matplotlib.
- Архитектура верхнего уровня Big Data решений.
- Ограничения текущих технологий Big Data.
- Практический пример: использование TensorFlo