Курс Основы BigData и Data Science: алгоритмы, библиотеки, инструменты на базе Python

Код: ITCloud-BD-DC

Продолжительность курса

40 Академических часов
Курс знакомит с основными понятиями теории Больших Данных, важнейшими алгоритмами их обработки и практической организации работы с ними на примере Hadoop. В курсе дается обзор основных математических алгоритмов для анализа данных и машинного обучения. Рассматриваются алгоритмы обучения с учителем и без учителя, а также способы применения математического аппарата к решению конкретных задач машинного обучения. В качестве практических примеров демонстрируются наиболее популярные инструменты и библиотеки на базе Python: Anaconda, NumPy, Pandas, Matplotlib, Scikit и TensorFlow.

Стоимость курса

60 000 руб
Заказать

Цели курса:

  • Дать обзор технологиям Больших Данных.

  • Практически продемонстрировать популярные подходы к организации обработки Больших Данных.

  • Продемонстрировать современные алгоритмы машинного обучения и указать сферы их применения.

  • Практически показать работу с популярной платформой Anaconda для разработок в области машинного обучения.

  • Продемонстрировать применение важнейших библиотек и инструментов для анализа данных: NumPy, Pandas, Scikit, Matplotlib, TensorFlow.

Аудитория

Для специалистов в области анализа данных, для проектировщиков систем машинного обучения и для специалистов, занимающихся поддержкой систем обработки Больших Данных.

От слушателя требуется

Минимальное знакомство с Linux и Python приветствуется, но не обязательно. Базовое техническое образование обязательно.

Содержание курса

  • Описание методов, задач обработки и области применения технологий Big Data.
  • Основные характеристики больших данных и их влияние на сбор, хранение, обработку и анализ данных.
  • Критерии аналитических задач, решение которых предпочтительно с использованием технологий Big Datа.
  • Кластеры Hadoop и алгоритмический базис MapReduce.
  • Практический пример: построение кластера Hadoop и работа с ним.
  • Платформа Anaconda как удобный инструмент работы с машинным обучением.
  • Практический пример: возможности библиотек Python NumPy и Pandas.
  • Обзор методов бизнес-аналитики.
  • Методы машинного обучения (задача классификации и кластеризации, в частности задача формирования статистических выборок).
  • Введение в бизнес-аналитику с использованием методов класса machine learning.
  • Практический пример: Scikit.
  • Языки и модели программирования, используемые в технологиях Big Data.
  • Средства визуализации.
  • Практический пример: использование Matplotlib.
  • Архитектура верхнего уровня Big Data решений.
  • Ограничения текущих технологий Big Data.
  • Практический пример: использование TensorFlo

Другие курсы данной тематики