Курс Python для анализа данных

Код: Py4DS

Продолжительность курса

40 Академических часов

Авторский курс Алексея Береснева.

На этом курсе слушатели изучают важнейшие библиотеки и инструменты Python (Питон) для анализа данных (Data science). Также на курсе рассматриваются средства Python для визуализации данных, извлечения данных из всемирной паутины, основы работы с СУБД PostgreSQL, машинного обучения и обработки текстовых документов и произведений на обычных языках.

Стоимость курса

50 000 руб
Заказать

Цели курса:

В результате прослушивания курса слушатели:

  • Получат общее понимание процесса анализа, извлечения и визуализации данных, построения гипотез и тестирования;

  • Освоят работу с окружением Python и основными требуемыми инструментами и библиотеками;

  • Изучат работу с базовыми концепциями, понятиями, принципами и возможностями Python: типами данных, базовыми структурами данных, функциями и основами ООП;

  • Изучат высокоуровневый математический инструментарий, предоставляемый пакетом NumPy;

  • Освоят вычисления с помощью пакета SciPy;

  • Смогут производить анализ и манипулирование данными с помощью пакета Pandas;

  • Получат навыки машинного обучения с использованием Scikit-Learn;

  • Освоят визуализацию с помощью средств Mathplotlib.

  • Изучат базовые принципы машинного обучения с учителем и без него, а также основные методики, например, регрессию, кластеризацию, поиск ближайших соседей (K-NN), деревья решений, понижение размерности;

  • Изучат использование Scikit-Learn для обработки текстов на обычных языках;

  • Освоят автоматизированное получение данных из WEB;

  • Изучат основы работы с СУБД

Аудитория

Курс предназначен для аналитиков, разработчиков и специалистов по статистическому анализу данных и трендов

От слушателя требуется

Приветствуется базовый опыт работы с операционными системами GNU/Linux и/или UNIX и минимальные знания в области программирования

Содержание курса

Введение и настройка рабочей среды.

  • Создание виртуального окружения Python.

  • Установка IPython.

  • Установка и настройка Jupyter Notebooks.

Основы Python.

  • Типы данных и объекты.

  • Загрузка пакетов, пространства имен.

  • Чтение и запись данных.

  • Простое рисование графиков.

  • Управление потоком выполнение и ветвление.

  • Отладка.

  • Профилирование кода.

Подготовка и доступ к данным.

  • Загрузка CSV.

  • Подключение к СУБД на примере PostgreSQL.

  • Устранение излишней и избыточной информации.

  • Нормализация данных.Форматирование данных.

Анализ, исследование и визуализация данных.

  • Работа с NumPy.

  • Массивы в NumPy.

  • Файлы, отображаемые в память.

  • Визуализация с помощью Mathplotlib.

Извлечение и манипулирование данными Pandas.

  • Манипулирование данными в Pandas.

  • Статистический анализ.

  • Анализ временных серий.

Машинное обучение.

  • Организация входных данных.

  • Интерфейсы оценки, предсказания и трансформации.

  • Препроцессинг.

  • Регрессия.

  • Классификация.

  • Кластеризация.