Авторский курс Алексея Береснева.
На этом курсе слушатели изучают важнейшие библиотеки и инструменты Python (Питон) для анализа данных (Data science). Также на курсе рассматриваются средства Python для визуализации данных, извлечения данных из всемирной паутины, основы работы с СУБД PostgreSQL, машинного обучения и обработки текстовых документов и произведений на обычных языках.Стоимость курса
50 000 рубВы научитесь:
В результате прослушивания курса слушатели:
-
Получат общее понимание процесса анализа, извлечения и визуализации данных, построения гипотез и тестирования;
-
Освоят работу с окружением Python и основными требуемыми инструментами и библиотеками;
-
Изучат работу с базовыми концепциями, понятиями, принципами и возможностями Python: типами данных, базовыми структурами данных, функциями и основами ООП;
-
Изучат высокоуровневый математический инструментарий, предоставляемый пакетом NumPy;
-
Освоят вычисления с помощью пакета SciPy;
-
Смогут производить анализ и манипулирование данными с помощью пакета Pandas;
-
Получат навыки машинного обучения с использованием Scikit-Learn;
-
Освоят визуализацию с помощью средств Mathplotlib.
-
Изучат базовые принципы машинного обучения с учителем и без него, а также основные методики, например, регрессию, кластеризацию, поиск ближайших соседей (K-NN), деревья решений, понижение размерности;
-
Изучат использование Scikit-Learn для обработки текстов на обычных языках;
-
Освоят автоматизированное получение данных из WEB;
- Изучат основы работы с СУБД
Аудитория:
Курс предназначен для аналитиков, разработчиков и специалистов по статистическому анализу данных и трендовТребования к предварительной подготовке слушателя:
Приветствуется базовый опыт работы с операционными системами GNU/Linux и/или UNIX и минимальные знания в области программированияСодержание курса
Введение и настройка рабочей среды.
-
Создание виртуального окружения Python.
-
Установка IPython.
-
Установка и настройка Jupyter Notebooks.
Основы Python.
-
Типы данных и объекты.
-
Загрузка пакетов, пространства имен.
-
Чтение и запись данных.
-
Простое рисование графиков.
-
Управление потоком выполнение и ветвление.
-
Отладка.
-
Профилирование кода.
Подготовка и доступ к данным.
-
Загрузка CSV.
-
Подключение к СУБД на примере PostgreSQL.
-
Устранение излишней и избыточной информации.
-
Нормализация данных.Форматирование данных.
Анализ, исследование и визуализация данных.
-
Работа с NumPy.
-
Массивы в NumPy.
-
Файлы, отображаемые в память.
-
Визуализация с помощью Mathplotlib.
Извлечение и манипулирование данными Pandas.
-
Манипулирование данными в Pandas.
-
Статистический анализ.
-
Анализ временных серий.
Машинное обучение.
-
Организация входных данных.
-
Интерфейсы оценки, предсказания и трансформации.
-
Препроцессинг.
-
Регрессия.
-
Классификация.
-
Кластеризация.