Версия для слабовидящих

Размер текста:

Цветовая схема:

Изображения:

2

Часов теории

16

Часов практических занятий

О программе

Введение в большие данные (Big Data)

Получите общее понимание концепции больших данных, их характеристик, источников, способов обработки и областей применения.

Вы научитесь: Определять возможность применения технологий больших данных для решения конкретных задач; Анализировать бизнес-задачи и оценивать, могут ли методы и технологии больших данных быть применены для их решения; Применять основные методы анализа больших данных для решения практических задач; Использовать инструменты статистического анализа, Data Mining и машинного обучения для выявления закономерностей, и получения ценной информации из данных.

Программа

Тема 1. Введение в большие данные

Что такое «большие данные»: определение, характеристики (объем, скорость, разнообразие, достоверность, ценность). Источники больших данных: примеры и области применения. Вызовы и возможности, связанные с Big Data. Обзор жизненного цикла данных в Big Data проектах.

Тема 2. Архитектура систем обработки больших данных

Обзор основных архитектур обработки больших данных: пакетная обработка (Batch Processing), потоковая обработка (Stream Processing). Распределенные файловые системы (HDFS). Системы управления кластерами (YARN). Лямбда-архитектура и каппа-архитектура.

Тема 3. Фреймворк Apache Hadoop

Обзор Apache Hadoop: основные компоненты (HDFS, MapReduce, YARN). MapReduce: парадигма программирования для параллельной обработки данных. Практический пример MapReduce: подсчет количества слов (обзор кода). Hadoop Streaming.

Тема 4. Фреймворк Apache Spark

Обзор Apache Spark: основные компоненты (Spark Core, Spark SQL, Spark Streaming, MLlib, GraphX). Преимущества Spark по сравнению с Hadoop MapReduce. Resilient Distributed Datasets (RDDs): концепция и примеры использования. Spark DataFrame API.

Тема 5. NoSQL базы данных для больших данных

Обзор NoSQL баз данных: типы (ключ-значение, документные, столбцовые, графовые). Сравнение NoSQL баз данных с реляционными базами данных. Примеры NoSQL баз данных: MongoDB, Cassandra, HBase (краткий обзор для каждой). Выбор подходящей NoSQL базы данных для конкретной задачи.

Тема 6. Введение в аналитику больших данных и визуализацию

Обзор основных задач аналитики больших данных: Data Mining, машинное обучение. Инструменты визуализации данных: графики, диаграммы, дашборды. Этическая аспекты работы с большими данными. Краткий обзор алгоритмов машинного обучения (классификация, регрессия, кластеризация).

Тема 7. Языки программирования для Big Data

Обзор языков программирования, используемых в Big Data: Python, R, Scala. Библиотеки Python для работы с данными: Pandas, NumPy. Основы языка Scala и его применение в Apache Spark. Выбор языка программирования для конкретной задачи.

Тема 8. Потоковая обработка данных

Обзор концепции потоковой обработки данных. Apache Kafka: архитектура и основные компоненты. Apache Spark Streaming: обработка потоковых данных с использованием Spark. Другие фреймворки для потоковой обработки: Apache Flink, Apache Storm.

Тема 9. Облачные решения для Big Data и Data Governance

Обзор облачных платформ для Big Data: AWS, Azure, GCP. Облачные сервисы для хранения, обработки и анализа больших данных. Data Governance: принципы управления данными, качество данных, безопасность и конфиденциальность. Соответствие нормативным требованиям (GDPR, CCPA).

Преподаватели и эксперты программы

Документ, который Вы получите

Отзывы на программу

Друзин Станислав Олегович

Сырцов Богдан

Студент специальности 09.02.07 ИСиП

Я прошел курс «Введение в большие данные (Big Data

Как поступить на программу?

Шаг 1

Выбрать программу и оставить заявку

Шаг 2

Собрать документы и пройти оформление в личном кабинете anketa.fa.ru

Шаг 3

Получить договор и документы для оплаты

Шаг 4

Внести оплату и начать обучение

Вас могут заинтересовать

Контакты

САВУШКИНА ГАЛИНА НИКОЛАЕВНА

САВУШКИНА ГАЛИНА НИКОЛАЕВНА

  • Заведующий отделением
  • Преподаватель
  • Ответственный за организацию обучения по образовательным программам дополнительного образования
E-mail GNSavushkina@fa.ru Телефон (846) 224-20-78 Место нахождения:
г. Самара, ул. Антонова-Овсеенко, 57, кабинет 207А
.

Выбрать дату

Выбрать дату

Выбрать год