Аналіз даних за допомогою Python

24000,00 

Код курса: PDA
Тривалість: 30 годин / 10 занять

Дивіться розклад


Телефонуйте зараз щоб дізнатися більше:

Телефон
+38 098 805 4511

Артикул: PDA Категорії: , Позначок: , , , , ,

Про курс

Курс “Аналіз даних за допомогою Python” присвячений основам аналізу даних із використанням Python. Під час навчання учасники ознайомляться з основними бібліотеками для обробки та візуалізації даних (Pandas, Numpy, Matplotlib, Seaborn), опанують методи машинного навчання (регресія, класифікація, кластеризація), а також навчаться працювати з SQL для аналізу даних у базах даних. Курс розрахований як на новачків, так і на фахівців, які прагнуть поглибити свої знання в аналізі даних.

Аудиторія курсу
o

  • Початківці-аналітики даних
  • ІТ-фахівці, які хочуть опанувати основи аналізу даних
  • Бізнес-аналітики та дослідники
  • Викладачі та студенти, зацікавлені в аналізі даних
  • Працівники компаній, що працюють з великими даними та звітністю

Чого навчаться учасники
o

  • Налаштовувати робоче середовище та ефективно використовувати бібліотеки Python для аналізу даних
  • Обробляти, агрегувати та візуалізувати дані за допомогою Pandas та Numpy
  • Створювати візуалізації за допомогою Matplotlib та Seaborn
  • Опанувати методи регресії, класифікації та кластеризації для машинного навчання
  • Працювати з SQL для виконання запитів і аналізу даних
  • Виявляти та інтерпретувати аномалії в даних
  • Розробляти рішення для реальних проєктів і презентувати їх результати

Попередні знання
o

Для проходження курсу бажано мати:

  • Базові знання Python (основні конструкції, цикли, функції)
  • Уявлення про дані та базові статистичні поняття
  • Досвід роботи з таблицями (наприклад, у Excel) буде перевагою, але не є обов’язковим

Детальніше про Бізнес-аналіз


Програма курсу

o

  1. Обробка даних Pandas
    • Вступ до курсу
    • Налаштування середовища
    • Вступ до Pandas
    • Створення та робота з DataFrame і Series
    • Імпорт даних із CSV, Excel, SQL Database та JSON файлів
    • Індексація та фільтрація даних
    • Сортування даних
    • Обробка пропущених значень
    • Групування та агрегування даних
    • Злиття та об’єднання таблиць
  1. Обробка даних Numpy
    • Вступ до Numpy та створення масивів
    • Ініціалізація масивів: одномірні, двовимірні, багатовимірні
    • Індексація, зрізи та маніпуляції з елементами масиву
    • Арифметичні операції та векторизація
    • Обробка пропущених та некоректних значень у масивах
    • Статистичні функції: середнє, медіана, стандартне відхилення
    • Зміна форми масивів та об’єднання масивів
    • Збереження та завантаження масивів із файлів
  1. Візуалізація Matplotlib
    • Вступ до Matplotlib та його можливості
    • Створення простих графіків (лінійний, точковий, стовпчастий)
    • Налаштування осей, заголовків та підписів графіків
    • Зміна кольорів, стилів та маркерів графіків
    • Додавання легенд, анотацій та тексту на графіки
    • Побудова кількох графіків на одному полотні (subplots)
    • Збереження графіків у різних форматах файлів (PNG, PDF)
    • Створення спеціалізованих графіків (гістограми, кругові діаграми, коробчасті діаграми)
  1. Візуалізація Seaborn
    • Вступ до Seaborn та його особливості
    • Створення графіків розподілу даних (histplot, kdeplot, distplot)
    • Побудова категоріальних графіків (barplot, countplot, boxplot)
    • Використання графіків відношень (scatterplot, lineplot)
    • Теплові карти (heatmap) для візуалізації кореляцій та матриць
    • Налаштування стилів та палітр кольорів у Seaborn
    • Фасетна візуалізація (FacetGrid, pairplot) для групування даних
    • Аналіз та візуалізація статистичних даних (violinplot, swarmplot)
  1. Задача регресії
    • Підготовка даних для регресії
    • Розбиття даних на навчальну та тестову вибірки
    • Створення моделі лінійної регресії
    • Навчання моделі на навчальних даних
    • Оцінка точності моделі
    • Візуалізація результатів регресії
  1. Задача класифікації
    • Підготовка даних для класифікації
    • Розбиття даних на навчальну та тестову вибірки
    • Створення моделі класифікації (Logistic Regression, Decision Tree)
    • Навчання моделі на навчальних даних
    • Оцінка точності моделі (accuracy, precision, recall)
    • Візуалізація результатів класифікації
  1. Кластеризація
    • Підготовка даних для кластеризації
    • Вибір методу кластеризації (K-Means, Agglomerative Clustering та ін.)
    • Створення та моделі кластеризації
    • Візуалізація кластерів
    • Оцінка якості кластеризації (silhouette score)
    • Аналіз отриманих кластерів та інтерпретація результатів
  1. Аномалії
    • Підготовка даних для пошуку аномалій
    • Вибір методу виявлення аномалій (Isolation Forest, Local Outlier Factor)
    • Створення та навчання моделі для пошуку аномалій
    • Прогнозування аномалій у даних
    • Оцінка точності виявлення аномалій
    • Візуалізація та інтерпретація виявлених аномалій
  1. SQL
    • Вступ до SQL та основи реляційних баз даних
    • Виконання простих запитів SELECT
    • Фільтрація даних за допомогою WHERE
    • Сортування результатів за допомогою ORDER BY
    • Агрегація даних (SUM, AVG, COUNT, MIN, MAX)
    • Групування даних за допомогою GROUP BY
    • З’єднання таблиць (JOIN)
  1. Розбір домашніх проєктів
  • Демонстрація кращих рішень учасників
  • Демонстрація типових рішень викладача
  • Підсумки курсу

 

Ім’я
Номер, за яким з Вами можна зв'язатись
Ваша адреса електронної пошти

📩  info@sso.net.ua
☎️  38 098 805 45 11

o
✉️📅☎️🔝