Функції та їх похідні
Тема 2.1 Лінійна та поліноміальна регресія. Методи оцінки точності прогностичної моделі

Тестування статистичних гіпотез

Підведення до задачі лінійної регресії

Статистичні методи перевірки на гаусовість

ЦГТ і пошук змінних-кандидатів для побудови лін. регресії

Поняття лінії та пошук найкращої лінії, яка описує дані

Вступ до лінійної алгебри. Робота з матрицями і векторами

Математичне формулювання задачі лінійної регресії

Припущення лін. регресії. Метод найменших квадратів

Вимірювання якості регресійної моделі

Градієнтний спуск для задачі лінійної регресії

Лінійна регресія багатьох змінних. Виявлення статистичної значущості коефіцієнтів

Використання категоріальних змінних у моделі машинного навчання

Удосконалення моделі
Тема 2.2 Задача класифікації. Логістична регресія. Принцип роботи та методи оцінки якості

Задачі класифікації. Математичне формулювання логістичної регресії

Моделювання поліноміальної регресії

Методи регуляризації в машинному навчанні
Розв'язок ML задачі step-by-step

Задача класифікації з Scikit-Learn. Завантаження даних з Kaggle. Заповнення пропущених значень

Масштабування числових ознак

Навчання логістичної регресії в scikit-learn та оцінка якості класифікатора

Класифікація нового значення. Збереження і завантаження моделі. Sklearn Pipelines
Стратегії вирішення дисбалансу класів у машинному навчанні

Проблема дисбалансу класів. Random oversampling, undersampling та метод SMOTE

Метод Adasyn, зв'язки Томека і комбінування oversampling з undersampling
Мультикласова та мультизначна класифікація

Ансамблі моделей. Базові техніки

Задачі мультикласової і мультизначної (multi-label) класифікації

Вимірювання якості мультикласової класифікації. Приклад мультиклас і мультилейбл класифікації на даних
Тема 2.3 Дерева прийняття рішень

Вступ до дерев прийняття рішень

Принцип побудови дерев прийняття рішень

Вибір критерія розбиття в процесі побудови дерева

Умови зупинки в побудові дерева. Prunning. Як витягнути конкретні правила з дерева

Майстер-клас з перенесення коду з jupyter notebook у Python модуль

Навчання Decision Trees на практиці
Тема 2.4 Методи ансамблювання. Кросвалідація

Метод крос-валідації для покращення якості моделі

Оптимізація гіперпараметрів

Класифікатор kNN (k-найближчих сусідів)

Ансамблі моделей. Базові техніки

Використання просунутих методів ансамблювання: Stacking та Bagging + MK з аналізом помилок класифікації

Просунуті методи побудови ансамблів

Алгоритми бустингу. Adaboost

Градієнтний бустинг. XGBoost, LightGBM. Вибір алгоритму під задачу

Демо використання бустингових моделей. Тюнінг гіперпараметрів з hyperopt
Тема 2.5 Аналіз часових рядів

Вступ в аналіз часових рядів. Компоненти часових рядів

Аналіз якості передбачень часових рядів. Автокореляція і часткова автокореляція в часових рядах

Поняття стаціонарності. Знайомство з базовим функціоналом бібліотеки Darts

Методи прогнозування часових рядів та їх застосування. Бейзлайн моделі для часових рядів. Exponential smoothing

Моделі ARIMA/SARIMAX та Theta

Facebook Prophet, RNN/LSTM, трансформери для прогнозування time series. Розгляд часових рядів з іншою природою

Backtesting і аналіз помилок в аналізі часових рядів