• Простой и эффективный инструмент для предиктивного анализа данных
  • Доступный для каждого и переиспользуемый в различных контекстах
  • Основанный на NumPy, SciPy, и matplotlib
  • Open source проект, коммерческое использование - BSD лицензия

Классификация

Определение к какой категории принадлежит объект.

Применение: Выявление спама, распознавание изображений.
Алгоритмы: Градиентный бустинг, ближайшие соседи, случайны лес, логистическая регрессия, и больше...

Примеры

Регрессия

Прогнозирование атрибута с непрерывным значением связанного с объектом.

Применение: Реакция на лекарство, Отток клиентов.
Алгоритмы: Градиентный бустинг, ближайшие соседи, случайны лес, ridge, и больше...

Примеры

Кластеризация

Автоматическая группировка похожих объектов.

Применение: Сегментация клиентов, Группировка экспериментальных результатов
Алгоритмы: k-среднее (k-Means), HDBSCAN, иерархическая кластеризация, и больше...

Примеры

Понижение размерности

Понижение числа случайных переменных для анализа.

Применение: Визуализация, Увеличение эффективности.
Алгоритмы: PCA, выборка признаков, не отрицательная матричная факторизация, и больше...

Примеры

Выбор модели

Сравнение, валидация и выбор параметров и моделей.

Применение: Улучшение точности через настройку параметров
Алгоритмы: таблица поиска, кросс-валация, метрики, и больше...

Примеры

Препроцессинг

Извлечение признаков и нормализация.

Применение: Преобразование входных данных, таких как текст, для использования в алгоритмах машинного обучения.
Алгоритмы: Препроцессинг, извлечение признаков, и больше...

Примеры
Данный сайт является неофициальным переводом сайта scikit-learn.org
Если вы хотите помочь проекту с переводом, то можно обращаться по следующему адресу support@scikit-learn.ru