6. Преобразования наборов данных

scikit-learn предоставляет библиотеку трансформаторов, которые могут очищать (см. Предварительная обработка данных), уменьшать (см. Неконтролируемое снижение размерности), расширять (см. Аппроксимация ядра (Kernel Approximation)) или генерировать (см. Извлечение признаков) представления признаков.

Как и другие модели, они представлены классами с методом fit, который изучает параметры модели (например, среднее и стандартное отклонение для нормализации) из обучающего набора, и методом transform, который применяет эту модель преобразования к новым данным. Метод fit_transform может быть более удобным и эффективным для одновременного моделирования и преобразования обучающих данных.

Комбинирование таких трансформаторов, параллельное или последовательное, рассматривается в Конвейеры и составные моделеи. Парные метрики, Cходство и Ядра рассматривает преобразование пространства признаков в афинную матрицу, а Преобразование цели прогнозирования (y) рассматривает преобразования целевого пространства (например, категориальных меток) для использования в scikit-learn.