6. Преобразования наборов данных¶
scikit-learn предоставляет библиотеку трансформаторов, которые могут очищать (см. Предварительная обработка данных), уменьшать (см. Неконтролируемое снижение размерности), расширять (см. Аппроксимация ядра (Kernel Approximation)) или генерировать (см. Извлечение признаков) представления признаков.
Как и другие модели, они представлены классами с
методом fit
, который изучает параметры модели (например, среднее
и стандартное отклонение для нормализации) из обучающего набора,
и методом transform
, который применяет эту модель преобразования
к новым данным. Метод fit_transform
может быть более
удобным и эффективным для одновременного моделирования и преобразования обучающих данных.
Комбинирование таких трансформаторов, параллельное или последовательное, рассматривается в Конвейеры и составные моделеи. Парные метрики, Cходство и Ядра рассматривает преобразование пространства признаков в афинную матрицу, а Преобразование цели прогнозирования (y) рассматривает преобразования целевого пространства (например, категориальных меток) для использования в scikit-learn.
- 6.1. Конвейеры и составные моделеи
- 6.2. Извлечение признаков
- 6.3. Предварительная обработка данных
- 6.3.1. Стандартизация, или удаление среднего и масштабирование дисперсии
- 6.3.2. Нелинейное преобразование
- 6.3.3. Нормализация
- 6.3.4. Кодирование категориальных признаков
- 6.3.5. Дискретизация
- 6.3.6. Восстановление пропущенных значений
- 6.3.7. Генерация полиномиальных признаков
- 6.3.8. Кастомные Трансформаторы
- 6.4. Восстановление пропущенных значений
- 6.4.1. Одномерное и многомерное восстановление
- 6.4.2. Одномерное восстановление признаков
- 6.4.3. Многомерное восстановление признаков
- 6.4.4. Восстановление ближайших соседей
- 6.4.5. Поддержание постоянного количества признаков
- 6.4.6. Маркировка восстановленных значений
- 6.4.7. Модели, обрабатывающие значения NaN
- 6.5. Неконтролируемое снижение размерности
- 6.6. Случайная проекция
- 6.7. Аппроксимация ядра (Kernel Approximation)
- 6.8. Парные метрики, Cходство и Ядра
- 6.9. Преобразование цели прогнозирования (
y
)