6.5. Неконтролируемое уменьшение размерности ¶
Если у вас большое количество функций, может быть полезно уменьшить его с помощью неконтролируемого шага перед контролируемыми шагами. Многие из методов обучения без учителя реализуют transform
метод, который можно использовать для уменьшения размерности. Ниже мы обсудим два конкретных примера этого шаблона, которые широко используются.
Конвейерная обработка
Обработка неконтролируемых данных и контролируемая оценка могут быть объединены в цепочку за один шаг. См. Раздел « Конвейер: цепочки оценок» .
6.5.1. PCA: анализ главных компонент
decomposition.PCA
ищет комбинацию функций, которая хорошо отражает различия исходных функций. См. Раздел « Разложение сигналов на компоненты (проблемы матричной факторизации)» .
6.5.2. Случайные проекции
Модуль: random_projection
предоставляет несколько инструментов для обработки данных по случайным проекциям. См. Соответствующий раздел документации: Случайная проекция .
6.5.3. Агломерация функций
cluster.FeatureAgglomeration
применяет иерархическую кластеризацию, чтобы сгруппировать элементы, которые ведут себя одинаково.
Масштабирование функций
Обратите внимание, что если функции имеют очень разные масштабируемые или статистические свойства, cluster.FeatureAgglomeration
возможно, не удастся зафиксировать связи между связанными функциями. В preprocessing.StandardScaler
этих настройках может быть полезно использовать.