6.5. Неконтролируемое уменьшение размерности

Если у вас большое количество функций, может быть полезно уменьшить его с помощью неконтролируемого шага перед контролируемыми шагами. Многие из методов обучения без учителя реализуют transform метод, который можно использовать для уменьшения размерности. Ниже мы обсудим два конкретных примера этого шаблона, которые широко используются.

Конвейерная обработка

Обработка неконтролируемых данных и контролируемая оценка могут быть объединены в цепочку за один шаг. См. Раздел « Конвейер: цепочки оценок» .

6.5.1. PCA: анализ главных компонент

decomposition.PCA ищет комбинацию функций, которая хорошо отражает различия исходных функций. См. Раздел « Разложение сигналов на компоненты (проблемы матричной факторизации)» .

6.5.2. Случайные проекции

Модуль: random_projection предоставляет несколько инструментов для обработки данных по случайным проекциям. См. Соответствующий раздел документации: Случайная проекция .

6.5.3. Агломерация функций

cluster.FeatureAgglomeration применяет иерархическую кластеризацию, чтобы сгруппировать элементы, которые ведут себя одинаково.

Масштабирование функций

Обратите внимание, что если функции имеют очень разные масштабируемые или статистические свойства, cluster.FeatureAgglomeration возможно, не удастся зафиксировать связи между связанными функциями. В preprocessing.StandardScaler этих настройках может быть полезно использовать.