6.5. Неконтролируемое снижение размерности

Если у вас большое количество признаков, может быть полезно уменьшить их с помощью неконтролируемого шага перед контролируемыми шагами. Многие из методов обучения без учителя реализуют метод преобразования, который можно использовать для снижения размерности. Ниже мы обсудим два конкретных примера этого шаблона, которые активно используются.

6.5.1. PCA: анализ главных компонентов

decomposition.PCA ищет комбинацию признаков, которая хорошо отражает дисперсию исходных признаков. См. Анализ главных компонент (Principal component analysis - PCA).

6.5.2. Случайные проекции

Модуль: random_projection предоставляет несколько инструментов для сокращения данных с помощью случайных проекций. См. соответствующий раздел документации: Случайная проекция.

6.5.3. Агломерация признаков

cluster.FeatureAgglomeration применяет Иерархическая кластеризация для группировки объектов, которые ведут себя одинаково.