9.2. Совместимые форматы ¶
Для воспроизводимости и контроля качества, когда необходимо учитывать разные архитектуры и среды, экспорт модели в формате Open Neural Network Exchange или в формате Predictive Model Markup Language (PMML) может быть лучшим подходом, чем использование по pickle
отдельности. Это полезно, когда вы можете использовать свою модель для прогнозирования в среде, отличной от той, в которой модель была обучена.
ONNX — это двоичная сериализация модели. Он был разработан для повышения удобства использования функционально совместимого представления моделей данных. Его цель — облегчить преобразование моделей данных между различными средами машинного обучения и улучшить их переносимость на разные вычислительные архитектуры. Более подробную информацию можно найти в руководстве по ONNX . Для преобразования модели scikit-learn в ONNX был разработан специальный инструмент sklearn-onnx .
PMML — это реализация стандарта документов XML, определенного для представления моделей данных вместе с данными, используемыми для их создания. PMML удобочитаем для людей и машин и является хорошим вариантом для проверки моделей на различных платформах и долгосрочного архивирования. С другой стороны, как и XML в целом, его многословие не помогает в производстве, когда производительность критична. Чтобы преобразовать модель scikit-learn в PMML, вы можете использовать, например, sklearn2pmml, распространяемую по лицензии Affero GPLv3.