歡迎使用 ONNX Runtime

ONNX Runtime 是一個跨平臺的機器學習模型加速器，具有靈活的介面以整合硬體特定庫。ONNX Runtime 可與來自 PyTorch、Tensorflow/Keras、TFLite、scikit-learn 和其他框架的模型配合使用。

如何使用 ONNX Runtime

ONNX Runtime 推理功能支援微軟在 Office、Azure、Bing 等關鍵產品和服務以及數十個社群專案中的機器學習模型。

ONNX Runtime 推理的用例示例包括

前提很簡單。

即使沒有第 3 步，ONNX Runtime 通常也能提供比原始框架更好的效能。

ONNX Runtime 對模型圖應用多項圖最佳化，然後根據可用的硬體特定加速器將其劃分為子圖。核心 ONNX Runtime 中的最佳化計算核心可提供效能改進，分配的子圖可從每個執行提供程式獲得進一步加速。