ONNX Runtime 效能調優

ONNX Runtime 在各種硬體上為執行深度學習模型提供高效能。根據使用場景要求，延遲、吞吐量、記憶體利用率以及模型/應用程式大小是衡量效能的常見維度。

雖然 ORT 開箱即用旨在為最常見的使用模式提供良好的效能，但仍可以利用模型最佳化技術和執行時配置來提高特定用例和模型的效能。