跳轉到主要內容
Link - ONNX 執行環境
Menu - ONNX 執行環境
Expand - ONNX 執行環境
(external link) - ONNX 執行環境
Document - ONNX 執行環境
Search - ONNX 執行環境
Copy - ONNX 執行環境
Copied - ONNX 執行環境
ONNX Runtime
安裝 ONNX Runtime
入門指南
Python
C++
C
C#
Java
JavaScript
Web
Node.js 繫結
React Native
Objective-C
Julia、Ruby 和 Rust API
Windows
移動端
端側訓練
大模型訓練
教程
API 基礎
加速 PyTorch
PyTorch 推理
多目標推理
加速 PyTorch 訓練
加速 TensorFlow
加速 Hugging Face
部署到 AzureML
部署到移動端
使用 YOLOv8 進行目標檢測和姿態估計
Android 移動端影像識別
提升移動端影像解析度
iOS 移動端目標檢測
ORT 移動端模型匯出助手
Web
使用 ONNX Runtime 構建 Web 應用
'env' 標誌和會話選項
使用 WebGPU
使用 WebNN
處理大模型
效能診斷
部署 ONNX Runtime Web
故障排除
使用 ONNX Runtime 和 Next.js 進行影像分類
JavaScript 中用於 BERT 任務的自定義 Excel 函式
部署到物聯網和邊緣裝置
樹莓派 (Raspberry Pi) IoT 部署
部署傳統機器學習模型
使用 C# 推理
C# 基礎教程
使用 C# 推理 BERT NLP 模型
使用 C# 配置 CUDA GPU
在 C# 中使用 ResNet50v2 進行影像識別
使用 C# 執行 Stable Diffusion
在 C# 中使用 OpenVINO 進行目標檢測
在 C# 中使用 Faster RCNN 進行目標檢測
端側訓練
構建 Android 應用程式
構建 iOS 應用程式
API 文件
構建 ONNX Runtime
為推理而構建
為訓練而構建
使用不同的執行提供程式 (EP) 構建
為 Web 構建
為 Android 構建
為 iOS 構建
自定義構建
執行提供程式 (Execution Providers)
NVIDIA - CUDA
NVIDIA - TensorRT
NVIDIA - TensorRT RTX
Intel - OpenVINO™
Intel - oneDNN
Windows - DirectML
Qualcomm - QNN
Android - NNAPI
Apple - CoreML
XNNPACK
AMD - ROCm
AMD - MIGraphX
AMD - Vitis AI
雲端 - Azure
社群維護
Arm - ACL
Arm - Arm NN
Apache - TVM
瑞芯微 (Rockchip) - RKNPU
華為 (Huawei) - CANN
新增新的提供程式
EP 上下文設計
外掛執行提供程式庫
用法
開發
測試
打包
生成 API (預覽版)
教程
Phi-3.5 視覺教程
Phi-3 教程
Phi-2 教程
使用 LoRA 介面卡執行
DeepSeek-R1-Distill 教程
在驍龍 (Snapdragon) 裝置上執行
API 文件
Python API
C# API
C API
C++ API
Java API
如何操作
安裝
從原始碼構建
構建模型
為驍龍構建模型
故障排查
遷移
過去/現在共享緩衝區
參考
配置參考
介面卡檔案規範
擴充套件
新增運算元
構建
效能
效能調優
效能分析工具
日誌與追蹤
記憶體消耗
執行緒管理
I/O 繫結
故障排除
模型最佳化
量化 ONNX 模型
Float16 和混合精度模型
圖最佳化
ORT 模型格式
ORT 模型格式執行時最佳化
Transformers 最佳化器
使用 Olive 進行端到端最佳化
裝置張量 (Device tensors)
生態系統
Azure PyTorch 容器 (ACPT)
參考
版本釋出
相容性
運算元
運算元核心
貢獻運算元
自定義運算元
精簡運算元配置檔案
架構
引用 ONNX Runtime
ONNX Runtime 中的依賴管理
GitHub 上的 ONNX Runtime 文件
搜尋 onnxruntime
ONNX Runtime
安裝
入門指南
教程
API 文件
YouTube
GitHub
生成 API (預覽版)
如何操作
構建模型
使用模型構建器 (Model Builder) 生成模型
請參閱
模型構建器指南
以獲取最新文件。