ONNX Runtime 釋出路線圖

ONNX Runtime 按季度釋出。必要時,補丁版本會在主要版本之間釋出。

上一個版本
1.20.0
釋出日期:2024年11月1日
進行中的版本
1.20.1
釋出日期:2024年11月20日
下一個版本
1.21
釋出日期:2025年2月

公告

  • onnxruntime-gpu v1.10.0 將從 PyPI 移除。 我們已達到 onnxruntime-gpu 在 PyPI 上的專案大小限制,因此我們將移除最舊的包版本以釋放必要的空間。
  • ONNX Runtime v1.20.0 現已正式釋出。 有關釋出說明、資產等,請訪問我們的GitHub 釋出頁面

版本更新

我們計劃升級 ONNX Runtime 對以下各項的支援(其中第一個值是先前支援的最高版本,第二個值是將在 ORT 1.20.1 中新增的版本支援)

  • QNN SDK 2.27 --> 2.28
  • DirectML 1.15.2 --> 1.16
  • ONNX 1.17 支援將包含在未來的版本中。

主要更新

除了各種錯誤修復和效能改進,ORT 1.20.1 將包括以下更新:

  • 針對以下核心的 CPU FP16 實現修復:LayerNormalization、SimplifiedLayerNormalization、SkipLayerNormalization、SkipSimplifiedLayerNormalization。
  • Python 量化工具更新。
  • 新增 QNN SDK 版本支援。

功能請求

要請求在未來版本中包含新的 ONNX Runtime 功能,請透過GitHub Issues 或透過GitHub Discussions 提交功能請求。

為確保您的請求儘快得到處理,請:

  • 包含詳細的標題。
  • 在請求正文中提供儘可能多的詳細資訊(例如,功能的用例、需要此功能的平臺或 EP 等)。
  • 如果知道,請應用與相應 ONNX Runtime 區域(例如,“platform:mobile”、“platform:web”、“ep:CUDA”等)對應的標籤。

注意:此頁面上列出的所有時間表和功能都可能發生變化。

ONNX Runtime 1.20.1

暫定釋出日期 11/20/2024

公告
  • onnxruntime-gpu v1.10.0 將從 PyPI 移除。 我們已達到 onnxruntime-gpu 在 PyPI 上的專案大小限制,因此我們將移除最舊的包版本以釋放必要的空間。
構建系統與包

1.20.1 版本沒有計劃中的功能。敬請關注 1.21 版本的功能。

核心

1.20.1 版本沒有計劃中的功能。敬請關注 1.21 版本的功能。

效能

1.20.1 版本沒有計劃中的功能。敬請關注 1.21 版本的功能。

量化
  • 引入 get_int_qdq_config() 輔助函式以獲取 QDQ 配置 (#22677)。
  • 更新 QDQ Pad、Slice、Softmax (#22676)。
  • 處理帶有預量化權重的輸入模型 (#22633)。
  • 透過調整權重的比例來防止 int32 量化偏差截斷 (#22020)。
EPs

CPU

  • 修復以下核心的 CPU FP16 實現:LayerNormalization、SimplifiedLayerNormalization、SkipLayerNormalization、SkipSimplifiedLayerNormalization。

QNN

  • 支援 QNN SDK 2.28.x。

DirectML

  • 支援 DirectML 1.16。
移動端

1.20.1 版本沒有計劃中的功能。敬請關注 1.21 版本的功能。

Web端

1.20.1 版本沒有計劃中的功能。敬請關注 1.21 版本的功能。

generate() API

1.20.1 版本沒有計劃中的功能。敬請關注 1.21 版本的功能。

擴充套件

1.20.1 版本沒有計劃中的功能。敬請關注 1.21 版本的功能。

Olive

1.20.1 版本沒有計劃中的功能。敬請關注 1.21 版本的功能。