安裝 ONNX Runtime generate() API

Python 包安裝

注意:您的環境中只能安裝這些包中的一套(CPU、DirectML、CUDA)。

CPU

pip install onnxruntime-genai

DirectML

pip install onnxruntime-genai-directml

CUDA

如果您安裝 onnxruntime-genai 的 CUDA 變體,則必須安裝 CUDA 工具包。

CUDA 工具包可以從 CUDA 工具包歸檔 下載。

請確保 CUDA_PATH 環境變數已設定為您的 CUDA 安裝位置。

CUDA 12

pip install onnxruntime-genai-cuda

CUDA 11

要將此 API 與 CUDA 11 一起使用,您需要從原始碼構建並安裝

Nuget 包安裝

注意:您的專案中只能安裝這些包中的一個(CPU、DirectML、CUDA)。

前提條件

ONNX Runtime 依賴項

ONNX Runtime generate() 版本 0.3.0 及更早版本與核心 ONNX Runtime 二進位制檔案捆綁在一起。從 0.4.0 版本開始,包被分離,以提供更靈活的開發體驗。

CPU

dotnet add package Microsoft.ML.OnnxRuntimeGenAI

CUDA

注意:版本 0.3.0 及更早版本僅支援 CUDA 11,版本 0.4.0 及更高版本僅支援 CUDA 12。

dotnet add package Microsoft.ML.OnnxRuntimeGenAI.Cuda

DirectML

dotnet add package Microsoft.ML.OnnxRuntimeGenAI.DirectML