如果您從事機器學習、電腦視覺或高效能運算,安裝 NVIDIA CUDA 幾乎是強制性的,以利用 GPU 加速。 選擇正確的驅動程式和工具包版本 避免錯誤並充分利用 硬件 從第一分鐘開始。
在本指南中,我將逐步講解如何在 Windows 和 WSL(Windows 子系統)中讓 CUDA 準備就緒。 Linux) 與 Ubuntu 22.04 和 24.04 相同。 您還將看到要求、檢查、特殊情況,例如 RTX 50 當您僅安裝驅動程式並且看到特定版本的 nvcc 而沒有請求它時會發生什麼情況。
要求和兼容性
在觸摸任何東西之前,最好先檢查一下起點。 您至少需要一個與 CUDA 相容的 GPU (請參閱 NVIDIA 官方指南中的模型清單)作為參考,建議許多 AI 工作流程使用 6GB 專用視訊記憶體。
如果您要將 Windows 與 WSL 一起使用,則支援範圍很廣: 窗戶11 Windows 10(版本 21H2 及更高版本)的最新更新允許在 WSL 上的 Linux 發行版中運行使用 CUDA 的 ML 工具、函式庫和框架。 這涵蓋 PyTorch、TensorFlow、Docker 和 NVIDIA Container Toolkit。 就像在原生 Linux 中一樣。
在具有 NVIDIA GPU 執行個體的公有雲環境中,通常最好從雲端提供者提供的 VM 映像開始。 這些影像已經附帶了適當的驅動程式和 CUDA 工具包。 這樣你就能省去一些棘手的步驟。如果你在自己的機器上安裝,請繼續閱讀。
對於 WSL 中的 GPU 功能,請確保 WSL 中的 Linux 核心是最新的。 需要 5.10.43.3 或更高版本。您可以從 PowerShell的 使用:
wsl cat /proc/version
如果需要更新 WSL,請前往 Windows 設定 → Windows更新 然後點選檢查更新。 保持核心更新可避免與 CUDA 不相容 以及 WSL 中的其他 GPU 元件。

透過 WSL 在 Windows 上進行 CUDA:驅動程式、WSL 和發行版
順序很重要。首先,在 WSL 上安裝支援 CUDA 的 NVIDIA 驅動程式。 在 WSL 上下載並安裝支援 CUDA 的 NVIDIA 驅動程式 NVIDIA 推薦用於您的 GPU 和 Windows 版本的驅動程式。此驅動程式可在 Linux 子系統中啟用 GPU 加速。
驅動程式之後,啟用 WSL 並安裝基於 glibc 的發行版,例如 Ubuntu 或 Debian。 啟用並安裝 WSL 後,執行更新 從 Windows 更新中保持 WSL 核心為最新。
檢查核心版本 從 PowerShell(或控制台)輸入:
wsl cat /proc/version
如果您的核心相容(≥ 5.10.43.3),您現在可以在 WSL 中使用 PyTorch 或 TensorFlow 等 ML 框架和工具, 除了使用 Docker 和 NVIDIA Container Toolkit 就像在原生 Linux 上一樣。如果您遇到任何問題,NVIDIA 會透過其社群在 WSL 中集中提供回饋和 CUDA 支援。

Ubuntu 22.04 和 24.04 上的 NVIDIA 驅動程式(包括 RTX 50)
在 Ubuntu 中,第一步也是安裝驅動程式。對於較新的 GPU,這裡有一個重要的警告: RTX 50s 需要驅動程式 570.xxx.xx 或更高版本。舊版本可能無法正常工作,因此經典安裝方法可能會失敗。
在 Ubuntu 22.04 中,使用 NVIDIA 官方安裝程序 .run 格式。首先需要滿足幾個先決條件:
sudo apt -y install gcc make
從 NVIDIA 網站下載安裝程序,授予其執行權限,然後啟動它。 選擇 MIT/GPL 選項來安裝開源驅動程式 並避免重新啟動後出現「未找到設備」錯誤:
wget https://us.download.nvidia.com/XFree86/Linux-x86_64/570.124.04/NVIDIA-Linux-x86_64-570.124.04.run
sudo chmod +x NVIDIA-Linux-x86_64-570.124.04.run
sudo ./NVIDIA-Linux-x86_64-570.124.04.run
完成後,重新啟動系統 以便驅動程式正確載入:
sudo shutdown -r now
在某些環境中,建議重建 GRUB 配置,以確保系統在安裝驅動程式後使用正確的核心參數啟動。 如果您有疑問 開機,重新產生 GRUB 通常可以解決該問題 在你因診斷而發瘋之前。
在最近部署的該驅動程式分支中出現的另一個建議是停用 GSP 並重新啟動。 停用 GSP 可以防止某些電腦上發生衝突。,尤其是在安裝 570 後發現異常行為時。
對於 Ubuntu 24.04,還有另一個細微差別:ubuntu-drivers 工具可能仍然無法識別 RTX 5090 也沒有提供適當的選擇。 在這種情況下,手動安裝正確的套件 並記得包含後綴 open:
sudo apt install nvidia-driver-570-server-open
如果沒有開啟後綴,系統可能無法辨識 GPU 並顯示「未找到裝置」。 安裝後,重啟 要載入的模組:
sudo shutdown -r now
如果您願意,您可以在 24.04 中使用 NVIDIA .run 安裝程式執行與 22.04 相同的步驟。 選擇最適合您流程的方法 以及您的環境的政策。

在 Ubuntu 上安裝 CUDA 工具包(12.4 與 12.8 以及環境路徑)
有了驅動程式後,就可以安裝工具包了。在目前的生態系統下, PyTorch 與 CUDA 12.4 和 12.8 無縫協作但如果您使用的是 RTX 50,建議使用 12.8 以獲得進階功能和最佳化核心。讓我們來看看使用 NVIDIA 本機儲存庫的穩健方法:
首先,下載 pin 檔案來優先考慮 NVIDIA repo:
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2404/x86_64/cuda-ubuntu2404.pin
將該圖釘移至 APT 首選項目錄:
sudo mv cuda-ubuntu2404.pin /etc/apt/preferences.d/cuda-repository-pin-600
現在下載工具包的本機儲存庫(例如,Ubuntu 24.04 的版本為 12.8.1):
wget https://developer.download.nvidia.com/compute/cuda/12.8.1/local_installers/cuda-repo-ubuntu2404-12-8-local_12.8.1-570.124.06-1_amd64.deb
使用 dpkg 安裝它 將 GPG 金鑰新增至金鑰環 從 Ubuntu 讓 APT 信任該 repo:
sudo dpkg -i cuda-repo-ubuntu2404-12-8-local_12.8.1-570.124.06-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2404-12-8-local/cuda-*-keyring.gpg /usr/share/keyrings/
更新索引並安裝工具包:
sudo apt-get update && sudo apt-get -y install cuda-toolkit-12-8
重新啟動電腦 避免新安裝的庫帶來意外:
sudo shutdown -r now
安裝後,最好驗證 CUDA 是否可用並將路徑新增至您的環境。 將變數新增至您的 shell,以便 nvcc 和函式庫位於 PATH 中 在以後的會話中。例如,在 Bash 中:
echo 'export PATH=/usr/local/cuda/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc
如果您使用 Zsh,您可以將其新增至 ~/.zshrc,對於非互動式會話,可以將其新增至 ~/.profile 或 ~/.bash_profile。 目標是任何 終端 或登入已找到 CUDA 庫 無需每次都進行任何配置。
使用以下命令檢查安裝:
nvcc --version
如果您不想管理本機儲存庫,還有其他腳本和資源可以在您遇到困難時為您提供協助。 記住要保持驅動程式和工具包版本之間的一致性。 通常可以解決90%的問題。

特定工具的 Windows:CUDA 10.1 和 cuDNN 7.6.4(模型建構器案例)
有些工具需要特定的舊版本。例如,在某些使用模型產生器的影像分類場景中,需要 CUDA 10.1 和 cuDNN 7.6.4(適用於 10.1)在此背景下,請確保以下幾點:
- 擁有 NVIDIA 開發者帳戶 訪問 下載.
- 專門安裝 CUDA v10.1; 沒有更高版本 針對該特定場景。
- 下載適用於 CUDA 10.1 的 cuDNN v7.6.4,解壓縮並 複製必要的二進位文件.
下載cuDNN zip後,解壓縮並將cudnn64_7.dll檔案複製到工具包路徑下。 請記住,您不能同時擁有多個版本的 cuDNN。 在同一環境中。範例路線:
<CUDNN_zip_files_path>\cuda\bin\cudnn64_7.dll -> <YOUR_DRIVE>\Archivos de programa\NVIDIA GPU Computing Toolkit\CUDA\v10.1\bin
沒有本機或 Azure GPU 可用?這些場景可以在 CPU 上運行,但 訓練速度會慢很多。如果 El Temppo 至關重要。
檢查、路線和常見問題
什麼 CUDA 版本 你的系統上有什麼?快速檢查方法為:
nvcc --version
如果您使用的是 Ubuntu 並且已經安裝了帶有 APT 的驅動程式(例如,nvidia-driver-525),並且您看到列出了 nvcc 11.2 而沒有明確安裝該工具包,請不要驚慌。 在某些設定中,驅動程式安裝可能會拖曳 CUDA 套件 或已包含在基礎系統映像中。如果您僅安裝驅動程序,則無法始終選擇工具包版本。
如果您需要檢查確切的 CUDA 版本,請安裝 NVIDIA 儲存庫和特定的工具包(例如,cuda-toolkit-12-8),如我們所見。 這可確保工具包版本與驅動程式一致。 並滿足您的框架的需求。
記得配置環境變數 定位二進位檔案和庫。在 Bash 中,你可以在 ~/.bashrc 中加入:
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
在 Zsh 中,使用 ~/.zshrc,如果您希望它應用於登錄,請使用 ~/.profile 或 ~/.bash_profile。 如果沒有這些路徑,某些應用程式將無法找到 CUDA 程式庫。,即使安裝了工具包。
在 Windows 系統中,如果您不確定自己使用的 GPU 型號,可以透過多種方式進行確認。在「設定」中:右鍵點選「開始」功能表 → 設定 → 系統 → 顯示 → 相關設定 → 進階顯示。 品牌和型號顯示在“顯示資訊”下. 也來自 任務經理:效能標籤→GPU查看詳細資訊。
如果您在「設定」或「工作管理員」中沒有看到 GPU,但知道 NVIDIA 已安裝,請開啟 設備管理器 → 顯示適配器 → 為你的 GPU 安裝合適的驅動程式您可以在 GeForce Experience 中查看更新,如果失敗,您可以隨時從 NVIDIA 網站下載最新的驅動程式。
在 WSL 場景中,請記住:WSL 中支援 CUDA 的 NVIDIA 驅動程式、啟用 WSL、基於 glibc 的發行版、核心 5.10.43.3 或更高版本,然後是您的框架(PyTorch/TensorFlow)或具有 NVIDIA Container Toolkit 的容器。 此安裝順序避免了瓶頸和難以調試的錯誤。.
在 Ubuntu 22.04/24.04 上,如果您使用的是 RTX 50,請堅持使用 570 分支,而在 24.04 上,請使用 nvidia-driver-570-server-open 套件或 .run 安裝程式。 不要忘記重啟,如有必要,停用 GSP對於工具包來說,12.8 是 RTX 50 的安全選擇;PyTorch 也支援 12.4,但使用 12.8 可以獲得更好的最佳化。
一旦一切就緒,您就可以使用 Docker 在本機 Linux 或 WSL 上執行流程,或直接使用 PyTorch/TensorFlow 來執行流程。 如果某些東西無法啟動,請檢查版本、環境路徑和相容性 在更改一半安裝之前。許多問題可以透過調整驅動程式和工具包並確保系統「看到」GPU來解決。
本指南匯集了在 Windows(透過 WSL)和 Ubuntu 上可靠安裝 CUDA 的基本知識,涵蓋需求、RTX 50 驅動程式、使用本機儲存庫安裝 12.8 工具包、環境路徑和操作方法。 有了這個地圖,您應該能夠以盡可能少的摩擦力讓您的 GPU 工作。.
對字節世界和一般技術充滿熱情的作家。我喜歡透過寫作分享我的知識,這就是我在這個部落格中要做的,向您展示有關小工具、軟體、硬體、技術趨勢等的所有最有趣的事情。我的目標是幫助您以簡單有趣的方式暢遊數位世界。