如何在 Windows 上安裝 GPT-OSS 並充分利用其功能

最後更新: 07/01/2026
作者: 艾薩克
  • GPT-OSS 允許使用模型 OpenAI 在 Windows 本機上運行,無需依賴雲端,完全保護隱私。
  • gpt-oss-20b 型號最適合家用電腦,需要至少 16 GB 記憶體和現代 GPU 才能獲得良好的效能。
  • Ollama 和 LM Studio 透過提供以下功能簡化了 GPT-OSS 的安裝和使用: 下載 導遊帶領的遊覽與當地人的交流 ChatGPT.
  • 安裝完成後,GPT-OSS 可用於寫作、學習等。 程序設計 並直接透過您的電腦進行文件分析。

在 Windows 安裝 GPT-OSS

如果你已經使用 ChatGPT 或其他基於雲端的 AI 一段時間了,你可能會想知道,如果你也能擁有類似的功能,會發生什麼事。 直接安裝到您的 Windows 電腦上無需月費,無需依賴外部伺服器,也無需洩露任何對話內容。這正是 OpenAI 的全新開放模式所能實現的: gpt-oss-20b 和 gpt-oss-120b.

接下來我們將詳細了解。 如何在 Windows 安裝 GPT-OSS你需要哪些硬件,兩種型號之間有什麼區別,以及如何將它們都與現有型號一起使用。 奧拉馬LM工作室此外,我還會告訴你它在日常使用中的用途,在標準 PC 上的表現表現,以及如果你的電腦效能不足,你需要做出哪些權衡。

什麼是 GPT-OSS?它能為你做什麼?

GPT-OSS

GPT-OSS 是 OpenAI 的一系列開源模型。其設計理念是讓任何人都能下載並在自己的裝置上運作:電腦、工作站,甚至一些功能強大的手機。名稱源自 Generative Pretrained Transformer – Open Source Series,即一系列生成式文字模型。 本軟體採用 Apache 2.0 許可證開源。.

使用 GPT-OSS,您可以執行與使用雲端助理幾乎相同的任務: 產生各種類型的文本 (電子郵件、社群媒體貼文、劇本、故事、詩歌…),總結長篇文檔,重寫段落,改進寫作,或將語氣調整為更正式或更平易近人的風格。

它也能夠處理更複雜的技術任務: 解釋程式碼,檢測程式錯誤它可以針對不同的程式語言提出更優的解決方案,幫助你學習編程,或為你解決邏輯和數學問題提供提示。它雖然無法直接存取互聯網,但它能夠很好地處理逐步推理,並引導你完成許多複雜的流程。

在個人效率領域,GPT-OSS 的表現非常出色。 組織項目,集思廣益它可以幫助您制定工作計劃、產生待辦事項清單、回答各種主題的問題,或撰寫報告和學術論文。如果您是學生、自由工作者、內容創作者或開發人員,即使在本地運行,也能從中受益匪淺。

在 Windows 系統上本機使用 GPT-OSS 的優缺點

GPT-OSS 與 ChatGPT、Gemini 或 Claude 等模型的最大差異在於: 你不需要依賴遠端伺服器該模型運行在您自己的 Windows PC 上,這有一些非常明顯的優勢,但也存在一些缺點,您在安裝之前應該了解這些缺點。

第一個大優勢是 絕對保護您的資料隱私您透過該模型發送的每一次對話、每一個文件或每一個問題都保存在您的電腦上,任何公司都無法訪問這些信息,也無法利用它們來訓練更多模型、分析您的個人信息或向您投放廣告。如果您需要處理敏感文件、合約、公司內部資料或個人信息,這將非常寶貴。

與此密切相關的是 安全由於沒有任何資料傳送到雲端,因此不會產生與第三方的資料流量,從而大幅降低了與外部服務相關的攻擊面。當然,您仍然需要保護自己電腦的安全,但至少消除了雲端服務供應商的因素。

另一個贊成的觀點是 經濟自由商業服務通常採用月度訂閱模式(例如 ChatGPT Plus、Gemini Advanced 等)或透過 API 按使用付費模式。而 GPT-OSS 則完全免費:只需下載一次,安裝即可,無需其他操作。 定期費用或人為限制 的消息。

此外,作為一種開放模式,您具有一定程度的 控制和定制 這是封閉式服務所不提供的。您可以調整參數,更改預設行為, 將其整合到您自己的應用程式中使用腳本自動執行任務,或使用在您的機器上執行的 API 將其連接到本機工具。

不太吸引人的方面在於硬體和複雜性。運行這樣的模型對團隊來說是一項艱鉅的任務,而且 響應速度很大程度上取決於您的 CPU、GPU 和記憶體。在效能強大的電腦上,反應速度很快;而在配置較低的筆記型電腦上,你會發現反應速度較慢。

你還必須假設某些 技術負荷整個系統的安裝、設定、更新和安全維護都由您負責。雖然借助 Ollama 或 LM Studio 等工具,操作並不十分複雜,但仍然比直接打開網站開始編寫程式碼複雜得多。

  如何在 PowerShell 或 CMD 中比較兩個文字文件

gpt-oss-20b 和 gpt-oss-120b 之間的區別

在 GPT-OSS 系列中,您主要會發現 兩種型號尺寸:gpt-oss-20b 和 gpt-oss-120b雖然名稱相似,但它們在功能上,尤其是在硬體要求方面,卻不在同一水平線上。

gpt-oss-120b 是大型模型這款顯示卡專為資料中心、多GPU工作站或高階機器而設計,其性能接近OpenAI o4-mini等商業型號,但作為回報,它至少需要 60 GB 顯存或統一內存這幾乎排除了所有家用電腦。

在更容易接觸到的方面,我們有 GPT-OSS-20B這款中階機型在功能上與 o3-mini 等機型相近,專為消費性電子設備設計:它需要 16 GB 顯存或統一內存 功能合理,既可在遊戲桌上型電腦上運行,也可在許多其他桌上型電腦上運行。 手提 使用專用 GPU 或在某些情況下 免費下載 搭載蘋果晶片。

實際上,如果您打算在家中或辦公室的 Windows PC 上安裝 GPT-OSS, 比較現實的候選人是gpt-oss-20b120b 專用於配備多張顯示卡的特定配置或專業工作站。

在 Windows 上安裝 GPT-OSS 的建議最低系統需求

在開始下載和安裝之前,建議先查看相關文件。 GPT-OSS 在 Windows 上正常運作需要哪些條件?好消息是,對於 20b 型號來說,其對現代 PC 的要求並不算過分,儘管對老式筆記型電腦來說有點苛刻。

至於作業系統,你需要 Windows 10 或 窗戶11 64位由於記憶體限制以及與我們將要使用的工具的兼容性問題,32 位元版本完全被排除在外。

記憶體是關鍵因素之一。對於 gpt-oss-20b,建議至少配備 16 GB的RAM 這樣可以留出一定的餘量,確保模型運作時系統穩定。理論上,它可以在配備 8GB 記憶體的系統上啟動,但體驗會非常有限,而且你必須關閉幾乎所有其他程式以避免效能瓶頸。

如果說的是gpt-oss-120b,情況就大不相同了: 最低 32 GB 內存,理想情況下更多除了需要大量的顯存之外,它實際上使得在普通的 Windows PC 上安裝這款遊戲變得不可行。

至於處理器,你不需要最新最好的,但也不需要舊古董。建議至少配備[某種配置]的處理器。 Intel英特爾 第四代酷睿 i5 或更高版本,或 AMD Ryzen 3 或更高版本如果沒有 GPU,CPU 可以獨立運行模型,但文字產生速度會慢很多。

儲存方面,請記住這些型號的硬碟佔用空間較大,最好預留一些可用空間,以免 Windows 系統運作緩慢。至少配備一塊容量為 100 公升的固態硬碟 (SSD)。 500 GB 的剩餘空間將為您提供足夠的空間 適用於 GPT-OSS 和其他模型。作為參考,gpt-oss-20b 的大小約為 12-13 GB,而 gpt-oss-120b 根據版本不同,最大可達 70 GB。

加速發電的關鍵在於 顯示卡(GPU)如果你想要舒適的性能,理想情況下你應該擁有一台。 NVIDIA GeForce RTX 3060 或更高版本,或 AMD Radeon RX 6700 或更高版本之前的模型仍然有效,但每秒令牌數會下降,你會注意到反應速度變慢,持續時間更長。

如果沒有獨立顯示卡,GPT-OSS 也可以只使用 CPU 和記憶體運行,但速度會慢很多。整合式顯示卡能帶來一些效能提升,但遠不及現代獨立顯示卡。

最後,你需要 只要網路連線即可下載模型下載安裝後,它完全可以離線運行,因此您可以斷開電纜或 WiFi 連接,並像往常一樣繼續使用 AI。

如何使用 Ollama(圖形介面和命令列)在 Windows 上安裝 GPT-OSS

為了避免直接處理程式碼行和原始配置,最簡單的方法是使用專為管理語言模型而設計的工具。 Ollama是最簡單、最完善的選擇之一。 對於 Windows 使用者來說,無論您是想使用圖形介面還是更喜歡使用終端。

Ollama 充當本地 LLM「發射器」:它負責 下載、儲存和執行 GPT-OSS (以及其他型號,例如 LLaMA、Gemma 或 Qwen)安裝過程相當簡單。它是免費的開源軟體,適用於 Windows、macOS 和 iOS 系統。 Linux.

首先,造訪 Ollama 官方網站並下載 Windows 安裝程序,通常是一個檔案名稱類似這樣的檔案。 OllamaSetup.exe儲存文件,運行它,然後按照任何桌面程式的典型步驟操作:接受條款和條件,如果要更改資料夾,請選擇一個資料夾,然後等待它完成。

  如何在 Windows 中更改螢幕更新率:完整指南

安裝前,請確認您符合以下最低要求: Windows 10/11 64 位元作業系統,至少 8 GB 內存 (雖然 16 GB 記憶體對 GPT-OSS 來說是理想配置),以及至少一顆四核心 x86 CPU(例如,第四代 Intel Core i5/i7 或 AMD Ryzen 3/5/7)。獨立顯示卡是可選的,但強烈建議使用以提升運行速度。

首次開啟 Ollama 時,你會看到一個類似聊天介面的介面。在介面中央,程式圖示下方,有一個方框,你可以在其中輸入… 選擇您要使用的型號展開後,您將看到雲端和本地可用的模型清單。

其中你會看到門票。 gpt-oss:20b 和 gpt-oss:120b如果您使用的是家用電腦,請選擇 gpt-oss:20b,這是中等解析度的分割表。選擇後,只需在文字方塊中輸入任意訊息(例如簡單的“你好”),然後發送即可啟動 Ollama。 模型自動下載.

下載可能需要幾秒鐘到幾分鐘不等,具體取決於您的網路連接,因為檔案大小約為 12,8 13 GB模型載入完成後,你就可以像在 ChatGPT 前一樣開始與 GPT-OSS 聊天,而無需離開你的電腦。

如果您喜歡使用命令列而不是圖形介面,Ollama 也支援這種工作流程。 PowerShell的 或者在 Windows 終端機中,您可以使用以下命令: 使用“ollama pull gpt-oss:20b”指令下載模型 然後輸入“ollama run gpt-oss:20b”即可啟動並開始聊天。對於更大的型號,只需將名稱更改為 gpt-oss:120b 即可。

使用 LM Studio 在 Windows 上安裝並使用 GPT-OSS

如果您想要一個參數更可調、更全面的環境,可以試試看。 LM工作室這是另一個允許使用的工具。 在本地下載、管理和運行 AI 模型 它還支援 Windows、macOS 和 Linux 系統。可以說,Ollama 的介面更加簡潔明了,而 LM Studio 則提供了更具視覺吸引力的介面和更多附加選項。

關於系統需求,LM Studio for Windows 建議: 支援 AVX2 指令集的 64 位元 CPU建議使用 16 GB 記憶體以流暢運行 7-8 億位元模型,如果想要加快整個處理速度,則必須配備 GPU。 8 GB 記憶體仍然可以處理 3-4 億位元的小型模型和較短的上下文,但對於像 gpt-oss-20b 這樣大小的模型,最好配備充足的記憶體。

就儲存空間而言,每種型號的佔用空間在 2 GB 到 20 GB 以上不等,不過也有一些 gpt-oss-20b 變體,根據其量化方式的不同,佔用空間會更高。最好預留一些空間。 至少100 GB的可用空間 如果您打算下載多個模型並嘗試不同的版本。

要安裝 LM Studio,請造訪其官方網站,選擇 Windows 版本,然後下載可執行檔(通常約為 500-600 MB)。雙擊該文件,選擇目標資料夾(應用程式本身需要約 1,7 GB 的空間),然後按一下「安裝」。安裝完成後,您將看到其主介面,即可使用。

下一步是點擊圖標 左側邊欄中的放大鏡這將打開模型搜尋引擎。您可以在這裡瀏覽所有與本地執行相容的模型,包括 GPT-OSS 的 20 位元版本。

在清單中找到 gpt-oss-20b(它可能顯示為 openai/gpt-oss-20b 或類似路徑),然後按一下它。 免費下載LM Studio 將開始下載模型;同樣,下載時間取決於您的網路連線和您選擇的版本的具體大小。

下載完成後,請前往以下部分: 左側欄的“聊天”你會看到一個名為「選擇要載入的模型」的下拉式選單。選擇 gpt-oss-20b,然後會打開一個初始設定螢幕,其中包含幾個滑桿和選項。

這裡最重要的兩個參數是: 上下文長度 以及卸載到 GPU 的層數。上下文決定了模型在對話中能夠記住多少個詞元(簡單來說就是單字和詞段)。設定得越高,模型消耗的記憶體就越多,每個詞元需要進行的運算也越多,這意味著更高的 RAM/VRAM 使用率,如果硬體效能不足,則可能會出現錯誤。

「卸載到 GPU」選項定義了模型中有多少層直接在顯示卡上執行。 載入到 GPU 上的圖層越多,產生文字的速度就越快。但這也會佔用更多顯存。如果過度增加顯存,效能會急劇下降,甚至裝置都無法啟動,所以明智的做法是逐步增加顯存,直到找到最佳值。

這些細節調整完畢後,你點擊 “載入模型” LM Studio 將打開一個與 ChatGPT 非常相似的聊天窗口,您可以在其中寫下您的問題、貼上文字以進行總結,或尋求程式碼方面的協助。

  如何在 Gemini 2.5 Pro 中禁用倫理道德?完整指南

可從 Hugging Face 或 GitHub 下載 GPT-OSS,以及其他使用方式。

雖然對大多數 Windows 使用者來說最方便的選擇是使用 Ollama 或 LM Studio,但 OpenAI 也提供了 可直接從 Hugging Face 和 GitHub 等代碼倉庫下載 GPT-OSS。這主要面向希望完全控制整合的開發人員和高級用戶。

在 Hugging Face 網站上,您可以找到 gpt-oss-20b 和 gpt-oss-120b 的不同變體,以及 社區改編優化的版本 適用於不同類型的硬體和庫。每個版本的大小(有 20b 版本,大小從大約 11 GB 到超過 40 GB 不等)和效能都可能有所不同,具體取決於它們使用的量化類型。

另一個官方下載點是 GitHub,OpenAI 在那裡發布了使用 GPT-OSS 所需的所有資源,包括使用範例、腳本以及將其整合到專案中的文件。如果您想建立比簡單的本機聊天更複雜的系統,可以參考 GitHub 上的資源來準備特定的環境、容器或自訂流程。

除了在PC上運行之外,還有其他選擇 在行動裝置上測試 GPT-OSS Android e iOS 使用第三方應用程式。雖然 OpenAI 沒有推薦任何特定的應用程序,但 PocketPal AI 是一個比較受歡迎的選擇,它允許你添加來自 Hugging Face 的模型,並在一些中高端手機上本地運行它們。

該流程通常包括安裝應用程序,進入模型部分,選擇“從 Hugging Face 添加”,搜尋 gpt-oss 或 gpt-oss-20b,然後下載最適合您設備存儲空間和內存的版本。然而,在行動裝置上,兩者之間的平衡… 模型重量和性能 它非常精密,為了確保一切順利運行,選擇較小的型號並不罕見。

在 Windows PC 上使用 GPT-OSS 可以做什麼?

一旦您安裝了 GPT-OSS 並將其與 Ollama 或 LM Studio 配合使用,您就可以在日常工作中利用其廣泛的實際用途。 所有內容都保存在你的電腦上,讓你安心無憂。.

從文字角度來看,它非常適合 撰寫文章、摘要、電子郵件、腳本和出版物 用於社交媒體。你可以把它當作一份長文件。 PDF 或以純文字形式,讓他們提取關鍵思想,使其適應不同的受眾,改進語氣,或用幾句話概括結論。

它還非常實用,因為 學習和工作助理它可以解釋概念、產生主題大綱、創建記憶卡片、批改論文或提供練習問題。結合其分析拖入程式視窗的文件功能,它就成為管理報告、學術論文或技術文件的強大工具。

在開發領域,GPT-OSS 扮演著…的角色。 線下節目夥伴它可以審查程式碼片段、標記錯誤、提出重構建議、產生輔助函數,或逐行解釋腳本的功能。它不能取代整合開發環境(IDE)或調試器,但可以節省大量搜尋時間,並在你遇到難題時提供想法。

此外,由於 Ollama 等工具公開的本機 API,您可以 將 GPT-OSS 整合到您自己的應用程式中實現任務自動化或創建小型、個人化的助手,這些助手可以根據您自己的資料做出回應,而無需依賴外部服務。

主要限制在該模型 無法取得即時資訊它所掌握的所有資訊都來自先前的訓練,因此它並非查詢突發新聞、最新法律變更或不斷變化的資料的最佳選擇。對於這類訊息,您仍然需要聯網模型或傳統搜尋方式。

就性能而言,注意到 GPT-OSS 的表現是正常的。 比託管在配備大量 GPU 的資料中心中的 ChatGPT 慢上下文越長、任務越複雜,回應時間就越長,尤其是在GPU或記憶體效能不足的情況下。使用此模型時,關閉開啟過多標籤頁的瀏覽器或佔用大量資源的程式有助於提高運行流暢度。

有了這些功能,GPT-OSS 就成了你 Windows 電腦上的「副駕駛」: 免費、私密、高度可客製化 即使離線也能使用。只要花點時間耐心完成初始設定和一些硬體調整,你就能擁有一個強大的助手,用於寫作、程式設計、學習和實驗。 生成式人工智能 無需離開辦公桌。

聊天工具
相關文章:
如何在 Windows 11 上一步一步安全地安裝 ChatGPT