想像一下,如果您的瀏覽器能夠準確地看到您所看到的內容並理解它以即時幫助您,那會怎麼樣? 這是 Edge 中的 Copilot Vision,這是一項革命性的功能,它利用 人工智能 來自微軟,改變您與網路和線上文件互動的方式。無論是闡明網路概念、逐步指導您,還是輕鬆突出顯示重要訊息,這項技術都為各種用戶開闢了新的可能性。
在本完整指南中,您將了解如何利用 Copilot Vision 微軟邊緣,從激活到充分利用它的技巧,無論是在日常使用中還是用於專業或教育目的。如果您想了解如何更聰明地瀏覽並將您的網路體驗提升到一個新的水平,請繼續閱讀。
Edge 中的 Copilot Vision 到底是什麼?它有何特別之處?
Copilot Vision 是 Microsoft Edge 瀏覽器內建的進階功能。 它依靠人工智慧來分析螢幕上顯示的內容並為您提供上下文相關的幫助。 它遠遠超出了傳統的搜尋引擎或典型的語音助手:其目標是了解您導航的視覺環境,讓您透過語音與您面前的訊息進行交互,無論是網站、視訊還是文件。 PDF 在瀏覽器中開啟。
與其他助手的主要區別在於它能夠「看到」您的螢幕並理解視覺內容。。這樣,您就可以識別相關部分、解釋它們、突出顯示重要數據或對可見元素進行比較。可以將 Copilot Vision 視為虛擬伴侶,它能夠準確地看到您所看到的內容,並可以解釋概念、逐步指導您或建議下一步該做什麼。
體驗完全 對話和基於語音的:您可以直接與 Copilot 對話,Copilot 會以音訊形式回复,讓多工處理變得更加輕鬆。例如,如果您在烹飪並按照線上食譜做飯時手頭很忙,您可以要求 Copilot 閱讀步驟或向您解釋技巧,而無需將視線從螢幕上移開。
Copilot Vision 如何運作?主要特點和潛力
Copilot Vision 解釋您在 Edge 中造訪的頁面的視覺內容它不僅可以回答一般性問題,還能根據螢幕上顯示的內容,提供情境化答案。此功能依賴各種人工智慧技術,主要是基於 GPT-4 的高級模型,使其能夠理解文字、圖像和網站的視覺結構。
其主要特點如下:
- 語音交互:您可以從 Edge 側邊欄啟動 Copilot Vision 並使用 命令 透過語音與任何頁面、視訊或 PDF 進行互動。
- 描述和內容分析:Copilot Vision 向您展示網頁內容,讓您更輕鬆地理解訊息,並輕鬆總結長篇文字或提取特定數據。
- 突出顯示相關區域:助手能夠突出顯示或突出顯示螢幕的特定區域,以直觀地引導您找到所需的資訊。
- 情境協助:您可以進行產品比較,根據招募資訊協助撰寫求職信,並即時簡化複雜的概念。
- 會話技巧:互動非常自然,就好像您正在與坐在您旁邊的人交談,他可以看到並理解您所看到的內容。
Copilot Vision 不會控制您的電腦或執行自動點擊或捲動。;僅充當嚮導和翻譯,而不是獨立代理人。
Copilot Vision 在什麼情況下最有用?
此功能旨在為視覺化和上下文至關重要的日常任務或流程增加價值。。一些建議的(並且經過用戶測試的)實際用途包括:
- 閱讀逐步食譜 在烹飪時,您可以選擇讓 Copilot 解釋步驟,而無需觸摸電腦。
- 準備面試,請他或她解釋工作機會的細節或總結具體的工作描述。
- 撰寫求職信 基於職業頁面的內容,儘管不建議用於完整的履歷創建,但個人風格仍然至關重要。
- 理解圖形、技術定義或複雜片段 在學術文獻中。
- 方便透過入口網站、表格和線上流程進行導航 特別複雜或難以理解。
關鍵在於你不需要調整你的瀏覽方式:只需啟動 Copilot Vision 並在需要時尋求協助,無需複雜的設定或中斷。
如何啟動並開始使用 Edge 上的 Copilot Vision?
要開始利用 Copilot Vision,您必須滿足某些基本要求。。下面我將逐步解釋如何操作,以便您可以在幾分鐘內啟動它並開始與這項技術進行互動:
- 使用你的個人 Microsoft 帳戶登入 Edge。如果您還沒有帳戶,您可以透過瀏覽器免費建立一個。目前,工作或學校帳戶的標準版本不支援此功能。
- 導覽至您想要提問或尋求協助的網頁、影片或 PDF 文件。.
- 按下副駕駛圖標 位於 Edge 的右上角。這將打開 Copilot 側邊欄。
- 按下“語音”按鈕或麥克風圖標 開始說話。提出您的問題或要求對螢幕上看到的內容進行解釋。
- 與 Copilot Vision 自然互動:助手將分析可見的內容,並根據當時看到的內容與您對話。
- 結束會話,您可以退出 Copilot Composer,關閉 Copilot 側邊欄,或直接關閉 Edge 視窗。
重要:首次使用 Copilot Vision 時,您的瀏覽器將顯示一條隱私權聲明,您必須接受該聲明才能存取功能。
隱私與資料控制:Copilot Vision 對您了解多少?
使用高級 AI 功能時最常見的問題之一是資料和隱私會發生什麼。。微軟已採取措施確保 Copilot Vision 僅記錄助手的回應,目的是監控可能存在的不安全互動並改善服務。
不會記錄使用者輸入、影像和造訪頁面的內容。。一旦結束語音會話,所有臨時資料都會自動刪除。如果你在任何時候想停下來 屏幕分享 使用 Copilot,只需登出或退出瀏覽器即可。
Copilot Vision 遵守 Microsoft 隱私權聲明 而且,其免費版本僅適用於個人帳戶,無法代表您在網站上採取行動:未經您的同意,它永遠不會點擊、輸入或移動元素。
在企業或教育環境(Microsoft 帳戶或類似環境)中,企業資料保護更加強大,且這些功能可以由組織的管理員管理。
Copilot Vision Free 和 Pro 之間的版本、當前限制和差異
Copilot Vision 目前可在 Microsoft Edge 中免費使用。 適用於任何擁有個人帳戶和更新系統的使用者。但是,體驗和功能可能會有所不同:
- 免費版:僅限於在 Edge 瀏覽器本身內使用。您只能與在 Edge 中開啟的網站、影片或 PDF 進行互動。
- 副駕駛專業版:它提供擴展用途並允許 Vision 在作業系統層級使用,與外部應用程式(照片編輯、影片、專業軟體等)進行互動。專業用戶還可以享受與創意和生產力工具更深入、無縫的整合。
已知限制 該功能的問題包括偶爾崩潰(助手可能會卡在“請稍等...”之類的消息中)、低功耗計算機上出現困難,以及有時響應無法涵蓋所有可見信息或進入不完整的循環。微軟將繼續致力於改善這些方面並擴大地理可用性。
目前,雖然 Copilot Vision 已經登陸美國,但一些歐洲國家可能尚未啟用,但預計它將逐步推出。
Copilot Vision 與 Edge 中的其他 Copilot 功能
將 Copilot Vision 與 Edge 中的其他常規 Copilot 功能區分開來非常重要。雖然標準 Copilot 可以透過文字或聊天幫助您做出決策、研究和總結網頁, Copilot Vision 專注於視覺體驗和口語互動。 即時地、準確地呈現您眼前的情況。
Edge 中其他值得注意的 Copilot 功能包括:
- 頁面和文檔摘要:您可以讓助手總結任何打開的網站、PDF 或視頻,快速提取關鍵點。
- 重寫和編輯文本:Copilot 可以幫助您在瀏覽器的可編輯區域中撰寫、編輯和調整文字內容,根據您的喜好調整語氣和格式。
- 透過業務資料保護實現安全存取對於商業帳戶,互動由 DLP 策略和 Microsoft Purview 或 Intune 等解決方案涵蓋。
- 停用和自訂如果您願意,您可以修改 Copilot 的首選項,以便它不使用頁面內容或您的瀏覽活動,從而確保在更敏感的環境中控制您的個人資料。
Edge 中的 Copilot Vision 代表了我們瀏覽和理解網路方式的演進。。透過整合能夠將資訊視覺化和情境化的人工智慧,為那些在學習和日常工作中尋求效率、便利和個人化幫助的人消除障礙。請繼續關注即將推出的改進和更新,因為擁有一個坐在您旁邊的數位「副駕駛」的想法正日益成為與技術互動的新標準。
對字節世界和一般技術充滿熱情的作家。我喜歡透過寫作分享我的知識,這就是我在這個部落格中要做的,向您展示有關小工具、軟體、硬體、技術趨勢等的所有最有趣的事情。我的目標是幫助您以簡單有趣的方式暢遊數位世界。
