使用 Copilot 進行語義搜尋:完整指南和實際案例

最後更新: 03/11/2025
作者: 艾薩克
  • 副駕駛 在 Microsoft Graph 中結合詞法索引和向量索引,並遵守權限要求。
  • Copilot 搜尋和搜尋 API 統一了相關性、新鮮度和安全性,而無需複製資料。
  • 在 Power BI 中,AI 就緒模型(架構、同義詞、答案和說明)可提高準確性。
  • 隱私控制:資料防洩漏 (DLP)、自帶設備登入 (BYOK)、排除項 的SharePoint 以及地理邊界。

使用 Copilot 進行語意搜索

Copilot 的語意搜尋功能已從最初的設想發展成為環境資訊發現的新標準。 微軟365 以及 Power BI。 它結合了經典的詞彙線索和對意義的向量理解。 即使我們不記得確切的檔案名稱、電子郵件主題或精確的列標籤,也能找到相關內容。

除了傳統的搜尋引擎之外,該方案還與微軟 Graph 和下一代語意索引連結。 其結果是資訊檢索更具情境性、個人化和安全性。與使用者權限、人與文件之間的關係以及自然語言表達的實際意圖保持一致。

Copilot中的語意搜尋是什麼?它為什麼重要?

在 Microsoft 365 世界中,資料索引多年來一直在促進對資訊的訪問,但現在語義索引的出現使它實現了質的飛躍。 此索引以向量表示法補充了經典的詞彙索引。 文件和術語的(向量),這使得我們能夠透過語義而不是僅僅透過精確的詞語匹配來衡量相似性。

基於此,即使「祝賀」一詞並未直接出現,Copilot 也能理解諸如「供應商提供的文件對其設計表示祝賀」之類的查詢,因為 使用同義詞和近義詞擴大搜尋範圍。 (受到讚揚、讚美、優秀…)並利用 Microsoft Graph 的上下文來優先考慮最相關的內容。

奇蹟發生在你的租客身上: Copilot 尊重安全、合規和隱私的界線。它採用基於角色的存取控制,不會顯示使用者無權存取的任何內容。所有這些都無需您進行任何額外操作:Microsoft 會自動在租用戶層級啟用語意索引,並逐步擴展到使用者層級。

詞彙和語義索引:它們如何結合

詞彙索引對於按關鍵字、特定名稱和預定義過濾器進行搜尋仍然很有用。 語意索引提供概念理解它創建了向量空間,其中文檔按含義“分組”。這樣,模糊的問題也能找到準確的答案。

實際上,Microsoft 365 Copilot 採用了這兩種方法:它會查詢 Microsoft Graph,並從您的組織中收集相關證據; 豐富 LLM 提示(語言模型) 並返回更可靠的結果。在整個過程中,除了遵守微軟的隱私權政策外,傳輸中和靜態資料均採用加密技術。

用戶獲得了什麼? 一致、符合情境且個人化的結果 反映社交訊號(你與誰合作,你打開什麼)和內容之間的關係,而無需你記住內部術語或字面準確性。

資料流:從您的查詢到 Copilot 的回應

當您在 Microsoft 365 應用程式中編寫請求時,該請求會傳送至 Copilot。 Copilot 會查詢 Microsoft Graph 和語意索引來準備提示。 經過豐富化處理後的數據隨後能被LLM更準確地理解。系統接著返回Graph對輸出進行最佳化,最終在對應的應用程式中呈現文字和操作。

這種來回拉鋸保證了兩件事: 接地 並嚴守權限規定。所有操作均在使用者控制範圍內,資料始終保留在您的租用戶及其授權區域內。

El Temppo微軟正在擴大粒度:目前已經有一個主要由 SharePoint Online 中的文字內容驅動的租用戶級語意索引,並且正在逐步擴展, 建構用戶級索引 優先處理每日「工作集」(電子郵件、您參與的文件、提及等)。

內容類型、索引更新和管理

如今,語義索引包含了使用者郵箱(在個人領域)以及來自…的文檔 Word, 微軟幻燈片軟體, PDF租戶可以使用 aspx 頁面和 OneNote 等應用程式。 圖形連接器資料在租用戶層級建立索引。因此,其範圍會隨著來自外部系統的內容而擴大,但始終遵守權限。

  如何在 Excel 中編寫巨集來向智慧型裝置發送命令

更新速度很快: 您在個人郵箱中創建的內容幾乎會即時被索引。兩個或多個使用者可存取的 SharePoint 文件每天都會刷新,已建立索引的文件的變更也會迅速反映出來。管理功能無需激活,但您可以對某些設定進行微調。

例如,如果您沒有 Microsoft Purview DLP,並且需要將高度敏感的內容(薪資、財務、人力資源)從 SharePoint Online 中排除, 您可以標記這些網站,使它們不出現在搜尋結果中。 搜尋結果來自微軟搜尋或語義索引。您也可以管理人員和專案的「洞察」訊息,但請注意,停用這些訊息會導致使用者遺失有用的相關性訊號。

安全、合規、隱私和存儲

Copilot 繼承了 Microsoft 365 的控制功能: 商業安全、合規性和隱私 (包括 GDPR 和歐盟資料邊界要求)。查詢和結果不會用於訓練底層模型。如果您的環境中已啟用 BYOK(自備金鑰),則支援 BYOK。

指數資料會儲存在哪裡? 使用者索引託管在您的郵箱所在位置。租用戶索引位於 SharePoint 網站區域內的獨立容器中。歐盟資料邊界內的客戶將其索引儲存在歐盟/歐洲自由貿易聯盟 (EFTA) 資料中心,處理過程遵循多地域限制和已配置的區域策略。

所有這些都無法改變一個關鍵事實: 索引不會改變權限或配額。 存儲它僅適用於您已擁有存取權限的內容,並套用與 Microsoft 365 服務的其他部分相同的身分和角色控制模型。

Copilot 連接器和第三方數據

借助合適的連接器,您可以引入SaaS內容。 數據庫 以及 Microsoft Graph 外部的儲存庫。 一旦進入系統,這些內容也會被索引。 它仍然可以透過相同的存取控制機制供 Copilot 使用。重要的是要用文字豐富它的內容,以最大限度地提高語義相關性。

企業授權方面,根據連接器和 Copilot 產品的不同,會有具體的要求。 此次擴充將 Copilot Search 變成了一個單一的存取點。 微軟和第三方訊息,以及數百個可整合的微軟和 ISV 連接器。

Microsoft 365 中的 Copilot 搜尋:體驗、差異和答案

Copilot Search 以「搜尋」模組的形式出現在 Microsoft 365 Copilot 的網頁版、桌面版和行動版應用程式中。 他們的提議:一種快速、相關且普適的體驗 它可以連接到聊天窗口,以便進行更深入的探討或執行後續任務。

它接受自然語言查詢(「顯示 Marta 上週發送的關於第四季度預測的電子郵件」),也接受傳統關鍵字查詢。 當查詢允許時,它會顯示簡潔的「Copilot 回應」。 在頂部,基於 Graph,並在適當情況下,基於已啟用的網路和連接服務。

它與 Copilot 聊天有何不同?搜尋功能是專為…而設計的。 快速找到您需要的東西與微軟搜尋的「免費」基於關鍵字的搜尋引擎相比,聊天專注於生成內容、解釋、轉換和連結操作; Copilot Search(付費)增加了語意資訊、統一性和現代化體驗。此外,還與 Copilot Chat 深度整合。

搜尋 API:OneDrive 中的混合搜尋(詞彙 + 語意)。

對於開發者而言,Copilot Search API 提供了所需的功能。 在 OneDrive 上查看專業/教育內容 使用自然語言,無需在 Microsoft 365 之外複製或重新索引資料。自然語言處理能夠理解意圖並依相關性對結果進行排序。

客製化解決方案的優勢: 語意相關性、資料新鮮度、更低的擁有成本 並尊重原始權限。您可以使用 KQL 按特定路徑進行篩選,無需設定並行搜尋基礎架構即可取得更相關的預覽、元資料和檔案。

  Comet,Perplexity 的瀏覽器:登陸 Windows 的高級人工智慧、新功能和隱私爭議

最佳實務:編寫描述性查詢,加入上下文,避免使用過於通用的術語; 按路徑篩選時,請使用完整的 OneDrive 路徑。 (例如: https://contoso-my.sharepoint.com/personal/usuario_empresa_com/Documents/Proyecto/Informe.docx所有內容均以相關性自動排序。

目前需要考慮的限制: OneDrive 僅限工作或學習用途每次查詢最多 1500 個字符,每個使用者每小時 200 次請求,語義檔案大小有限制(.docx/.pptx/.pdf 格式最大 512 MB;其他格式更小)。 純表格/圖像/圖表不包含語意訊息可用性會根據 M365 Copilot 語意索引的支援情況進行調整。

Windows 新增功能:工作列中的「詢問副駕駛」功能

微軟正在針對 Dev 和 Beta 頻道的 Insider 用戶測試「Ask Copilot」功能: 一個經過改進的快捷方式,取代了傳統的搜尋欄 更輕便快速的浮動視窗。它不會產生視窗預載噪音,開啟迅速,並且簡化了操作。 開機 的查詢。

此整合是混合式的:用於本地搜索 應用程序文件和設定 使用了以下 API: Windows 搜尋和搜尋索引器服務Copilot 不會直接存取您的檔案。語義層會解釋意圖,但在早期版本中,某些自然命令會開啟配置而不是執行操作。

儘管視覺和語音按鈕都出現了, 在最初的版本中,它們會重定向到主 Copilot 應用程式。此功能為可選功能,預設為停用狀態;您可以在「設定」>「個人化」>「工作列」中啟用它。您仍然可以從「開始」功能表存取經典搜尋功能。

Power BI 中的 Copilot:如何準備「AI 就緒」的語意模型

在 Power BI 中,Copilot 徹底改變了使用者體驗: 產生視覺化圖表、DAX 指標、摘要和解釋 基於自然語言。但回應的品質很大程度上取決於語意模型:如果語意模型不完善,就會出現歧義和低效的回應。

一個具備人工智慧功能的模型包含以下要素: 數據模式 IA (AI 資料模式)、同義詞、已驗證的回應以及指導 Copilot 的「AI 指令」。此外,它還依賴強大的數據設計: 清晰的關係、易於理解的名稱、正確的資料類型連貫的措施和有用的層級結構。

Fabric Copilot 功能自 2025 年 4 月起可用。 適用於所有 Microsoft Fabric 功能(F2 以上版本)這降低了在資源受限的環境中存取 Copilot 的成本,並促進了其廣泛應用。

AI 資料模式、同義詞和指令

AI 資料模式允許對關鍵欄位(日期、客戶、類別、金額、利潤率、地區…)進行優先排序並加以區分。 實體和屬性透過易於理解的名稱(「客戶」、「銷售 ID」)和同義詞(「產品」~「文章」、「參考」、「項目」),Copilot 可以更好地理解用戶的需求。

「AI指令」為模型加入了全域上下文: 哪些指標是優先考慮的? 「活躍客戶」是如何定義的?為避免混淆概念,應避免哪些計算?例如:“‘客戶狀態’欄位用於區分在過去 12 個月內至少有過一次購買的資產;利潤率和利潤指標僅適用於資產。”

這些定義以及模式和同義詞都儲存在資料集中,並在發佈時發送到服務。 效果立竿見影。 在自動回覆的品質以及視覺效果和衡量標準的選擇方面。

建模中行之有效的解決方案和最佳實踐

「已驗證的答案」標誌著關鍵概念的官方定義(什麼是「淨利潤」、「活躍客戶」等)。 Copilot可以直接傳回已驗證的答案。 當檢測到相關查詢時,可減少爭論和誤解。

此外,建議對計量單位和命名規則進行標準化: 描述性且一致的名稱清晰且有文件記錄的 DAX 邏輯,以及一套預先準備好的常用度量值。範例: Total Sales = SUM(Sales[SaleAmount]), YTD Sales = TOTALYTD(SUM(Sales[SaleAmount]), 'Date'[Date]) o MoM Growth = DIVIDE([This Month Sales] - [Last Month Sales], [Last Month Sales]).

在模型中,要將事實表很好地分開(銷售數據、交易數據、存取數據)以及維度(例如, 維度產品ProductName, Category, Brand,而 DimCustomerCustomerName, City, Segment),創建邏輯層次結構(日期:年 > 季度 > 月 > 日;地理位置:國家 > 州/省 > 城市), 使用正確的資料類型 (數字作為數字,日期作為日期),並正確定義了關係的基數和狀態。

  如何使用指令執行 Microsoft Office

不要忘記保持數值的一致性(「Open」、「Closed」、「Pending」的大小寫要一致), 常規KPI (投資報酬率、客戶獲取成本、客戶終身價值)、更新透明度(「每日 UTC 時間 6:00」或每 15 分鐘增量更新)、基於角色的安全機制(按區域或敏感表進行篩選),以及 模型文檔 (表格/列和資料字典中的描述)。

將模型標記為 AI 就緒並授權

當模型準備就緒時(人工智慧方案、同義詞、指令,最好還有經過測試的回應), 標記為 IA 就緒 在 Power BI Desktop 中,發佈到 Premium 或 Fabric 工作區。您將在服務中的資料集中看到該指示器。

啟用 AI 就緒功能後,Copilot 可以擁有 完全存取模型的相關要素它能更好地理解自然語言問題,並改善視覺化和指標的生成。從中長期來看,這將減少技術幹預,並加快業務用戶的採用速度。

請注意許可要求: 搜尋 API 和 Copilot 搜尋需要有效的 Microsoft 365 Copilot 授權。在 Power BI 中,Copilot 的可用性取決於租用戶/工作區的容量和配置。

使用 Copilot 進行 Power BI 內容搜尋(獨立體驗)

在獨立的 Copilot 體驗中,您可以搜尋 Power BI「元素」(報表、語意模型、工作區或組織應用程式以及資料代理程式)。 Copilot 分析元資料與內部內容 從報告(頁面名稱、視覺標題、篩選面板和文字方塊)中尋找最相關的內容。

排名上升的指標包括: 書籤無論它是最近開設的、已獲批准的、受歡迎的,還是應用程式的一部分,添加清晰的描述、獨特的關鍵字和批准標籤都會使您的商品更容易在搜尋結果中被識別。

管理員可以將搜尋範圍限制在工作區或租用戶層級的 AI 就緒內容。 Copilot始終尊重權限,包括公共應用程式權限和隱藏元素權限。並且不會傳回用戶無權存取的結果。專案的直接變更會在幾分鐘內生效;間接變更(例如重新命名工作區)可能需要長達 24 小時。

如果你從一個廣泛的問題開始(「一月份有多少遊客來訪?」),Copilot 會建議候選項目,並要求你確認使用哪一個。 您也可以手動新增確切的物品。 即使某個元素沒有被標記為 AI 就緒,也可以與資料進行對話。

資訊保護:最小化和負責任的共享

除了資料防洩漏和站點排除之外,還有一些方法可以提供協助: 透過保留/刪除方式最大限度地減少沒有業務價值的數據 (Microsoft Purview)透過繼承正確的權限和應用即時存取檢查來防止過度共享。 保密標籤 在適當情況下進行加密和視覺標記,並使用 DLP 暫時限制對發生事件的文件的存取。

請記住,索引不會改變資料的共享方式,也不會透過使用「組織範圍」的連結來為索引添加內容。 只有使用者實際存取的內容才會被建立索引。 包含他們的身份資訊和權限。

如果你堅持一個想法,那麼它應該是這樣的: Copilot 的語意搜尋將意義、上下文和安全性連結起來。 這樣,您可以更快地找到重要內容;當您使用 AI 就緒模型(AI 架構、同義詞、已驗證的答案和說明)準備 Power BI 時,從 Microsoft 365 到關鍵報告和數據,您日常工作中的準確性和實用性都會顯著提高。