知識庫教程
知識庫就好似幫 AI 配一本專屬參考書:你將自己嘅文件、筆記、網頁放入去,之後傾偈嗰陣叫 AI 翻呢本書嚟答。
唔知知識庫可以做乜?先睇 知識庫(功能介紹) 嘅幾個使用場景。
呢頁會帶你行完整個流程:添加嵌入模型 → 建立知識庫 → 放資料 → 喺對話入面調用。
添加嵌入模型
喺
設定 → 模型服務入面,搵到你常用嘅 Provider(如 CherryIN、硅基流動、OpenAI 等);撳 獲取模型列表,喺頂部 Tab 轉去 嵌入 分類;
揀需要嘅嵌入模型加到我嘅模型列表(推薦
bge-m3或者text-embedding-3-small)。

建立知識庫
入口:頂部 Tab
+→ 啟動台 → 撳知識庫(或者喺左側欄版面下撳知識庫圖示);添加:撳 + 添加,開始建立知識庫;
命名 + 揀模型:輸入名稱同揀嵌入模型(以
bge-m3為例),就可以完成建立。


添加檔案並向量化
添加檔案:撳添加檔案個按鈕,打開檔案選擇;
揀檔案:揀支援嘅檔案格式,例如 pdf、docx、pptx、xlsx、txt、md、mdx 等,然後打開;
向量化:系統會自動進行向量化處理,當顯示完成時(綠色 ✓),即代表向量化已完成。



添加多種來源嘅數據
CherryStudio 支援多種添加數據嘅方式:
資料夾目錄:可以添加成個資料夾目錄,呢個目錄底下支援格式嘅檔案會自動向量化;
網址連結:支援網址 URL,例如https://docs.siliconflow.cn/introduction;
網站地圖:支援 XML 格式嘅網站地圖,例如https://docs.siliconflow.cn/sitemap.xml;
純文字筆記:支援輸入純文字嘅自訂內容。
提示:
匯入知識庫嘅文件入面嘅插圖暫時唔支援轉做向量,需要手動轉做文字;
用網址做知識庫來源未必一定成功,有啲網站有比較嚴格嘅反爬機制(或者需要登入、授權等),所以呢個方式未必攞到準確內容。建立完成後建議先搜尋測試吓。
一般網站都會提供 sitemap,例如 CherryStudio 嘅sitemap,一般情況下喺網站嘅根地址(即網址)後面加 /sitemap.xml 就可以攞到相關資訊。例如
aaa.com/sitemap.xml。如果網站冇提供sitemap,或者網址比較雜,可以自己組合一個 sitemap 嘅 XML 檔案嚟用;檔案暫時需要用公網可直接訪問嘅直鏈方式填入,本地檔案連結唔會被識別。
可以叫 AI 生成 sitemap 檔案,或者叫 AI 寫一個 sitemap 嘅 HTML 生成器工具;
直鏈可以用 OSS 直鏈或者網盤直鏈等方式生成。如果冇現成工具,都可以去ocoolAI官網,登入之後用網站頂欄嘅免費檔案上傳工具嚟生成直鏈。
搜尋知識庫
當檔案等資料向量化完成後,就可以查詢:
撳頁面下方嘅搜尋知識庫按鈕;
輸入查詢內容;
顯示搜尋結果;
並顯示該條結果嘅匹配分數。


喺對話入面引用知識庫生成回覆
建立一個新話題,喺對話工具欄入面撳知識庫,就會展開已經建立嘅知識庫列表,揀需要引用嘅知識庫;
輸入並發送問題,模型就會返回透過檢索結果生成嘅答案;
同時,引用嘅數據來源會附喺答案下方,可以快速睇返源文件。


💡 取得幫助同提交反饋
如果你喺配置或者使用過程中遇到任何疑問、Bug 或者有功能改進建議,請參考 反饋與建議 入面提供嘅官方渠道。
最後更新
呢個有冇幫助?