知識庫教程

喺 0.9.1 版本,CherryStudio 帶嚟咗期待已久嘅知識庫功能。

下面我哋會按步驟呈現 CherryStudio 嘅詳細使用說明。

新增嵌入模型

  1. 喺模型管理服務入面搵模型,可以撳「嵌入模型」快速篩選;

  2. 搵到需要嘅模型,添加到我嘅模型。

建立知識庫

  1. 知識庫入口:喺 CherryStudio 左側工具欄,撳知識庫圖示,就可以進入管理頁面;

  2. 添加知識庫:撳添加,開始建立知識庫;

  3. 命名:輸入知識庫嘅名稱並添加嵌入模型,以 bge-m3 為例,就完成建立。

添加文件並向量化

  1. 添加文件:撳添加文件嘅按鈕,打開文件選擇;

  2. 選擇文件:揀支持嘅文件格式,例如 pdf、docx、pptx、xlsx、txt、md、mdx 等,然後打開;

  3. 向量化:系統會自動進行向量化處理,當顯示完成時(綠色 ✓),代表向量化已完成。

添加多種來源嘅數據

CherryStudio 支持多種添加數據嘅方式:

  1. 文件夾目錄:可以添加整個文件夾目錄,該目錄下面支持格式嘅文件會被自動向量化;

  2. 網址連結:支持網址 url,例如https://docs.siliconflow.cn/introduction

  3. 站點地圖:支持 xml 格式嘅站點地圖,例如https://docs.siliconflow.cn/sitemap.xml

  4. 純文本筆記:支持輸入純文本嘅自定義內容。

提示:

  1. 導入知識庫嘅文件入面嘅插圖暫時唔支持轉換做向量,需要手動轉做文本;

  2. 用網址作為知識庫來源時唔一定會成功,有啲網站有比較嚴格嘅反爬機制(或者需要登入、授權等),所以呢種方式唔一定能拎到準確內容。建立完成後建議先搜尋測試一下。

  3. 一般網站都會提供 sitemap,好似 CherryStudio 嘅sitemap,一般情況喺網站嘅根地址(即網址)後面加 /sitemap.xml 就可以獲取到相關資訊。例如aaa.com/sitemap.xml

  4. 如果網站冇提供 sitemap 或者網址比較零散可以自己組合一個 sitemap 嘅 xml 文件嚟用,文件暫時需要用公開網絡可直接訪問嘅直鏈方式填入,本地文件鏈接唔會被識別。

  1. 可以叫 AI 幫手生成 sitemap 文件,或者叫 AI 寫一個 sitemap 嘅 HTML 生成器工具;

  2. 直鏈可以用 oss 直鏈或者網盤直鏈等方式嚟生成。如果冇現成工具亦可以去ocoolAI官網,登入後用網站頂欄嘅免費文件上傳工具嚟生成直鏈。

搜索知識庫

當文件等資料向量化完成後,就可以進行查詢:

  1. 撳頁面下方嘅搜索知識庫按鈕;

  2. 輸入查詢嘅內容;

  3. 呈現搜索嘅結果;

  4. 並顯示該條結果嘅匹配分數。

喺對話中引用知識庫生成回覆

  1. 建立一個新嘅話題,喺對話工具欄入面,撳知識庫,會展開已經建立嘅知識庫列表,揀需要引用嘅知識庫;

  2. 輸入並發送問題,模型即刻返回通過檢索結果生成嘅答案;

  3. 同時,被引用嘅數據來源會附喺答案下方,可以快捷查看源文件。

Last updated

Was this helpful?