文件預處理
最後更新
呢個有冇幫助?
知識庫文件預處理用嚟喺向量化前對 PDF / 圖片等非文字內容做 OCR 同結構解析,等知識庫可以正確檢索到呢啲資料。
打開 設定 → 文件處理,依次配置:
系統 OCR:macOS 用戶開箱即用(無需配置);Windows 需手動選擇 OCR 引擎
文件處理服務商:預設 MinerU,可填寫 API Key + API Host(預設 https://mineru.net);亦可切換為 Tesseract / Paddle OCR / OpenVINO / 第三方 Provider

撳「獲取 API KEY」後會喺瀏覽器打開申請地址,撳「立即申請」填寫表單後攞到 API KEY,然後將佢填入 API KEY 欄位。


喺已建立嘅知識庫設定中打開 文件預處理 開關,就可以喺新增文件時自動使用上一步配置嘅 OCR Provider。

可以透過右上角搜尋對知識庫結果進行檢查

知識庫使用 Tips:使用能力較強嘅模型時,可以將知識庫搜尋模式改做意圖識別;意圖識別可以更準確、更加廣泛咁描述你嘅問題。

如果您喺配置或使用過程中遇到任何疑問、Bug 或有功能改進建議,請參考 反饋同建議 入面提供嘅官方渠道。
最後更新
呢個有冇幫助?
呢個有冇幫助?