知识库教程
最后更新于
这有帮助吗?
知识库教程
在 0.91 版本中,CherryStudio 带来了期待已久的知识库功能。
下面我们将按步骤呈现 CherryStudio 的详细使用说明。
在模型管理服务中查找模型,可以点击“嵌入模型”快速筛选;
找到需要的模型,添加到我的模型。
知识库入口:在 CherryStudio 左侧工具栏,点击知识库图标,即可进入管理页面;
添加知识库:点击添加,开始创建知识库;
命名:输入知识库的名称并添加嵌入模型,以 bge-m3 为例,即可完成创建。
添加文件:点击添加文件的按钮,打开文件选择;
选择文件:选择支持的文件格式,如 pdf,docx,pptx,xlsx,txt,md,mdx 等,并打开;
向量化:系统会自动进行向量化处理,当显示完成时(绿色 ✓),代表向量化已完成。
CherryStudio 支持多种添加数据的方式:
文件夹目录:可以添加整个文件夹目录,该目录下支持格式的文件会被自动向量化;
网址链接:支持网址 url,如https://docs.siliconflow.cn/introduction;
站点地图:支持 xml 格式的站点地图,如https://docs.siliconflow.cn/sitemap.xml;
纯文本笔记:支持输入纯文本的自定义内容。
提示:
导入知识库的文档中的插图暂不支持转换为向量,需要手动转换为文本;
使用网址作为知识库来源时不一定会成功,有些网站有比较严格的反扒机制(或需要登录、授权等),因此该方式不一定能获取到准确内容。创建完成后建议先搜索测试一下。
一般网站都会提供sitemap,如CherryStudio的sitemap,一般情况下在网站的根地址(即网址)后加/sitemap.xml可以获取到相关信息。如aaa.com/sitemap.xml
。
如果网站没提供sitemap或者网址比较杂可自行组合一个sitemap的xml文件使用,文件暂时需要使用公网可直接访问的直链的方式填入,本地文件链接不会被识别。
可以让AI生成sitemap文件或让AI写一个sitemap的HTML生成器工具;
直链可以使用oss直链或者网盘直链等方式来生成。如果没有现成工具也可到ocoolAI官网,登录后使用网站顶栏的免费文件上传工具来生成直链。
当文件等资料向量化完成后,即可进行查询:
点击页面下方的搜索知识库按钮;
输入查询的内容;
呈现搜索的结果;
并显示该条结果的匹配分数。
创建一个新的话题,在对话工具栏中,点击知识库,会展开已经创建的知识库列表,选择需要引用的知识库;
输入并发送问题,模型即返回通过检索结果生成的答案 ;
同时,引用的数据来源会附在答案下方,可快捷查看源文件。
注意:
嵌入类模型、对话类模型、绘画类模型等各自有各自的功能,其请求方式跟返回内容、结构都有所不同,请勿强行将其他类别的模型作为嵌入模型使用;
嵌入类模型CherryStudio会自动分类显示在嵌入模型列表中(如上图),如果确认为嵌入模型但未被正确分类,可到模型列表中点击对应模型后方的设置按钮勾选嵌入选项;
如果无法确认哪些模型是嵌入模型可到对应服务商查询模型信息。