Руководство по базе знаний
В версии 0.9.1 CherryStudio представила долгожданную функцию базы знаний.
Ниже мы пошагово покажем подробную инструкцию по использованию CherryStudio.
Добавить модель эмбеддингов
Найдите модель в сервисе управления моделями; можно быстро отфильтровать, нажав «Модель эмбеддингов»;
Найдите нужную модель и добавьте её в мои модели.

Создать базу знаний
Вход в базу знаний: на левой панели инструментов CherryStudio нажмите значок базы знаний, чтобы перейти на страницу управления;
Добавить базу знаний: нажмите «Добавить», чтобы начать создание базы знаний;
Название: введите название базы знаний и добавьте модель эмбеддингов; в качестве примера можно взять bge-m3 — после этого создание будет завершено.


Добавить файлы и векторизовать
Добавить файл: нажмите кнопку добавления файла, чтобы открыть выбор файлов;
Выберите файлы: выберите поддерживаемые форматы файлов, такие как pdf, docx, pptx, xlsx, txt, md, mdx и т. д., и откройте их;
Векторизация: система автоматически выполнит векторизацию; когда появится отметка завершения (зелёная ✓), это означает, что векторизация завершена.



Добавление данных из разных источников
CherryStudio поддерживает несколько способов добавления данных:
Папка с каталогом: можно добавить всю папку целиком; файлы поддерживаемых форматов в этой папке будут автоматически векторизованы;
Ссылка на сайт: поддерживаются URL-адреса, напримерhttps://docs.siliconflow.cn/introduction;
Карта сайта: поддерживается sitemap в формате XML, напримерhttps://docs.siliconflow.cn/sitemap.xml;
Простые текстовые заметки: поддерживается ввод собственного контента в виде обычного текста.
Совет:
Иллюстрации в документах, импортируемых в базу знаний, пока не поддерживают преобразование в векторы; их нужно вручную преобразовывать в текст;
При использовании сайта в качестве источника базы знаний успех не гарантирован: у некоторых сайтов есть довольно строгие механизмы антискрейпинга (или требуется вход, авторизация и т. д.), поэтому этот способ не всегда позволяет получить точный контент. После создания рекомендуется сначала проверить поиск.
Обычно сайты предоставляют sitemap, как и CherryStudiositemap; как правило, достаточно добавить /sitemap.xml после корневого адреса сайта (то есть URL), чтобы получить соответствующую информацию. Например:
aaa.com/sitemap.xml。Если сайт не предоставляет sitemap или URL-адресов слишком много и они разрознены, можно самостоятельно собрать XML-файл sitemap и использовать его; временно требуется указывать прямую ссылку, доступную из интернета, локальные ссылки на файлы не будут распознаны.
Можно попросить ИИ сгенерировать файл sitemap или написать HTML-генератор sitemap;
Прямую ссылку можно получить, например, через прямую ссылку OSS или прямую ссылку облачного диска. Если готового инструмента нет, можно также перейти на официальный сайтocoolAIи после входа использовать бесплатный инструмент загрузки файлов в верхней панели сайта, чтобы сгенерировать прямую ссылку.
Поиск по базе знаний
Когда файлы и другие материалы будут векторизованы, можно выполнять запросы:
Нажмите кнопку «Поиск по базе знаний» в нижней части страницы;
Введите искомый запрос;
Отобразятся результаты поиска;
и будет показан балл соответствия для каждого результата.


Использование базы знаний в ответах в диалоге
Создайте новую тему; в панели инструментов диалога нажмите «База знаний», и откроется список уже созданных баз знаний — выберите нужную базу знаний для引用;
Введите и отправьте вопрос, и модель сразу вернёт ответ, сгенерированный на основе результатов поиска;
При этом источники использованных данных будут указаны под ответом, чтобы можно было быстро просмотреть исходный файл.


Последнее обновление
Это было полезно?