book-open-coverРуководство по базе знаний

В версии 0.9.1 CherryStudio представила долгожданную функцию базы знаний.

Ниже мы пошагово покажем подробную инструкцию по использованию CherryStudio.

Добавить модель эмбеддингов

  1. Найдите модель в сервисе управления моделями; можно быстро отфильтровать, нажав «Модель эмбеддингов»;

  2. Найдите нужную модель и добавьте её в мои модели.

Создать базу знаний

  1. Вход в базу знаний: на левой панели инструментов CherryStudio нажмите значок базы знаний, чтобы перейти на страницу управления;

  2. Добавить базу знаний: нажмите «Добавить», чтобы начать создание базы знаний;

  3. Название: введите название базы знаний и добавьте модель эмбеддингов; в качестве примера можно взять bge-m3 — после этого создание будет завершено.

Добавить файлы и векторизовать

  1. Добавить файл: нажмите кнопку добавления файла, чтобы открыть выбор файлов;

  2. Выберите файлы: выберите поддерживаемые форматы файлов, такие как pdf, docx, pptx, xlsx, txt, md, mdx и т. д., и откройте их;

  3. Векторизация: система автоматически выполнит векторизацию; когда появится отметка завершения (зелёная ✓), это означает, что векторизация завершена.

Добавление данных из разных источников

CherryStudio поддерживает несколько способов добавления данных:

  1. Папка с каталогом: можно добавить всю папку целиком; файлы поддерживаемых форматов в этой папке будут автоматически векторизованы;

  2. Ссылка на сайт: поддерживаются URL-адреса, напримерhttps://docs.siliconflow.cn/introductionarrow-up-right

  3. Карта сайта: поддерживается sitemap в формате XML, напримерhttps://docs.siliconflow.cn/sitemap.xmlarrow-up-right

  4. Простые текстовые заметки: поддерживается ввод собственного контента в виде обычного текста.

circle-info

Совет:

  1. Иллюстрации в документах, импортируемых в базу знаний, пока не поддерживают преобразование в векторы; их нужно вручную преобразовывать в текст;

  2. При использовании сайта в качестве источника базы знаний успех не гарантирован: у некоторых сайтов есть довольно строгие механизмы антискрейпинга (или требуется вход, авторизация и т. д.), поэтому этот способ не всегда позволяет получить точный контент. После создания рекомендуется сначала проверить поиск.

  3. Обычно сайты предоставляют sitemap, как и CherryStudiositemaparrow-up-right; как правило, достаточно добавить /sitemap.xml после корневого адреса сайта (то есть URL), чтобы получить соответствующую информацию. Например:aaa.com/sitemap.xml

  4. Если сайт не предоставляет sitemap или URL-адресов слишком много и они разрознены, можно самостоятельно собрать XML-файл sitemap и использовать его; временно требуется указывать прямую ссылку, доступную из интернета, локальные ссылки на файлы не будут распознаны.

  1. Можно попросить ИИ сгенерировать файл sitemap или написать HTML-генератор sitemap;

  2. Прямую ссылку можно получить, например, через прямую ссылку OSS или прямую ссылку облачного диска. Если готового инструмента нет, можно также перейти на официальный сайтocoolAIarrow-up-rightи после входа использовать бесплатный инструмент загрузки файлов в верхней панели сайта, чтобы сгенерировать прямую ссылку.

Поиск по базе знаний

Когда файлы и другие материалы будут векторизованы, можно выполнять запросы:

  1. Нажмите кнопку «Поиск по базе знаний» в нижней части страницы;

  2. Введите искомый запрос;

  3. Отобразятся результаты поиска;

  4. и будет показан балл соответствия для каждого результата.

Использование базы знаний в ответах в диалоге

  1. Создайте новую тему; в панели инструментов диалога нажмите «База знаний», и откроется список уже созданных баз знаний — выберите нужную базу знаний для引用;

  2. Введите и отправьте вопрос, и модель сразу вернёт ответ, сгенерированный на основе результатов поиска;

  3. При этом источники использованных данных будут указаны под ответом, чтобы можно было быстро просмотреть исходный файл.

Последнее обновление

Это было полезно?