Руководство по базе знаний

В версии 0.9.1 CherryStudio представил долгожданную функцию базы знаний.

Ниже мы пошагово представим подробные инструкции по использованию CherryStudio.

Добавление модели встраивания

  1. В службе управления моделями найдите модель — можно нажать «Модель встраивания» для быстрой фильтрации;

  2. Найдите нужную модель и добавьте её в «Мои модели».

Создание базы знаний

  1. Вход в базу знаний: в левой панели инструментов CherryStudio нажмите значок базы знаний, чтобы перейти на страницу управления;

  2. Добавление базы знаний: нажмите «Добавить», чтобы начать создание базы знаний;

  3. Название: введите имя базы знаний и добавьте модель встраивания, например bge-m3 — создание будет завершено.

Добавление файлов и векторизация

  1. Добавление файлов: нажмите кнопку добавления файла, чтобы открыть выбор файлов;

  2. Выбор файлов: выберите поддерживаемые форматы файлов, такие как pdf, docx, pptx, xlsx, txt, md, mdx и т.д., и откройте их;

  3. Векторизация: система автоматически выполнит векторизацию; когда отображается завершение (зелёная ✓), это означает, что векторизация завершена.

Добавление данных из различных источников

CherryStudio поддерживает несколько способов добавления данных:

  1. Каталог папок: можно добавить целый каталог папок — файлы поддерживаемых форматов в этом каталоге будут автоматически векторизованы;

  2. Веб-адреса: поддерживаются URL-адреса, напримерhttps://docs.siliconflow.cn/introduction

  3. Карта сайта: поддерживается sitemap в формате xml, напримерhttps://docs.siliconflow.cn/sitemap.xml

  4. Простой текстовый блокнот: поддерживается ввод настраиваемого простого текста.

Подсказка:

  1. Иллюстрации в документах, импортируемых в базу знаний, пока не поддерживаются для преобразования в векторы — их нужно вручную преобразовать в текст;

  2. При использовании веб-адреса в качестве источника для базы знаний это не всегда сработает: некоторые сайты имеют строгие механизмы защиты от парсинга (или требуют входа/авторизации и т.д.), поэтому этот способ может не дать точного содержимого. После создания рекомендуется сначала протестировать поиск.

  3. Обычно сайты предоставляют sitemap, например у CherryStudiositemap— как правило, информацию можно получить, добавив /sitemap.xml к корневому адресу сайта (то есть к URL). Напримерaaa.com/sitemap.xml

  4. Если сайт не предоставляет sitemap или URL-адреса разрознены, можно самостоятельно составить XML-файл sitemap и использовать его; файл временно нужно указывать как прямую общедоступную ссылку, локальные ссылки не будут распознаны.

  1. Можно попросить ИИ сгенерировать файл sitemap или написать инструмент-генератор HTML для sitemap;

  2. Прямые ссылки можно получить с помощью OSS-прямых ссылок или прямых ссылок облачных хранилищ. Если нет готового инструмента, можно перейти наocoolAIофициальный сайт, войти и использовать инструмент бесплатной загрузки файлов в верхней панели сайта для генерации прямой ссылки.

Поиск по базе знаний

После того как файлы и другие материалы будут векторизованы, можно выполнять запросы:

  1. Нажмите кнопку «Поиск по базе знаний» в нижней части страницы;

  2. Введите текст запроса;

  3. Отобразятся результаты поиска;

  4. И будет показан балл соответствия для каждой найденной записи.

Цитирование базы знаний при генерации ответов в диалоге

  1. Создайте новую тему: в панели диалога нажмите «База знаний», развернётся список созданных баз знаний — выберите нужную для цитирования;

  2. Введите и отправьте вопрос, модель вернёт ответ, сгенерированный на основе результатов поиска;

  3. При этом источники использованных данных будут прикреплены под ответом для быстрого просмотра исходных файлов.

Последнее обновление

Это было полезно?