Руководство по базе знаний
В версии 0.9.1 CherryStudio представил долгожданную функцию базы знаний.
Ниже мы пошагово представим подробные инструкции по использованию CherryStudio.
Добавление модели встраивания
В службе управления моделями найдите модель — можно нажать «Модель встраивания» для быстрой фильтрации;
Найдите нужную модель и добавьте её в «Мои модели».

Создание базы знаний
Вход в базу знаний: в левой панели инструментов CherryStudio нажмите значок базы знаний, чтобы перейти на страницу управления;
Добавление базы знаний: нажмите «Добавить», чтобы начать создание базы знаний;
Название: введите имя базы знаний и добавьте модель встраивания, например bge-m3 — создание будет завершено.


Добавление файлов и векторизация
Добавление файлов: нажмите кнопку добавления файла, чтобы открыть выбор файлов;
Выбор файлов: выберите поддерживаемые форматы файлов, такие как pdf, docx, pptx, xlsx, txt, md, mdx и т.д., и откройте их;
Векторизация: система автоматически выполнит векторизацию; когда отображается завершение (зелёная ✓), это означает, что векторизация завершена.



Добавление данных из различных источников
CherryStudio поддерживает несколько способов добавления данных:
Каталог папок: можно добавить целый каталог папок — файлы поддерживаемых форматов в этом каталоге будут автоматически векторизованы;
Веб-адреса: поддерживаются URL-адреса, напримерhttps://docs.siliconflow.cn/introduction;
Карта сайта: поддерживается sitemap в формате xml, напримерhttps://docs.siliconflow.cn/sitemap.xml;
Простой текстовый блокнот: поддерживается ввод настраиваемого простого текста.
Подсказка:
Иллюстрации в документах, импортируемых в базу знаний, пока не поддерживаются для преобразования в векторы — их нужно вручную преобразовать в текст;
При использовании веб-адреса в качестве источника для базы знаний это не всегда сработает: некоторые сайты имеют строгие механизмы защиты от парсинга (или требуют входа/авторизации и т.д.), поэтому этот способ может не дать точного содержимого. После создания рекомендуется сначала протестировать поиск.
Обычно сайты предоставляют sitemap, например у CherryStudiositemap— как правило, информацию можно получить, добавив /sitemap.xml к корневому адресу сайта (то есть к URL). Например
aaa.com/sitemap.xml。Если сайт не предоставляет sitemap или URL-адреса разрознены, можно самостоятельно составить XML-файл sitemap и использовать его; файл временно нужно указывать как прямую общедоступную ссылку, локальные ссылки не будут распознаны.
Можно попросить ИИ сгенерировать файл sitemap или написать инструмент-генератор HTML для sitemap;
Прямые ссылки можно получить с помощью OSS-прямых ссылок или прямых ссылок облачных хранилищ. Если нет готового инструмента, можно перейти наocoolAIофициальный сайт, войти и использовать инструмент бесплатной загрузки файлов в верхней панели сайта для генерации прямой ссылки.
Поиск по базе знаний
После того как файлы и другие материалы будут векторизованы, можно выполнять запросы:
Нажмите кнопку «Поиск по базе знаний» в нижней части страницы;
Введите текст запроса;
Отобразятся результаты поиска;
И будет показан балл соответствия для каждой найденной записи.


Цитирование базы знаний при генерации ответов в диалоге
Создайте новую тему: в панели диалога нажмите «База знаний», развернётся список созданных баз знаний — выберите нужную для цитирования;
Введите и отправьте вопрос, модель вернёт ответ, сгенерированный на основе результатов поиска;
При этом источники использованных данных будут прикреплены под ответом для быстрого просмотра исходных файлов.


Последнее обновление
Это было полезно?