ナレッジベースチュートリアル

0.9.1 バージョンで、CherryStudio は待望のナレッジベース機能を搭載しました。

以下では、CherryStudio の詳細な使い方を手順に沿って紹介します。

埋め込みモデルを追加する

  1. モデル管理サービスでモデルを探し、「埋め込みモデル」をクリックするとすばやく絞り込めます。

  2. 必要なモデルを見つけて、「マイモデル」に追加します。

ナレッジベースを作成する

  1. ナレッジベースの入口:CherryStudio 左側ツールバーのナレッジベースアイコンをクリックすると、管理ページに入れます。

  2. ナレッジベースを追加:[追加]をクリックして、ナレッジベースの作成を開始します。

  3. 命名:ナレッジベースの名前を入力し、埋め込みモデルを追加します。例として bge-m3 を使用すれば、作成完了です。

ファイルを追加してベクトル化する

  1. ファイルを追加:[ファイルを追加]ボタンをクリックして、ファイル選択を開きます。

  2. ファイルを選択:pdf、docx、pptx、xlsx、txt、md、mdx などの対応ファイル形式を選択して開きます。

  3. ベクトル化:システムが自動でベクトル化処理を行います。完了と表示されたら(緑の ✓)、ベクトル化が完了したことを示します。

さまざまなソースからデータを追加する

CherryStudio は、複数の方法でデータを追加できます。

  1. フォルダディレクトリ:フォルダ全体を追加でき、そのディレクトリ内の対応形式のファイルは自動的にベクトル化されます。

  2. URLリンク:URL に対応しています。たとえばhttps://docs.siliconflow.cn/introduction

  3. サイトマップ:xml 形式のサイトマップに対応しています。たとえばhttps://docs.siliconflow.cn/sitemap.xml

  4. ;プレーンテキストノート:プレーンテキストのカスタム内容を入力できます。

ヒント:

  1. ナレッジベースにインポートした文書内の挿絵は、現時点ではベクトルへの変換に対応していません。手動でテキストに変換する必要があります。

  2. URL をナレッジベースのソースとして使っても必ず成功するとは限りません。サイトによっては厳しいスクレイピング対策があったり(またはログイン、認証などが必要だったり)するため、この方法では正確な内容を取得できない場合があります。作成後は、まず検索テストを行うことをおすすめします。

  3. 通常、サイトは sitemap を提供しています。CherryStudio のsitemapのように、通常はサイトのルートアドレス(つまり URL)の末尾に /sitemap.xml を付けると関連情報を取得できます。たとえばaaa.com/sitemap.xml

  4. サイトが sitemap を提供していない場合や URL が複雑な場合は、自分で sitemap の xml ファイルを組み合わせて使用することもできます。ファイルは現時点では、公開ネットワークから直接アクセスできる直リンク形式で入力する必要があり、ローカルファイルのリンクは認識されません。

  1. AI に sitemap ファイルを生成させたり、AI に sitemap の HTML 生成ツールを書かせたりできます。

  2. 直リンクは oss の直リンクやクラウドストレージの直リンクなどを使って生成できます。既存のツールがない場合はocoolAI公式サイトにアクセスし、ログイン後、サイト上部の無料ファイルアップロードツールを使って直リンクを生成できます。

ナレッジベースを検索する

ファイルなどの資料のベクトル化が完了したら、検索できます。

  1. ページ下部の「ナレッジベースを検索」ボタンをクリックします。

  2. 検索内容を入力します。

  3. 検索結果が表示されます。

  4. さらに、その結果の一致スコアも表示されます。

対話でナレッジベースを引用して返信を生成する

  1. 新しいトピックを作成し、会話ツールバーで「ナレッジベース」をクリックすると、作成済みのナレッジベース一覧が展開されるので、引用したいナレッジベースを選択します。

  2. 質問を入力して送信すると、モデルは検索結果をもとに生成した回答を返します。

  3. 同時に、引用したデータソースが回答の下に表示され、元ファイルをすばやく確認できます。

最終更新

役に立ちましたか?