チャット画面
アシスタントとトピック
アシスタント
アシスタント 選択したモデルに対して、プロンプトのプリセットやパラメータのプリセットなど、いくつかの個別設定を行ってモデルを使用することで、選択したモデルをより期待する作業に合うようにするものです。
システム既定のアシスタント 比較的一般的なパラメータ(プロンプトなし)があらかじめ設定されています。直接使用するか、 エージェントページ で必要なプリセットを探して使用できます。
トピック
アシスタント は トピック の上位集合で、1つのアシスタントの下に複数のトピック(つまり会話)を作成できます。すべての トピック で共通 アシスタント のパラメータ設定やプリセット語(prompt)などのモデル設定を使用します。


会話ボックス内のボタン

新しいトピック 現在のアシスタント内に新しいトピックを作成します。
画像または文書をアップロード 画像のアップロードにはモデルの対応が必要です。文書をアップロードすると自動的にテキストとして解析され、文脈としてモデルに提供されます。
ネット検索 設定でネット検索に関する情報を構成する必要があります。検索結果は文脈として大規模モデルに返されます。詳細は オンラインモードを提供する。
ナレッジベース ナレッジベースを有効化、詳細は ナレッジベースチュートリアルを提供する。
MCPサーバー MCPサーバー機能を有効化、詳細は MCP使用チュートリアルを提供する。
画像を生成 選択した 会話モデル が画像生成に対応している場合にのみ表示されます。(非会話型の画像生成モデルは 描画など)
モデルを選択 以降の会話に対して、指定したモデルに切り替え、文脈を保持します。
クイックフレーズ まず設定でよく使うフレーズをプリセットしておく必要があります。ここで呼び出してそのまま入力でき、変数もサポートします。
メッセージをクリア このトピック内のすべての内容を削除します。
展開 会話ボックスを大きくして、長文を入力しやすくします。
文脈をクリア 内容を削除せずに、モデルが取得できる文脈を切り詰めます。つまり、モデルは以前の会話内容を「忘れる」ことになります。
推定トークン数 推定トークン数を表示します。4つのデータはそれぞれ 現在の文脈数 、 最大文脈数 (∞ は無制限の文脈を表します)、 現在の入力欄内のメッセージ文字数 、 推定トークン数 を提供する。
この機能はトークン数の推定にのみ使用されます。実際のトークン数はモデルごとに異なるため、モデル提供元のデータを基準にしてください。
翻訳 現在の入力欄の内容を英語に翻訳します。
会話設定

モデル設定
モデル設定とアシスタント設定内の モデル設定 パラメータを同期します。詳細は アシスタント設定を提供する。
会話設定では、このモデル設定のみが現在のアシスタントに適用され、他の設定はグローバルに適用されます。例:メッセージスタイルを吹き出しに設定すると、どのアシスタントのどのトピックでも吹き出しスタイルになります。
メッセージ設定
メッセージ区切り線:
メッセージ区切り線:区切り線でメッセージ本文と操作欄を分けます。


セリフ体を使用に由来する:
セリフ体を使用に由来する:フォントスタイルを切り替えます。現在は カスタムCSS でフォントを変更することもできます。
コード表示行番号に由来する:
コード表示行番号に由来する:モデルがコードスニペットを出力する際に、コードブロックの行番号を表示します。


コードブロックを折りたたみ可能に由来する:
コードブロックを折りたたみ可能に由来する:有効にすると、コードスニペットのコードが長い場合に自動的にコードブロックを折りたたみます。
コードブロックを改行可能に由来する:
コードブロックを改行可能に由来する:有効にすると、コードスニペット内の1行のコードが長い場合(ウィンドウを超える場合)、自動的に改行します。
思考内容の自動折りたたみに由来する:
思考内容の自動折りたたみに由来する:有効にすると、思考をサポートするモデルは思考完了後に思考プロセスを自動的に折りたたみます。
メッセージスタイルに由来する:
メッセージスタイルに由来する:会話画面を吹き出しスタイルまたはリストスタイルに切り替えられます。
コードスタイルに由来する:
コードスタイルに由来する:コードスニペットの表示スタイルを切り替えられます。
数式エンジンに由来する:
数式エンジンに由来する:KaTeX は性能最適化のために特別に設計されているため、レンダリング速度がより速いです。
MathJax はレンダリングが遅いですが、機能がより充実しており、より多くの数式記号やコマンドをサポートします。
メッセージのフォントサイズに由来する:
メッセージのフォントサイズに由来する:会話画面のフォントサイズを調整します。
入力設定
推定トークン数を表示に由来する:
推定トークン数を表示に由来する:入力欄に、入力テキストの推定消費トークン数を表示します(実際の文脈消費トークンではなく、参考値です)。
長文をファイルとして貼り付けに由来する:
長文をファイルとして貼り付けに由来する:他の場所から長文をコピーして入力欄に貼り付けた場合、自動的にファイルのスタイルで表示され、その後の入力内容への干渉を減らします。
Markdownで入力メッセージをレンダリングに由来する:
Markdownで入力メッセージをレンダリングに由来する:オフにすると、モデルの返信メッセージのみをレンダリングし、送信したメッセージはレンダリングしません。


スペースを3回素早く押して翻訳に由来する:
スペースを3回素早く押して翻訳に由来する:会話画面の入力欄にメッセージを入力した後、スペースを3回続けて押すと、入力内容を英語に翻訳できます。
注意:この操作は元の文章を上書きします。
対象言語に由来する:
対象言語に由来する:入力欄の翻訳ボタンおよびスペース3回素早く押す翻訳の対象言語を設定します。
アシスタント設定
アシスタント画面で設定したいアシスタント名→右クリックメニューで対応する設定を選択
アシスタントを編集
アシスタント設定は、そのアシスタント下のすべてのトピックに適用されます。

プロンプト設定
名称に由来する:
名称に由来する:見分けやすいアシスタント名をカスタマイズできます。
プロンプトに由来する:
プロンプトに由来する:つまり prompt で、エージェントページのプロンプトの書き方を参考にして内容を編集できます。
モデル設定
既定モデルに由来する:
既定モデルに由来する:そのアシスタントに既定モデルを固定できます。エージェントページから追加した場合やアシスタントをコピーした場合、初期モデルはこのモデルになります。これを設定しない場合、初期モデルはグローバル初期モデル(つまり デフォルトアシスタントモデル )になります。
アシスタントの既定モデルには2種類あります。1つは グローバル既定の対話モデル 、もう1つはアシスタント既定モデルです。アシスタント既定モデルの優先順位はグローバル既定会話モデルより高くなります。アシスタント既定モデルを設定しない場合、アシスタント既定モデル=グローバル既定会話モデルです。
モデルの自動リセットに由来する:
モデルの自動リセットに由来する:有効時 - そのトピックでの使用中に他のモデルへ切り替えて使用した場合、再度新しいトピックを作成すると新しいトピックはアシスタントの既定モデルにリセットされます。この項目をオフにすると、新しいトピックのモデルは前のトピックで使用したモデルに従います。
アシスタントの既定モデルがgpt-3.5-turboで、そのアシスタント下でトピック1を作成し、トピック1の会話中にgpt-4oへ切り替えて使用した場合、
自動リセットを有効にしている場合:トピック2を新規作成すると、トピック2で既定に選択されるモデルはgpt-3.5-turboです。
自動リセットを有効にしていない場合:トピック2を新規作成すると、トピック2で既定に選択されるモデルはgpt-4oです。
温度 (Temperature) に由来する:
温度 (Temperature) に由来する:温度パラメータは、モデルが生成するテキストのランダム性と創造性の程度を制御します(既定値は0.7)。具体的な挙動は以下のとおりです。
低温度値(0-0.3):
より確定的で、より集中した出力
コード生成、データ分析など正確性が必要な場面に適しています
最も可能性の高い語彙を選んで出力する傾向があります
中程度の温度値(0.4-0.7):
創造性と一貫性のバランスが取れています
日常会話、一般的な文章作成に適しています
チャットボットの会話には約0.5がおすすめです
高温度値(0.8-1.0):
より創造的で多様な出力を生成します
創作、ブレインストーミングなどの場面に適しています
ただし、テキストの一貫性が下がる可能性があります
Top P(核サンプリング)に由来する:
Top P(核サンプリング)に由来する:既定値は1です。値が小さいほど、AIが生成する内容は単調になり、理解しやすくなります。値が大きいほど、AIの返信で使われる語彙の範囲が広がり、より多様になります。
核サンプリングは、語彙選択の確率しきい値を制御することで出力に影響します。
小さい値(0.1-0.3):
最も確率の高い語彙のみを考慮
より保守的で制御しやすい出力
コードコメント、技術文書などの場面に適しています
中程度の値(0.4-0.6):
語彙の多様性と正確性のバランス
一般的な会話や文章作成タスクに適しています
大きい値(0.7-1.0):
より幅広い語彙選択を考慮
より豊かで多様な内容を生成
創作など、多様な表現が必要な場面に適しています
これら2つのパラメータは個別にも組み合わせても使用できます
具体的なタスクの種類に応じて適切なパラメータ値を選択してください
実験を通じて、特定の用途に最適なパラメータの組み合わせを見つけることをおすすめします
以上の内容は概念の参考・理解のためのものであり、示されたパラメータ範囲はすべてのモデルに適しているとは限りません。具体的にはモデル関連ドキュメントのパラメータ推奨を参照してください。
文脈数 (Context Window)
文脈数 (Context Window)文脈に保持するメッセージ数です。数値が大きいほど文脈は長くなり、消費するトークンも多くなります。
5-10:通常の会話に適しています
>10:より長い記憶が必要な複雑なタスク(例:アウトラインに従って段階的に長文を生成するタスク。生成する文脈の論理的一貫性を確保する必要があります)
注意:メッセージ数が多いほど、トークン消費も増えます
メッセージ長制限を有効化 (MaxToken)
メッセージ長制限を有効化 (MaxToken)1回の回答の最大 トークン 数。大規模言語モデルにおいて、max token(最大トークン数)は重要なパラメータで、モデルが生成する回答の品質と長さに直接影響します。
例:CherryStudioでkeyを入力した後にモデルの接続テストを行う場合、モデルが正しくメッセージを返すかどうかだけ分かればよく、特定の内容は必要ありません。この場合、MaxTokenを1に設定すれば十分です。
多くのモデルのMaxToken上限は32k Tokensですが、64kやそれ以上の場合もあります。詳細は各紹介ページをご確認ください。
どれだけ設定するかは自身の必要に応じて決めますが、以下の提案も参考にできます。
おすすめ:
通常チャット:500-800
短文生成:800-2000
コード生成:2000-3600
長文生成:4000以上(モデル自体の対応が必要)
一般的に、モデルが生成する回答は MaxToken の範囲内に制限されますが、途中で切れる(例:長いコードを書くとき)や表現が不完全になるなどの状況も起こりえます。特殊な場合は実際の状況に応じて柔軟に調整する必要があります。
ストリーミング出力(Stream)
ストリーミング出力(Stream)ストリーミング出力はデータ処理の一種で、すべてのデータを一括送信するのではなく、連続したストリームとしてデータを送受信・処理できます。この方式により、データは生成後すぐに処理・出力でき、リアルタイム性と効率が大幅に向上します。
CherryStudioクライアントなどの類似環境では、簡単に言えばタイプライター効果です。
オフ時(非ストリーム):モデルが情報を生成し終えた後、まとまって一度に出力されます(WeChatでメッセージを受け取る感じを想像してください)。
オン時:1文字ずつ出力され、大規模モデルが1文字生成するたびにすぐ送信してくると理解できます。すべて送信されるまで続きます。
一部の特殊モデルがストリーミング出力をサポートしない場合は、このスイッチをオフにする必要があります。たとえば最初は非ストリームのみ対応の o1-mini など。
カスタムパラメータ
カスタムパラメータリクエストボディ(body)に追加のリクエストパラメータを入れます。たとえば presence_penalty などのフィールドで、通常は一般の人が使うことはあまりありません。
上記の top-p、maxtokens、stream などのパラメータは、そのうちの一部です。
書き方:パラメータ名—パラメータ種類(テキスト、数値など)—値。参考ドキュメント:前往する
各モデル提供元には、それぞれ独自のパラメータが多かれ少なかれあります。使い方は提供元のドキュメントで確認する必要があります
カスタムパラメータは内蔵パラメータより優先度が高いです。つまり、カスタムパラメータが内蔵パラメータと重複する場合、カスタムパラメータが内蔵パラメータを上書きします。
例:カスタムパラメータで
modelにgpt-4oを設定した後は、会話でどのモデルを選んでもgpt-4oモデルが使用されます。
使用 パラメータ名:undefined の設定でパラメータを除外できます。
最終更新
役に立ちましたか?