對話介面

對話界面係 Cherry Studio 最常用嘅頁面,但佢嘅結構包含兩個層次:助手 → 話題。理解呢個結構有助於更高效咁使用各類對話功能。

推薦先睇 概念入門 了解助手 / 智能體 / 技能等相關概念。

助手同話題嘅關係

簡單類比:

  • 助手 = 一個角色(例如"產品文檔助理"、"代碼 reviewer")

  • 話題 = 同該角色嘅一段對話(例如禮拜一討論"重構方案"、禮拜二討論"bug 報告")

即係話:一個助手底下可建立多個話題,所有話題共用該助手嘅人設同參數(提示詞、模型、溫度等),唔使每次重新設定 AI 嘅角色同風格。

助手

助手為 AI 設定固定角色 —— 由系統提示詞 + 模型參數預設組成。

  • 系統預設助手:通用助手,未設特別提示詞,可直接使用

  • 更專項嘅助手:喺 助手廣場 瀏覽現成預設,或者自己建立

話題

每個助手底下可建立多個話題(即係多段獨立對話)。話題之間互相獨立,但共用所屬助手嘅設定。

適用場景示例:

  • 同一個"代碼助手"底下分別開"項目 A 重構"、"項目 B bug"兩個話題,獨立管理

  • 同一個"翻譯助手"底下開多個話題,分別處理唔同文章

對話框內按鈕

Cherry Studio 對話框工具欄(v1.9.9 實拍)

Cherry Studio 嘅對話框工具欄入面嘅工具具體順序可以由你長按拖拽自行調整。

左側工具

圖示
名稱
作用

新話題

喺而家嘅助手入面建立一個新話題

上傳附件

上傳圖片或者文件;圖片需要模型支援視覺能力;文件會自動解析做上下文

網絡搜尋

將網頁搜尋結果作為上下文返畀模型,需先喺 聯網模式 中配置

知識庫

將一個已建好嘅 知識庫 作為上下文

MCP 伺服器

啟用 MCP 工具供模型調用

提及模型

臨時切換之後嘅回覆模型,保留上下文

快捷短語

調用預設模板,詳見 快捷短語

清空消息

刪除該話題下所有消息(不可恢復)

展開 / 收起

令輸入框變得更大或者恢復,方便輸入長文

清除上下文

保留消息但令模型"忘記"之前嘅對話(截斷 token 上下文)

右下角工具

圖示
名稱
作用

翻譯

將輸入框內容直接翻譯做目標語言(喺 設定 → 預設模型 中配置預設翻譯模型)

發送

發送消息(預設 Enter;可喺 快捷鍵 中改)

只喺符合條件時顯示嘅工具

以下工具唔喺預設工具欄中,只會喺所選模型 / 助手支援時先出現

圖示
名稱
作用

生成圖片

所選對話模型支援生圖時出現。專門嘅生圖模型請去 繪圖

思考模式

所選模型支援深度推理時出現(例如 GPT-5 系列、Claude Opus4.8、Qwen-3.7-plus等)

網頁上下文

所選模型支援原生 URL 輸入時出現

斜線命令

喺 Cherry Agent 會話中出現,提供 /clear/exit 等內置命令

透過鍵盤觸發嘅能力

除咗撳按鈕,仲可以直接喺輸入框入面撳特定鍵叫出對應面板:

  • @:叫出模型選擇器(同上面"提及模型"按鈕等價)

  • /:叫出斜線命令面板,可快速插入快捷短語、翻譯、工具調用等

對話框右下角:Token 計數

輸入框右下角仲會顯示 預估 Token 數,包含四個數值:當前上下文數 / 最大上下文數(∞ 表示無限)/ 當前上下文 Token 數 / 預估 Token 數

呢度只係預估值,唔同模型嘅 Tokenizer 唔同,實際收費以模型供應商為準。

對話設定

模型設定

模型設定同助手設定入面嘅 模型設定 參數同步,詳見 助手設定

喺對話設定入面,只有該模型設定會作用於當前助手,其餘設定會作用於全局。例如:設置消息樣式為氣泡之後,喺任何助手嘅任何話題下都係氣泡樣式。

消息設定

消息分隔線:

使用分隔線將消息正文同操作欄隔開。

使用襯線字體

字體樣式切換,而家你亦可以透過 自定義 css 嚟更換字體。

代碼顯示行號

模型輸出代碼片段時顯示代碼塊行號。

代碼塊可摺疊

打開後,當代碼片段入面嘅代碼較長時,會自動摺疊代碼塊。、

代碼塊可換行

打開後,當代碼片段入面單行代碼較長時(超出視窗),會自動換行。

思考內容自動摺疊

打開後,支援思考嘅模型喺思考完成後會自動摺疊思考過程。

消息樣式

可切對話界面換為氣泡樣式或者列表樣式。

代碼風格

可切換代碼片段嘅顯示風格。

數學公式引擎

  • KaTeX 渲染速度更快,因為佢係專門為性能優化設計嘅;

  • MathJax 渲染較慢,但功能更全面,支援更多數學符號同命令。

消息字體大小

調整對話界面字體嘅大小。

輸入設定

顯示預估 Token 數

喺輸入框顯示輸入文本預估消耗嘅 Token 數(唔係實際上下文消耗嘅 Token,只供參考)。

長文本貼成文件

當由其他地方複製長段文本貼到輸入框時會自動顯示為文件樣式,減少之後輸入內容時嘅干擾。

Markdown 渲染輸入消息

關閉時只渲染模型回覆嘅消息,唔渲染發送嘅消息。

快速敲擊3次空格翻譯

喺對話界面輸入框輸入消息後,連撳三次空格可以將輸入內容翻譯做英文。

目標語言

設定輸入框翻譯按鈕以及快速敲擊3次空格翻譯嘅目標語言。

助手設定

喺助手界面選擇需要設定嘅助手名稱→喺右鍵選單中揀相應設定

編輯助手

助手設定作用於該助手底下所有話題。

提示詞設定

名稱

可自定義方便辨識嘅助手名稱。

提示詞

即係 prompt,可以參照智能體頁面嘅提示詞寫法嚟編輯內容。

模型設定

預設模型

可以為該助手固定一個預設模型,從智能體頁面添加時或者複製助手時,初始模型會係該模型。唔設定呢一項嘅話,初始模型就係全局初始模型(即 預設助手模型 )。

助手嘅預設模型有兩種,一係 全局預設對話模型 ,另一係助手預設模型;助手預設模型嘅優先級高過全局預設對話模型。當唔設定助手預設模型時,助手預設模型=全局預設對話模型。

自動重置模型

打開時 - 當喺呢個話題下使用過程中切換其他模型使用時,再次新建話題會將新話題重置為助手嘅預設模型。當呢項關閉時,新建話題嘅模型會跟隨上一話題所使用嘅模型。

例如助手嘅預設模型係 gpt-3.5-turbo,我喺呢個助手底下建立話題1,喺話題1嘅對話過程中切換咗 gpt-4o 使用,此時:

如果開咗自動重置:新建話題2時,話題2預設選擇嘅模型係 gpt-3.5-turbo;

如果未開自動重置:新建話題2時,話題2預設選擇嘅模型係 gpt-4o。

溫度 (Temperature)

溫度參數控制模型生成文本嘅隨機性同創造性程度(預設值為0.7)。具體表現為:

  • 低溫度值(0-0.3):

    • 輸出更確定、更專注

    • 適合代碼生成、數據分析等需要準確性嘅場景

    • 傾向於選擇最可能嘅詞彙輸出

  • 中等溫度值(0.4-0.7):

    • 平衡咗創造性同連貫性

    • 適合日常對話、一般性寫作

    • 推薦用於聊天機械人對話(0.5左右)

  • 高溫度值(0.8-1.0):

    • 產生更具創造性同多樣性嘅輸出

    • 適合創意寫作、腦力激盪等場景

    • 但可能降低文本嘅連貫性

Top P (核採樣)

預設值為 1,值越細,AI 生成嘅內容越單調,亦越容易理解;值越大,AI 回覆嘅詞彙範圍越大,越多樣化。

核採樣透過控制詞彙選擇嘅概率閾值嚟影響輸出:

  • 較細值(0.1-0.3):

    • 只考慮最高概率嘅詞彙

    • 輸出更保守、更可控

    • 適合代碼註釋、技術文檔等場景

  • 中等值(0.4-0.6):

    • 平衡詞彙多樣性同準確性

    • 適合一般對話同寫作任務

  • 較大值(0.7-1.0):

    • 考慮更廣泛嘅詞彙選擇

    • 產生更豐富多樣嘅內容

    • 適合創意寫作等需要多樣化表達嘅場景

  • 呢兩個參數可以獨立使用或者組合使用

  • 根據具體任務類型揀合適嘅參數值

  • 建議透過實驗搵到最適合特定應用場景嘅參數組合

  • 以上內容只供參考同了解概念,所給參數範圍未必適合所有模型,具體可參考模型相關文檔給出嘅參數建議。

上下文數量 (Context Window)

要保留喺上下文入面嘅消息數量,數值越大,上下文越長,消耗嘅 token 越多:

  • 5-10:適合普通對話

  • >10:需要更長記憶嘅複雜任務(例如:按照寫作提綱分步生成長文嘅任務,需要確保生成嘅上下文邏輯連貫)

  • 注意:消息數越多,token 消耗越大

開啟消息長度限制 (MaxToken)

單次回覆最大 Token 數喺大型語言模型入面,max token(最大令牌數)係一個關鍵參數,佢直接影響模型生成回覆嘅質量同長度。

例如:喺 CherryStudio 入面填好 key 後測試模型係咪連通時,只需要知道模型有冇正確返回消息而唔需要特定內容,呢種情況下設定 MaxToken 為 1 就得。

多數模型嘅 MaxToken 上限為 32k Tokens,當然亦有 64k,甚至更多,具體需要去對應介紹頁面睇。

具體設置幾多取決於自己嘅需要,當然亦可以參考以下建議。

流式輸出(Stream)

流式輸出係一種數據處理方式,佢容許數據以連續嘅流形式進行傳輸同處理,而唔係一次過發送所有數據。呢種方式令數據可以喺生成後即刻被處理同輸出,大大提高咗實時性同效率。

喺 CherryStudio 客戶端等類似環境下簡單嚟講就係打字機效果。

關閉後(非流):模型生成完信息後成段一次性輸出(諗像一下微信收到消息嘅感覺);

打開時:逐字輸出,可以理解為大模型每生成一個字就即刻發送畀你,直到全部發送完。

如果某啲特殊模型唔支援流式輸出要將呢個開關關閉,例如剛開始只支援非流嘅 o1-mini 等。

自定義參數

喺請求體(body)入面加入額外請求參數,例如 presence_penalty 等字段,一般人一般情況下用唔著。

上述 top-p、maxtokens、stream 等參數就係呢啲參數之一。

填法:參數名稱—參數類型(文本、數字等)—值,參考文檔:撳前往

各個模型供應商多多少少都有自己獨有嘅參數,需要去供應商嘅文檔入面搵使用方法

  • 自定義參數優先級高於內置參數。即係自定義參數如果同內置參數重複,自定義參數會覆蓋內置參數。

例如:自定義參數中設定 modelgpt-4o 後,喺對話中無論選邊個模型都用嘅係 gpt-4o 模型。

  • 使用 參數名稱:undefined 嘅設定可排除參數。


💡 獲取幫助同提交反饋

如果您喺配置或使用過程中遇到任何疑問、Bug 或有功能改進建議,請參考 反饋同建議 入面提供嘅官方渠道。

最後更新

呢個有冇幫助?