對話界面

助手同話題

助手

助手 係對所揀模型做一啲個人化設定嚟使用模型,例如提示詞預設同參數預設等,透過呢啲設定令所揀模型更加符合你預期嘅工作。

系統預設助手 預設咗一個比較通用嘅參數(冇提示詞),你可以直接使用或者去 智能體頁面 搵你需要嘅預設嚟用。

話題

助手話題 嘅父集,單個助手下面可以建立多個話題(即對話),所有 話題 共用 助手 嘅參數設定同預設詞(prompt)等模型設定。

對話框內按鈕

新話題 喺而家呢個助手入面建立一個新話題。

上傳圖片或文件 上傳相片需要模型支援,上傳文件會自動解析做文字作為上下文提供俾模型。

網絡搜索 需要喺設定入面配置網絡搜索相關資訊,搜索結果會作為上下文返回俾大模型,詳見 聯網模式

知識庫 開啟知識庫,詳見 知識庫教學

MCP 伺服器 開啟 MCP 伺服器功能,詳見 MCP 使用教學

生成圖片 只有揀選嘅 對話模型 支持生圖先會顯示。(非對話生圖模型請前往 繪圖

選擇模型 對於接落嚟嘅對話,切換去指定嘅模型,保留上下文。

快捷短語 需要先喺設定入面預設常用短語,喺呢度調用,直接輸入,支持變量。

清空消息 刪除該話題下所有內容。

展開 令對話框變大,以便輸入長文。

清除上下文 喺唔刪除內容嘅情況下,截斷模型能獲得嘅上下文,即係話模型會「忘記」之前嘅對話內容。

預估 Token 數 展示預估 Token 數,四個數據分別為 當前上下文數最大上下文數 ( ∞ 表示無限上下文)、 當前輸入框內消息字數預估 Token 數

此功能只用嚟預估 Token 數,實際 Token 數每個模型都唔一樣,請以模型供應商嘅數據為準。

翻譯 將當前輸入框內內容翻譯成英文。

對話設定

模型設定

模型設定同助手設定當中嘅 模型設定 參數同步,詳見 助手設定

喺對話設定入面,只有該模型設定作用於當前助手,其餘設定作用於全局。例如:將消息樣式設為氣泡後喺任何助手嘅任何話題下都係氣泡樣式。

消息設定

消息分割線:

用分割線將消息正文同操作欄隔開。

使用襯線字體

字體樣式切換,依家你亦可以通過 自定義css 嚟更換字體。

代碼顯示行號

模型輸出代碼片段時顯示代碼塊行號。

代碼塊可摺疊

打開後,當代碼片段中代碼較長時,會自動摺疊代碼塊。

代碼塊可換行

打開後,當代碼片段中單行代碼較長時(超出視窗),會自動換行。

思考內容自動摺疊

打開後,支持思考嘅模型喺思考完成後會自動摺疊思考過程。

消息樣式

可以將對話界面切換為氣泡樣式或列表樣式。

代碼風格

可以切換代碼片段嘅顯示風格。

數學公式引擎

  • KaTeX 呈現速度比較快,因為佢係專為效能優化而設計;

  • MathJax 呈現較慢,但功能更全面,支持更多嘅數學符號同指令。

消息字體大小

調整對話界面字體嘅大小。

輸入設定

顯示預估 Token 數

喺輸入框顯示輸入文本預估消耗嘅 Token 數(非實際上下文消耗嘅 Token,僅供參考)。

長文本黏貼為文件

當由其他地方複製長段文本黏貼到輸入框時會自動顯示為文件嘅樣式,減少後續輸入內容時嘅干擾。

Markdown 呈現輸入消息

關閉時只呈現模型回覆嘅消息,不呈現發送嘅消息。

快速敲擊3次空格翻譯

喺對話界面輸入框輸入消息後,連續撳三次空格可以將輸入內容翻譯成英文。

目標語言

設置輸入框翻譯按鈕以及快速敲擊3次空格翻譯嘅目標語言。

助手設定

喺助手界面揀需要設置嘅助手名稱→喺右鍵菜單中揀對應設定

編輯助手

助手設定作用於該助手下面嘅所有話題。

提示詞設定

名稱

可以自定義方便辨識嘅助手名稱。

提示詞

即 prompt,可以參考智能體頁面嘅提示詞寫法嚟編輯內容。

模型設定

預設模型

可以為該助手固定一個預設模型,喺智能體頁面添加時或複製助手時初始模型係該模型。唔設呢項初始模型就係全局初始模型(即 預設助理模型 )。

助手嘅預設模型有兩種,一種係 全局默認對話模型 ,另一種為助手預設模型;助手嘅預設模型優先級高於全局預設對話模型。當唔設助手預設模型時,助手預設模型=全局預設對話模型。

自動重置模型

打開時 - 喺該話題使用過程中切換去其他模型使用,下一次新建話題時會將新話題重置為助手嘅預設模型。當呢項關閉時,新建話題嘅模型會跟隨上一個話題所使用嘅模型。

例如助手嘅預設模型係 gpt-3.5-turbo,我喺該助手下建立話題1,喺話題1嘅對話過程中切換咗去用 gpt-4o,此時:

如果開咗自動重置:新建話題2時,話題2預設揀嘅模型係 gpt-3.5-turbo;

如果未開自動重置:新建話題2時,話題2預設揀嘅模型係 gpt-4o。

溫度 (Temperature)

溫度參數控制模型生成文本嘅隨機性同創造性程度(預設值為 0.7)。具體表現為:

  • 低溫度值(0-0.3):

    • 輸出更確定、更專注

    • 適合代碼生成、數據分析等需要準確性嘅場景

    • 傾向揀最可能嘅詞彙輸出

  • 中等溫度值(0.4-0.7):

    • 平衡咗創造性同連貫性

    • 適合日常對話、一般性寫作

    • 建議用於聊天機械人對話(大約 0.5)

  • 高溫度值(0.8-1.0):

    • 產生更具創造性同多樣性嘅輸出

    • 適合創意寫作、頭腦風暴等場景

    • 但可能減低文本嘅連貫性

Top P (核採樣)

預設值為 1,值越細,AI 生成嘅內容越單調,亦越容易理解;值越大,AI 回覆嘅詞彙範圍越大,越多樣化。

核採樣通過控制詞彙選擇嘅概率閾值嚟影響輸出:

  • 較細值(0.1-0.3):

    • 只考慮最高概率嘅詞彙

    • 輸出更保守、更可控

    • 適合代碼註釋、技術文檔等場景

  • 中等值(0.4-0.6):

    • 平衡詞彙多樣性同準確性

    • 適合一般對話同寫作任務

  • 較大值(0.7-1.0):

    • 考慮更廣泛嘅詞彙選擇

    • 產生更豐富多樣嘅內容

    • 適合創意寫作等需要多樣化表達嘅場景

  • 呢兩個參數可以獨立使用或者組合使用

  • 根據具體任務類型揀合適嘅參數值

  • 建議透過實驗搵到最啱特定應用場景嘅參數組合

  • 以上內容僅供參考同了解概念,所畀嘅參數範圍未必適合所有模型,具體可參考模型相關文檔畀出嘅參數建議。

上下文數量 (Context Window)

要保留喺上下文入面嘅消息數量,數值越大,上下文越長,消耗嘅 token 越多:

  • 5-10:適合普通對話

  • >10:需要更長記憶嘅複雜任務(例如:按寫作提綱分步生成長文嘅任務,需要確保生成嘅上下文邏輯連貫)

  • 注意:消息數越多,token 消耗越大

開啟消息長度限制 (MaxToken)

單次回答最大 Token 數,喺大語言模型中,max token(最大令牌數)係一個關鍵參數,佢直接影響模型生成回答嘅質量同長度。

例如:喺 CherryStudio 入面填好 key 後測試模型係咪連通時,只需要知道模型係咪有正確返回消息而唔需要特定內容,呢種情況下設置 MaxToken 為 1 即可。

多數模型嘅 MaxToken 上限為 32k Tokens,當然亦有 64k,甚至更多,具體需要到對應介紹頁面查看。

具體設置幾多視乎你嘅需要,當然亦可以參考以下建議。

串流輸出(Stream)

串流輸出係一種數據處理方式,佢允許數據以連續嘅流形式進行傳輸同處理,而唔係一次過發送所有數據。呢種方式令數據喺生成後可以即刻被處理同輸出,大大提升即時性同效率。

喺 CherryStudio 客戶端等類似環境講簡單啲就係打字機效果。

關閉後(非流):模型生成完資訊後整段一次過輸出(想像下微信收到消息嘅感覺);

打開時:逐字輸出,可以理解為大模型每生成一個字就即刻發送畀你,直到全部發送完。

如果某啲特殊模型唔支持串流輸出需要將該開關關閉,例如剛開始只支持非流嘅 o1-mini 等。

自定義參數

喺請求體(body)中加入額外請求參數,例如 presence_penalty 等字段,一般情況下普通用戶用唔着。

上述 top-p、maxtokens、stream 等參數就係呢啲參數其中之一。

填法:參數名稱—參數類型(文本、數字等)—值,參考文檔:撳前往

各個模型供應商或多或少都有自己獨有嘅參數,需要去供應商嘅文檔中搵使用方法

  • 自定義參數優先級高於內置參數。即係自定義參數如果同內置參數重複,則自定義參數會覆蓋內置參數。

例如:喺自定義參數中設置 modelgpt-4o 後,喺對話中無論揀邊個模型都會使用呢個 gpt-4o 模型。

  • 使用 參數名稱:undefined 嘅設置可排除參數。

Last updated

Was this helpful?