Интерфейс диалога

Ассистенты и темы

Ассистент

Ассистент Это некоторые персональные настройки для выбранной модели, такие как предустановки подсказок и параметров, чтобы с помощью этих настроек выбранная модель лучше соответствовала ожидаемой работе.

Системный ассистент по умолчанию Предустановлены довольно универсальные параметры (без подсказки); вы можете использовать их напрямую или перейти на страницу Агентов и найти нужные вам предустановки для использования.

Тема

Ассистент — это Тема надмножество; под одним ассистентом можно создать несколько тем (то есть диалогов), и все Тема совместно используют Ассистент параметры и предустановленные слова (prompt) и другие настройки модели.

Кнопки в окне диалога

Новая тема Создать новую тему в текущем ассистенте.

Загрузка изображений или документов Для загрузки изображений требуется поддержка со стороны модели; загруженные документы автоматически разбираются в текст и предоставляются модели как контекст.

Поиск в сети Необходимо настроить информацию, связанную с веб-поиском, в настройках; результаты поиска возвращаются большой модели как контекст, подробности см. Сетевой режим.

База знаний Включите базу знаний, подробности см. руководство по базе знаний.

Сервер MCP Включите функцию сервера MCP, подробности см. Руководство по использованию MCP.

Генерация изображений Только выбранная диалоговая модель поддерживает генерацию изображений, и тогда это будет отображаться. (Для недиалоговых моделей генерации изображений перейдите в Рисование)

Выбрать модель Для следующего диалога переключиться на указанную модель, сохранив контекст.

Быстрые фразы Сначала необходимо предустановить часто используемые фразы в настройках; здесь их можно вызывать и вводить напрямую, поддерживаются переменные.

Очистить сообщения Удалить всё содержимое в этой теме.

Развернуть Сделать окно диалога больше для ввода длинного текста.

Очистить контекст Без удаления содержимого обрезать доступный модели контекст, то есть модель «забудет» предыдущий диалог.

Оценка количества токенов Показать оценочное число токенов; четыре показателя соответственно: текущее число контекста и максимальное число контекста (∞ означает бесконечный контекст), число символов в текущем поле ввода и Оценка количества токенов .

Эта функция используется только для оценки количества токенов; фактическое число токенов различается у каждой модели. Ориентируйтесь на данные поставщика модели.

Перевести Перевести содержимое текущего поля ввода на английский.

Настройки диалога

Настройки модели

В настройках модели и ассистента Настройки модели параметры синхронизируются, подробности см. Настройки ассистента.

В настройках диалога только эти настройки модели применяются к текущему ассистенту, остальные действуют глобально. Например: если установить стиль сообщений «пузырьки», то во всех темах любого ассистента будет стиль «пузырьков».

Настройки сообщений

Разделительная линия сообщений:

Использовать разделительную линию, чтобы отделить основной текст сообщения от панели действий.

Использовать шрифт с засечками:

Переключение стиля шрифта; теперь вы также можете через пользовательский CSS заменить шрифт.

Показывать номера строк в коде:

Показывать номера строк в блоках кода при выводе фрагментов кода моделью.

Сворачиваемые блоки кода:

После включения, когда фрагмент кода длинный, блок кода будет автоматически сворачиваться.

Перенос строк в блоках кода:

После включения, когда одиночная строка кода во фрагменте слишком длинная (выходит за окно), будет выполняться автоматический перенос.

Автосворачивание рассуждений:

После включения модели с поддержкой рассуждений будут автоматически сворачивать процесс рассуждения после его завершения.

Стиль сообщений:

Можно переключить интерфейс диалога на стиль пузырьков или список.

Стиль кода:

Можно переключить стиль отображения фрагментов кода.

Движок математических формул:

  • KaTeX рендерит быстрее, поскольку специально оптимизирован под производительность;

  • MathJax рендерит медленнее, но функционально более полный, поддерживает больше математических символов и команд.

Размер шрифта сообщений:

Настроить размер шрифта в интерфейсе диалога.

Настройки ввода

Показывать оценочное число токенов:

Показывать в поле ввода оценочное количество токенов, которое израсходует вводимый текст (не фактическое потребление контекста, только для справки).

Вставлять длинный текст как файл:

При копировании длинных фрагментов текста из других мест в поле ввода он будет автоматически отображаться в виде файла, чтобы уменьшить помехи при дальнейшем вводе.

Рендерить входящие сообщения в Markdown:

При выключении рендерятся только ответы модели, а отправленные сообщения не рендерятся.

Тройное быстрое нажатие пробела для перевода:

После ввода сообщения в поле ввода диалога три быстрых нажатия пробела переведут введённое содержимое на английский.

Целевой язык:

Настроить целевой язык для кнопки перевода в поле ввода и функции перевода тройным нажатием пробела.

Настройки ассистента

На интерфейсе ассистента выберите нужные для настройкиимя ассистента→ вконтекстном менювыберите соответствующие настройки

Редактировать ассистента

Настройки ассистента применяются ко всем темам этого ассистента.

Настройки подсказок

Название:

Можно задать удобное для распознавания имя ассистента.

Подсказка:

То есть prompt; можно редактировать, ориентируясь на стиль подсказок на странице Агентов.

Настройки модели

Модель по умолчанию:

Можно закрепить за этим ассистентом модель по умолчанию; при добавлении со страницы Агентов или копировании ассистента начальная модель будет этой моделью. Если не задано, начальная модель — глобальная начальная модель (то есть Модель помощника по умолчанию ).

Существует два типа модели по умолчанию для ассистента: один — глобальная модель диалога по умолчанию и другой — модель по умолчанию ассистента; приоритет модели по умолчанию ассистента выше, чем у глобальной диалоговой модели по умолчанию. Если модель по умолчанию ассистента не задана, то модель по умолчанию ассистента = глобальная диалоговая модель по умолчанию.

Автоматически сбрасывать модель:

При включении — если в ходе использования в этой теме вы переключались на другие модели, то при создании новой темы модель будет сброшена на модель по умолчанию ассистента. При выключении модель новой темы будет следовать модели, использованной в предыдущей теме.

Если модель по умолчанию ассистента — gpt-3.5-turbo, и я создаю тему 1 под этим ассистентом, а в ходе диалога в теме 1 переключаюсь на gpt-4o, то:

Если авто-сброс включен: при создании темы 2 модель по умолчанию для темы 2 — gpt-3.5-turbo;

Если авто-сброс выключен: при создании темы 2 модель по умолчанию для темы 2 — gpt-4o.

Температура (Temperature) :

Параметр температуры управляет случайностью и степенью креативности генерируемого моделью текста (значение по умолчанию — 0.7). Конкретно проявляется так:

  • Низкие значения (0–0.3):

    • Более определённый и сфокусированный вывод

    • Подходит для генерации кода, анализа данных и других задач, требующих точности

    • Склонность выбирать наиболее вероятные слова

  • Средние значения (0.4–0.7):

    • Баланс креативности и связности

    • Подходит для повседневных диалогов и общего письма

    • Рекомендуется для диалогов чат-бота (около 0.5)

  • Высокие значения (0.8–1.0):

    • Более креативный и разнообразный вывод

    • Подходит для креативного письма, мозгового штурма и т. п.

    • Но может снизиться связность текста

Top P (ядерная выборка):

Значение по умолчанию — 1; чем меньше значение, тем однообразнее и проще для понимания вывод ИИ; чем больше значение, тем шире диапазон слов и разнообразнее ответы ИИ.

Ядерная выборка влияет на вывод, контролируя порог вероятности выбора слов:

  • Малые значения (0.1–0.3):

    • Учитываются только слова с наивысшей вероятностью

    • Вывод более консервативный и контролируемый

    • Подходит для комментариев к коду, технической документации и т. п.

  • Средние значения (0.4–0.6):

    • Баланс разнообразия и точности лексики

    • Подходит для обычных диалогов и задач письма

  • Большие значения (0.7–1.0):

    • Учитывается более широкий выбор слов

    • Более богатое и разнообразное содержание

    • Подходит для креативного письма и сцен, требующих разнообразного выражения

  • Эти два параметра можно использовать независимо или в сочетании

  • Выбирайте подходящие значения в зависимости от типа задачи

  • Рекомендуется экспериментально подобрать наилучшее сочетание параметров для конкретного сценария

  • Вышеизложенное — только для справки и понимания концепций; предложенные диапазоны параметров не обязательно подходят для всех моделей. Конкретику смотрите в документации соответствующих моделей.

Количество контекста (Context Window)

Количество сообщений, сохраняемых в контексте; чем больше значение, тем длиннее контекст и больше расход токенов:

  • 5–10: подходит для обычного диалога

  • >10: для сложных задач, требующих более долгой памяти (например, пошаговая генерация длинного текста по плану — нужно сохранять логическую связность контекста)

  • Внимание: чем больше сообщений, тем выше расход токенов

Включить ограничение длины сообщения (MaxToken)

Максимальное число токенов за один ответ. В больших языковых моделях max token (максимальное число токенов) — ключевой параметр, непосредственно влияющий на качество и длину генерируемого ответа.

Например: в CherryStudio после заполнения ключа при тесте связи с моделью нужно лишь понять, верно ли модель возвращает сообщение, без конкретного содержания; в таком случае MaxToken можно установить в 1.

У большинства моделей верхний предел MaxToken — 32k токенов, есть и 64k и даже больше. Смотрите на соответствующей странице описания.

Конкретная настройка зависит от ваших потребностей; также можно ориентироваться на следующие рекомендации.

Потоковый вывод (Stream)

Потоковый вывод — это способ обработки данных, позволяющий передавать и обрабатывать данные в виде непрерывного потока, а не отправлять всё сразу. Такой подход позволяет обрабатывать и выводить данные сразу после генерации, что значительно повышает реалтайм и эффективность.

В клиенте CherryStudio и подобных средах это, говоря просто, эффект пишущей машинки.

После выключения (непотоковый): модель выдаёт весь сгенерированный блок разом (как будто вы получаете сообщение в мессенджере).

При включении: посимвольный вывод — можно понимать так, что модель отправляет каждый сгенерированный символ сразу, пока не отправит всё.

Если некоторые специальные модели не поддерживают потоковый вывод, нужно выключить этот переключатель, напримервначалеподдерживали только непотоковый режим, такие как o1-mini и др.

Пользовательские параметры

Добавьте дополнительные параметры запроса в тело (body), такие как presence_penalty и другие поля; большинству людей обычно это не требуется.

Упомянутые выше параметры top-p, maxtokens, stream и т. п. — это часть этих параметров.

Формат: имя параметра — тип параметра (текст, число и т. д.) — значение. Справочная документация:Нажмите, чтобы перейти

У каждого поставщика моделей есть свои уникальные параметры в той или иной степени; ищите способы использования в документации поставщика.

  • Пользовательские параметры имеют более высокий приоритет, чем встроенные. То есть при дублировании пользовательский параметр переопределяет встроенный.

Например: в пользовательских параметрах установить model в gpt-4o после чего в диалоге, независимо от выбранной модели, будет использоваться gpt-4o модель.

  • Использовать Имя параметра: undefined в настройках, чтобы исключить параметр.

Последнее обновление

Это было полезно?