Токен — условная единица текста для модели. В среднем 1 токен это примерно 2 символа кириллицей или 4 символа латиницей.
Глубина чата — сколько последних пар "вопрос-ответ" брать в контекст при следующем запросе. Больше глубина = лучше память по диалогу, но выше расход токенов.
Температура — уровень вариативности ответа. Низкая температура дает более предсказуемый и "строгий" ответ, высокая — более креативный и разнообразный.
Зерно — число для воспроизводимости генерации. При одинаковом промпте и одинаковом зерне результат будет максимально похожим; изменили зерно — получили новую вариацию.
Переменные в шаблонах пишутся в квадратных скобках. Замените текст внутри скобок на свои данные перед отправкой запроса.