什么是温度(Temperature)?
在大型语言模型生成文本时,“温度”(temperature)是一个用来控制输出文本随机性和创造性的非常重要的参数。
简单来说,它决定了模型回答的“风格”:是更可预测、严谨,还是更随机、富有创意。

语言模型生成文本的概率机制
语言模型在生成文本时,会为可能的下一词计算一个“概率”。
比如你在输入“The sky is very…”,模型可能预测:
- “clear”:63.78% 概率
- “dark”:15.92% 概率
- “bright”:12.79% 概率
- “blue”:5.79% 概率
这些概率是模型根据训练数据和上下文推测出来的,表示“在这个情况下,哪个词最有可能出现”。
不同温度下的输出表现
而温度则会影响模型如何处理这些概率:
中等温度时:那么模型会兼顾严谨和创意,使输出既有故事感,又不过于夸张。
低温度时:模型会让高概率的词(比如“clear”)更容易被选中,低概率的词几乎没机会被选中,所以低温度更适合需要准确、严谨的回答的场景,例如写代码时。
高温度时:模型会让概率分布更“平坦”,低概率的词(比如“bright”)也有机会被选中,这便增加了输出内容的创意。所以高温度适合需要创意、发散性的场景,比如在写故事或小说时。
ChatGPT的默认温度及调整方法
有朋友可能要问,那平时我们使用CHATGPT时,它的默认温度是多少又是如何调整温度的呢?
网上流传有说CHATGPT的默认温度是0.7,0.8,但是我从接口文档中看到默认是1,在实际使用中,我们可以通过提示词来调整温度,比如在提示词中加入:严格事实、一步步推理来模拟低温度。
温度参数的实际应用建议
理解温度参数后,你可以根据不同任务灵活选择合适的设置。例如在专业问答、编程辅助等场景推荐使用较低温度以确保准确性;在创意写作、头脑风暴等场景则适合提高温度以激发更多灵感。
掌握这个参数,能让你更好地控制大语言模型的输出风格。
本期小结
关于大语言模型的温度,你学会了吗?


