每天一个大语言模型知识：温度（Temperature）参数详解

什么是温度（Temperature）？

在大型语言模型生成文本时，“温度”（temperature）是一个用来控制输出文本随机性和创造性的非常重要的参数。

简单来说，它决定了模型回答的“风格”：是更可预测、严谨，还是更随机、富有创意。

语言模型在生成文本时，会为可能的下一词计算一个“概率”。

比如你在输入“The sky is very…”，模型可能预测：

这些概率是模型根据训练数据和上下文推测出来的，表示“在这个情况下，哪个词最有可能出现”。

而温度则会影响模型如何处理这些概率：

中等温度时：那么模型会兼顾严谨和创意，使输出既有故事感，又不过于夸张。

低温度时：模型会让高概率的词（比如“clear”）更容易被选中，低概率的词几乎没机会被选中，所以低温度更适合需要准确、严谨的回答的场景，例如写代码时。

高温度时：模型会让概率分布更“平坦”，低概率的词（比如“bright”）也有机会被选中，这便增加了输出内容的创意。所以高温度适合需要创意、发散性的场景，比如在写故事或小说时。

有朋友可能要问，那平时我们使用CHATGPT时，它的默认温度是多少又是如何调整温度的呢？

网上流传有说CHATGPT的默认温度是0.7,0.8，但是我从接口文档中看到默认是1，在实际使用中，我们可以通过提示词来调整温度，比如在提示词中加入：严格事实、一步步推理来模拟低温度。

理解温度参数后，你可以根据不同任务灵活选择合适的设置。例如在专业问答、编程辅助等场景推荐使用较低温度以确保准确性；在创意写作、头脑风暴等场景则适合提高温度以激发更多灵感。

掌握这个参数，能让你更好地控制大语言模型的输出风格。

关于大语言模型的温度，你学会了吗？