request-free-img

每天一个大语言模型知识:温度(Temperature)参数详解

什么是温度(Temperature)?

在大型语言模型生成文本时,“温度”(temperature)是一个用来控制输出文本随机性和创造性的非常重要的参数。

简单来说,它决定了模型回答的“风格”:是更可预测、严谨,还是更随机、富有创意。

语言模型生成文本的概率机制

语言模型在生成文本时,会为可能的下一词计算一个“概率”。

比如你在输入“The sky is very…”,模型可能预测:

  • “clear”:63.78% 概率
  • “dark”:15.92% 概率
  • “bright”:12.79% 概率
  • “blue”:5.79% 概率

这些概率是模型根据训练数据和上下文推测出来的,表示“在这个情况下,哪个词最有可能出现”。

不同温度下的输出表现

而温度则会影响模型如何处理这些概率:

中等温度时:那么模型会兼顾严谨和创意,使输出既有故事感,又不过于夸张。

低温度时:模型会让高概率的词(比如“clear”)更容易被选中,低概率的词几乎没机会被选中,所以低温度更适合需要准确、严谨的回答的场景,例如写代码时。

高温度时:模型会让概率分布更“平坦”,低概率的词(比如“bright”)也有机会被选中,这便增加了输出内容的创意。所以高温度适合需要创意、发散性的场景,比如在写故事或小说时。

ChatGPT的默认温度及调整方法

有朋友可能要问,那平时我们使用CHATGPT时,它的默认温度是多少又是如何调整温度的呢?

网上流传有说CHATGPT的默认温度是0.7,0.8,但是我从接口文档中看到默认是1,在实际使用中,我们可以通过提示词来调整温度,比如在提示词中加入:严格事实、一步步推理来模拟低温度。

温度参数的实际应用建议

理解温度参数后,你可以根据不同任务灵活选择合适的设置。例如在专业问答、编程辅助等场景推荐使用较低温度以确保准确性;在创意写作、头脑风暴等场景则适合提高温度以激发更多灵感。

掌握这个参数,能让你更好地控制大语言模型的输出风格。

本期小结

关于大语言模型的温度,你学会了吗?


更多问题探讨,请关注公众号:程序员角