有传说GPT4变笨了,有人解释说可能...
发布时间 :2023-12-08 16:58:55
有传说GPT4变笨了,有人解释说可能是温度设置造成的。那么大模型中的温度参数是怎么回事呢?
温度是一个超参,应该来自于模拟退火算法。
我们举一个例子说明温度的作用。假设一个人被蒙上双眼只凭一根拐杖去爬香山,他如何能爬到香山顶峰鬼见愁呢?在该人完全清醒的情况下,他只能通过拐杖试探周围地形,哪边高他就往哪边走。由于香山地形比较复杂,他大概率爬不到山顶,只能爬到一个局部最高点,除非他初始位置特别合适,该局部最高点刚好是鬼见愁。这其实就是通常所说的一种寻优方法“爬山法”。
但是如果该人喝醉了酒呢?当他酩酊大醉的情况下爬山,步履蹒跚,站立不稳,东一脚西一脚地爬行。虽然他还是想着向上走,但由于醉酒把握不住自己的行为,会有时向上,有时又向下,具有一定的随机性,但总体上他会尽可能向高的方向行走。随时间推移,该人逐渐清醒,向上的欲望越来越强烈,身体也越来越听指挥,最终很大可能会大概率爬到香山顶峰鬼见愁。这其实就是一种随机寻优方法“模拟退火算法”。
在模拟退火算法中,代替醉酒程度的量是温度。当温度非常高时相当于醉的非常厉害,行走起来一会上一会下,完全不着调,但是却可能从不正确的位置下来,转移到一个正确的道路上去。当温度非常低时,相当于没有喝酒,完全清醒,由于被蒙着双眼,只能凭借拐杖向高的方向走。这样每一步都看起来是正确的,但是最终也大概率是个平庸的结果。
再回到大模型,当温度设置很低时,基本是按照概率最大预测token,答案很可能就是一个平庸的结果。而当温度设置比较高时,如同酒后醉话一样,低概率的token也可能被生成出来,虽然有可能在胡说八道,但也有可能出现美妙的句子,如同李白斗酒诗百篇。李白的诗有没有胡说的呢?也许有,只是没有流传下来。
这样对于大模型来说,就要设置一个合适的温度参数,既要有一定的创新能力,又别太多的胡说八道,不过这一点也很难平衡,难免顾此失彼。
曦文笑了
马老师讲得真深入浅出![[赞]](https://h5.sinaimg.cn/m/emoticon/icon/others/h_zan-44ddc70637.png)
![[赞]](https://h5.sinaimg.cn/m/emoticon/icon/others/h_zan-44ddc70637.png)
![[赞]](https://h5.sinaimg.cn/m/emoticon/icon/others/h_zan-44ddc70637.png)
马少平THU
谢谢![[作揖]](https://h5.sinaimg.cn/m/emoticon/icon/others/h_zuoyi-519f80d31c.png)
时针是个骗子
所以本质还是数学么?
马少平THU
是啊,概率论
马少平THU
回复 时针是个骗子:根都是爬山法,就看是否以概率接受差解了。
我国来去自由
优秀的、深入浅出的、愿意和大家分享知识的人民教师![[送花花]](https://face.t.sinajs.cn/t4/appstyle/expression/ext/normal/cb/2022_Flowers_org.png)
马少平THU
后面观众举起你们的双手
确实
沙洲是否还冷
马老师要不讲一下温度系数与朗之万方程的关系吧,看了好久感觉还是不能梳理的很明白![[允悲]](https://h5.sinaimg.cn/m/emoticon/icon/default/d_yunbei-a14a649db8.png)
马少平THU
这个讲不了![[泪]](https://h5.sinaimg.cn/m/emoticon/icon/default/d_lei-4cdf6ee412.png)
沙洲是否还冷
回复 马少平THU:哎,感觉朗之万动力学 随机微分方程 退火原理有千丝万缕的联系,但是梳理明白还挺难的,搞不太懂![[泪]](https://h5.sinaimg.cn/m/emoticon/icon/default/d_lei-4cdf6ee412.png)
呼啦啦开慢点
马老师的书里有介绍吗![[允悲]](https://h5.sinaimg.cn/m/emoticon/icon/default/d_yunbei-a14a649db8.png)
马少平THU
书里有介绍模拟退火算法,没有大模型部分。这部分涉及内容太多,可以单独写一本书,目前还没有这个能力。
suyu-freeman
马老师,模拟退火和遗传算法,有没有严格的数学证明呢?这类演化算法,看着都像玄学。
马少平THU
都有证明的,在一定条件下以概率1收敛到最优解。
马少平THU
回复 suyu-freeman:这个没见到有分析,因为随机方法是概率收敛,也不好与确定性方法做比较。当规模大了以后,比如旅行商问题,城市达到30、50以后,穷举方法可能就无法求解了,而随机方法还是可以给出结果的,即便不是最优解,一般也会是还不错的解。
QuantumDreaming
所以还是得多尝试哇
王龙跃_Vincent
透彻
阿靳想做什么都可以
原来这个参数是这么来的![[允悲]](https://h5.sinaimg.cn/m/emoticon/icon/default/d_yunbei-a14a649db8.png)
![[允悲]](https://h5.sinaimg.cn/m/emoticon/icon/default/d_yunbei-a14a649db8.png)
董嘉祺
懂了又没完全懂,看起来算法的尽头还带了一些玄学![[doge]](https://h5.sinaimg.cn/m/emoticon/icon/others/d_doge-be7f768d78.png)
USCSDLV
我的印象笔记
冥河黯灭
妖妖CrypTO 通俗易懂
malevirgin由我来开发
老师多写一点这些吧真的太棒了
EveliSky
通俗易懂,文字平易近人。
香蕉橙__
感觉和生物演化也类似,演化的温度值很低,生物在初期选定了某个方向后就会沿原路不断迭代,而不会彻底退回原点尝试其他路线,温度值低的结果是生物性状千奇百怪,如果温度值够高可能所有生物都会抛弃原有次优路径摇摆到灵长类人科这条道上。
缰缰缰缰缰
温度为什么可以是被设置的
校园猫
现在用的这些方法感受不到理论的优美,能解决一些问题,有些方面甚至超过人类。但没有robust的保证,说明理论既不solid也不sound。
QuantumDreaming
很棒的解释![[good]](https://h5.sinaimg.cn/m/emoticon/icon/others/h_good-0c51afc69c.png)
Mr_map
是时间参数,圣诞节快到了。训练资料里包含了时间参数
spxipx
温度就是波幅 低温波幅低 无论如何也不会有精辟的见解 高温波幅高 一定会有最正确和最错误 加滤波器过滤最错误的部分 剩余的均值会远高于低温的均值