【
文字序顺不响影GPT4阅读理解,别的大模型都不行】
研表究明,汉字序顺并不定一影阅响读(对于英文来说,则是每一个单词中的字母顺序)。
现在,日本东京大学的一项实验发现,这个“定理”居然也适合GPT-4。
比如面对这样一段“鬼画符”,几乎里面每一个单词的每一个字母都被打乱:
oJn amRh wno het 2023 Meatsrs ermtnoTuna no duySan taatgsuAu ntaaNloi Gflo bClu, gnelcinhi ish ifsrt nereg ecatkjnad ncedos raecer jroam。
但GPT-4居然完美地恢复出了原始句子(红框部分):
原来是一个叫做Jon Rahm的人赢得了2023年美国大师赛(高尔夫)的故事。
并且,如果你直接就这段乱码对GPT-4进行提问,它也能先理解再给出正确答案,一点儿也不影响阅读.
对此,研究人员感到非常吃惊:
按理说乱码单词会对模型的tokenization处理造成严重干扰,GPT-4居然和人类一样不受影响,这有点违反直觉啊。
值得一提的是,这项实验也测试了其他大模型,但它们全都挑战失败——有且仅有GPT-4成功。
具体怎么说?
文字序顺不响影GPT-4阅读理解,别的大模型都不行
alanteading
自从出现这个梗,看字顺序会变严谨![[doge]](https://h5.sinaimg.cn/m/emoticon/icon/others/d_doge-be7f768d78.png)
老张评论
这人工智能是不是也可以破译密码了?
大圣千钧棒
可以用来解密
阿达哥
或许gpt真的是以字母为token单位的?但这也太违反自觉了
Taro_sago
可是英文打乱字母顺序我会看不懂 是不是得母语者才不会受影响![[傻眼]](https://h5.sinaimg.cn/m/emoticon/icon/default/d_shayan-4e8000eba9.png)
![[傻眼]](https://h5.sinaimg.cn/m/emoticon/icon/default/d_shayan-4e8000eba9.png)
锐色齿兔
本人类表示看不懂
Lyong2030
调了一下文字或者单词字母的顺序不影响GPT的理解能力
令和年代
我的印象笔记 非常有趣