文字序顺不响影GPT4阅读理解,别的大模型都不行

发布时间 :2023-12-04 13:01:29
文字序顺不响影GPT4阅读理解,别的大模型都不行】

研表究明,汉字序顺并不定一影阅响读(对于英文来说,则是每一个单词中的字母顺序)。

现在,日本东京大学的一项实验发现,这个“定理”居然也适合GPT-4。

比如面对这样一段“鬼画符”,几乎里面每一个单词的每一个字母都被打乱:

oJn amRh wno het 2023 Meatsrs ermtnoTuna no duySan taatgsuAu ntaaNloi Gflo bClu, gnelcinhi ish ifsrt nereg ecatkjnad ncedos raecer jroam。

但GPT-4居然完美地恢复出了原始句子(红框部分):

原来是一个叫做Jon Rahm的人赢得了2023年美国大师赛(高尔夫)的故事。

并且,如果你直接就这段乱码对GPT-4进行提问,它也能先理解再给出正确答案,一点儿也不影响阅读.

对此,研究人员感到非常吃惊:

按理说乱码单词会对模型的tokenization处理造成严重干扰,GPT-4居然和人类一样不受影响,这有点违反直觉啊。

值得一提的是,这项实验也测试了其他大模型,但它们全都挑战失败——有且仅有GPT-4成功。

具体怎么说?文字序顺不响影GPT-4阅读理解,别的大模型都不行

热门评论

alanteading
alanteading

自从出现这个梗,看字顺序会变严谨[doge]

老张评论
老张评论

这人工智能是不是也可以破译密码了?

大圣千钧棒
大圣千钧棒

可以用来解密

阿达哥
阿达哥

或许gpt真的是以字母为token单位的?但这也太违反自觉了

Taro_sago
Taro_sago

可是英文打乱字母顺序我会看不懂 是不是得母语者才不会受影响[傻眼][傻眼]

锐色齿兔
锐色齿兔

本人类表示看不懂

Lyong2030
Lyong2030

调了一下文字或者单词字母的顺序不影响GPT的理解能力

令和年代
令和年代

我的印象笔记 非常有趣

今日热门