下载
首页 手机游戏 手机应用 资讯 攻略 合集
首页 > 新闻 > APP资讯 > 8个大模型竟答错 9.11和9.9大小比较不出

8个大模型竟答错 9.11和9.9大小比较不出

时间:2024-07-18 标签:AI大模型

  一道小学生难度的数学题难倒了一众海内外AI大模型。

  问题是:“9.11和9.9哪个更大?”就此问题,记者测试了12个大模型,结果显示阿里通义千问、百度文心一言、Minimax和腾讯元宝答对了,但ChatGPT-4.0、字节豆包之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了。每个错误的原因都各有不同。

8个大模型竟答错 9.11和9.9大小比较不出

8个大模型竟答错 9.11和9.9大小比较不出

8个大模型竟答错 9.11和9.9大小比较不出

  大部分大模型在问答过程中错误地比较了小数点后的数字,认为9.11大于9.9。考虑到数字涉及的语境问题,记者将其限定为数学语境下,但像ChatGPT这样的高级模型也依然答错。

8个大模型竟答错 9.11和9.9大小比较不出

  这反映出大模型在数学能力上的不足,这是一个长期存在的问题。有行业人士认为,生成式语言模型从设计上更偏向文字思维而非数字思维。然而,针对性的语料训练或许能在未来逐步提升模型的理科能力。

推荐游戏

推荐内容

m.dancihu.com