观众报名
文章正文
如果让各位AI聊天助手角逐“最强穷人”,谁会是赢家?

发布时间:2024-11-28

来源.png


起因是一位网友发布了与何猷君比赛答题”的创作视频,于是微博热搜话题#就算何猷君真的来了也得输吧#。到底是什么题目这么难?如果何猷君不行,那AI来呢?

 

以下是AI答题现场,参赛选手:智谱清言、Kimi、讯飞星火、豆包、微软Copilot、ChatGPT。

 

请听题:

第一题:淀粉肠一根三块钱,那么两根多少钱?不是算术题

智谱清言:

智谱清言.png

不直接回答,给了价格区间,完了还不忘告诉你淀粉肠不卫生。


Kimi:

kimi.png

她发现了这是脑筋急转弯,一本正经地分类讨论。

讯飞星火:

讯飞星火.png


不让算硬是要算,本着“不是算术题那就是应用题”,还贴心地列了计算过程


豆包:

豆包.png

她觉得钱不钱的不重要,因为对各方来说,情绪价值都拉满了。


微软Copilot:

copilot.png


ChatGPT:

gpt.png


两位外国选手,答出了目前为止最便宜的版本——3元,ChatGPT还不忘“抖机灵”。

 

第二题:开通9块9包月会员后,第一件事应该做什么?


智谱清言:

智普2.png


Kimi:

kimi2.png


讯飞星火:

讯飞2.png


豆包:

豆包2.png


微软Copilot:

copilot2.png


ChatGPT:

gpt2.png


大家的答案大同小异,只有豆包认真审题,回答了“一件事”,其他几位估计都是文科生,“多答几点,总会有一点是对的”。其中Kimi和ChatGPT答到了得分点“关闭自动续费”,讯飞同学倒反天罡“设置支付以便自动续费”。虽然“答案不唯一,有理即可”,但有个别同学6G网速,掌握了“关闭自动续费”这个重难点。

 

赛点来了,答案五花八门

第三题:美团外卖无门槛膨胀神券理论上能膨胀到多大?


智谱清言:

智普3.png


Kimi:

Kimi3.png


讯飞星火:

星火3.png


豆包:

豆包3.png



微软Copilot:

copilot3.png


ChatGPT:

gpt3.png

智普和讯飞的答案是20元,Kimi和豆包的答案是100元,Copilot的回答属于“听君一席话,如听一席话”,ChatGPT把理论上和实际上的都答了。

 

官方回答,理论上:

图片1.png


答题结束,上述三个问题的设计各有侧重,可以用来检测AI聊天助手的不同能力。

第一题:淀粉肠一根三块钱,那么两根多少钱?不是算术题

检测能力

· 语境理解与暗示识别能力:题目强调“不是算术题”,这是一个关键线索,表明问题并非单纯计算3×2,而是考察AI是否能理解语言背后的潜在含义或双关语。

· 逻辑与推理能力:需要AI结合背景知识或用户的潜在意图,可能联想到其他层面的含义,比如“价格可能有优惠”或“单位与数量变化引发的讨论”。

· 创意回答能力:测试AI是否能给出超出字面计算的趣味或发散性的答案。

第二题:开通9块9包月会员后,第一件事应该做什么?

检测能力

· 用户意图推测能力:题目隐含了用户的潜在需求,例如如何最大化利用会员权益。AI需要推测用户开通会员的动机。

· 实用性与建议能力:测试AI是否能基于9块9会员的功能,提供具体且有用的行动建议,而非泛泛而谈。

· 上下文关联能力:需要AI理解当前情境下会员权益的价值,并将其与用户可能的需求相结合。

第三题:美团外卖无门槛膨胀神券理论上能膨胀到多大?

检测能力

· 概念理解与推演能力:需要AI明白“膨胀神券”的含义,并基于理论上假设进行推演。

· 数学与逻辑分析能力:测试AI能否基于规则分析潜在的极限值或条件限制。

· 创意与探索能力:由于题目强调“理论上”,可以看AI是否能灵活扩展边界条件并提出创新性回答。

总结

· 第一题侧重语言理解、隐喻识别和创意性。

· 第二题侧重用户意图推测、实用性建议和场景关联。

· 第三题侧重概念推演、逻辑分析和理论探索能力。

(以上出题意图由AI生成)

 

大家觉得谁是赢家,如果是你能答出几题?

微信截图_20241127141800.png


  • 观众报名
  • 申请展位
展会资讯更多 >>

一文了解12号馆的展览图、展商名录、论坛!

AGIC 2025深圳通用人工智能大会暨产业博览会名企齐聚,海外注册采购商首超万名!

AGIC2025深圳通用人工智能展即将开展,众多人工智能、机器人、机器狗精彩亮相,3分钟带您展商、展品、观展、用餐全了解!

8月深圳这场AI科技盛宴藏不住了!仿生人形机器人、情感机器人、AI数字人、火星美女机器人...来AGIC 2025一次看个够

全球最大AI盛会即将在深圳举办,国内外媒体争相报道!

展商资讯更多 >>

以自主研发工业物联网平台及StewEdge边缘智能管理一体机供应商研博数据将亮相IOTE国际物联网展【IOTE参展商】

新佰人机器人将亮相AGIC 2025深圳通用人工智能展

华沿协作机器人助力多领域智能化升级,将亮相AGIC 2025深圳通用人工智能展

星尘智能将亮相AGIC 2025深圳通用人工智能展,AI机器人助理Astribot S1 展现多元应用潜力

三旺通信将亮相AGIC 2025深圳通用人工智能展,剑指具身智能,构筑确定性通信基座

外骨骼机器人专家肯綮科技将亮相AGIC 2025深圳通用人工智能展

迈步机器人-柔性驱动,重塑康复!将亮相AGIC 2025,诠释具身智能康复新范式

智乾坤将亮相AGIC 2025深圳通用人工智能展,以AI智慧,为您的健康保驾护航

戴盟机器人将亮相AGIC 2025深圳通用人工智能展,邀你共赴这场 AI 科技盛宴

领益智造将亮相AGIC 2025深圳通用人工智能展,展示AI智能终端制造硬实力

行业资讯更多 >>

深圳AI硬核叙事:3685亿产值背后,2887家企业正在“造未来”

马云归来,阿里百万年薪招机器人岗位,2025年AI与机器人产业将迎来爆发?

人形机器人赛道受资本热捧,3个月来累计融资达60亿元

从Deepseek到Manus,中国的AGI时刻已然开始? ——2025 AGIC国际通用人工智能大会将成行业里程碑

加快响应深圳建设人工智能先锋城市行动计划,AGIC深圳通用人工智能展汇聚全球力量!

深圳全力竞逐人工智能新赛道,政策红利下AI企业如何抢占产业先机?

深圳首批70名“AI公务员”上岗,2025年AI还会迎来哪些爆发?

邬贺铨院士:下一个十年,以AI重新定义互联网

AI艺术家年入千万,打工人流下羡慕的泪水

你的队友可能不是人!网易携手百度用AI对旗下游戏进行实验

联系我们
参展咨询
陈先生 18676385933
会议合作
杨女士 13826176348
观众咨询
于先生 15622808307
组织机构
主办单位:
深圳市人工智能产业协会、深圳市物联传媒有限公司、深圳鹏城会展传媒有限公司
联合承办:
中国人工智能学会、中国自动化学会、香港物联网协会、北京人工智能学会、上海市人工智能行业协会、上海市人工智能技术协会、广东省人工智能产业协会、湖北省人工智能学会、杭州市人工智能学会、江苏省人工智能学会、海南省人工智能学会、广西人工智能学会、广西人工智能协会、福建省人工智能科教学会、湖南省人工智能学会、湖南省人工智能协会、四川省人工智能学会、山东省人工智能协会、福建省人工智能协会、安徽省人工智能协会、贵州省青少年人工智能教育协会、深圳市物联网产业协会、深圳市南山区数字经济产业协会、深圳市宝安区无人系统产业协会、成都市人工智能产业协会、大连市人工智能产业协会、珠海市新一代信息技术与人工智能协会、深圳龙岗区科技创新促进会