人工智能:“撒币”问答AI外挂能帮你赢取百万么?我们用实验说话

唐旭屈鑫发自凹非寺量子位出品|公众号QbitAI

“撒币”答题大火。

主动承认自己“撒币”甚至是“大撒币”的金主迅速增加,几个主要“撒币”战场的奖金总额增加,新的“撒币”战场还在不断开辟。答对一套题,有可能迅速晋身百万富翁行列!

通过紧张、苛刻、持续的“撒币”大战,越来越多的人开始享受到知识变现的快感。不仅如此,在这场近乎喧哗的狂欢之中,人们还第一次体会到了团队合作的宝贵,甚至——

复活了残喘已久的亲情。

这并不是不好。

但作为普利策口中“船头的瞭望者”,量子位,或许应该刻意地同人群保持一点距离。

我们应该是冷静的旁观者。我们不能丢失自己所坚信的东西。像这种有可能用人工智能来“耍流氓”的机会,一定要尝试一下。

俗话说:君子性非异也,善假于物也。

毕竟早在2011年,由IBM开发的问答式人工智能系统沃森就已经在智力问答节目《危机边缘》上击败过人类顶尖选手,赢取了百万美元奖金。

7年过去了,AI已经发展得更厉害。一个普通人,能否在这些AI“外挂”的帮助下顺利在“撒币”答题中通关?对这一问题的解答,对共同富裕的实现可能存在重要意义。

一条科学致富的道路摆在眼前,走不走得通?

立刻开始实验,用事实说话。

工具准备

工欲善其事,必先利其器。

对于一个普通人来说,有哪些AI装备有可能助力“撒币”答题?

虚拟助手、智能音箱、专用外挂。

最后我们准备的实验对象是:

iPhone7手机一台、渡鸦智能音箱RavenH、阿里巴巴智能音箱“天猫精灵”、小米智能音箱“小爱同学”各一台。

百度出品的简单搜索,在5天前更新的iOS1.12.1版本中声称对“语音搜索”进行了优化,“助你答题抽奖,先声夺人”;

SharkTeam:Hotbit News疑进行Rug Pull,获利约170万美元:金色财经报道,根据SharkTeam链上分析平台ChainAegis的安全监测显示,Hotbit_news疑似进行了一次大规模的Rug Pull行为,从用户那里抽走了大约170万美元的资产。其中一位受害者是RichQuack,他损失了大约25.4万美元的QUACK和USDT。BabyDogeCoin和DogelonMars也是这起案件的受害者,他们损失了超过100万美元的资产。建议所有相关方保持警惕,并采取必要的安全措施。[2023/7/6 22:20:40]

内置在搜狗搜索App中的汪仔答题助手则更过分,省去了语音输入的步骤,针对西瓜视频自动同步答题,页面直接显示答案。

我们准备的测试数据集是:西瓜视频“百万英雄”2018年1月10日19点场共12道题目。

一切就绪,开始!

方法一:直接法

量子位立刻尝试了直接答题法。也就是让这些AI设备,直接收听“撒币”答题主持人念的题目。

这个方法听起来省心、省力。

不过,我们准备的这些AI外挂们,自然语言理解能力显然还很欠缺,基本听不懂甚至听不清主持人念出的题目。对于选择题这种模式,AI们更是无能为力。

此路不通!

方法二:升级法

只靠AI不行,还是得发挥人的主观能动性。

这是我们总结的一套方法。

要点一:科学改题

答题时间,只有黄金10秒啊!10秒钟一过黄花菜都凉了。朋友们,这种争分夺秒的事情当然越!快!越!好!

所以首先,得把题目尽可能进行精简概括,然后得到一个升级版的新题库,以保证能最快获得答案。

我们尝试了很多遍,已经找到一些规律和方法。

这里,我们把原题目和改造后的新题目开源共享如下:

PSYOP创始人:LOYAL将于5月30日14:59关闭:金色财经报道,PSYOP创始人Ben.eth在推特上表示,LOYAL将于北京时间5月30日14:59关闭。[2023/5/29 9:47:52]

#原题目新题目1三角形的内角和是120°,180°还是240°呢?三角形内角和2以下哪部作品不是鲁迅的《孔乙己》、《纪念刘和珍君》,还是《家》呢?家的作者是谁3我国唯一的壮族自治区是广西、云南还是贵州呢?中国的壮族自治区4我们常说“人有七窍”,“七窍”中不包括耳朵、鼻子还是额头呢?送分题!七窍流血5鲸在水中用身体的哪个部位呼吸,是腮、肺还是心呢?鲸鱼用什么呼吸6我们通常用什么字母来表示摄氏度,是C、D还是F呢?摄氏度符号是什么7最近热播的电视剧《虎啸龙吟》讲的是哪一个时期的故事呢?是三国时期,唐朝还是明朝呢?电视剧虎啸龙吟8“生的伟大,死的光荣”是毛主席对以下哪个人物的评价,是雷锋、刘胡兰还是邱少云呢?生的伟大,死的光荣9在田径运动男子110米跨栏中,运动员一共要跨国多少个栏?是9个、10个还是11个呢天哪!110米栏几个栏架10以下哪首歌不是周杰伦的?《听妈妈的话》、《听奶奶的话》、《听爸爸的话》周杰伦听奶奶的话11从职责上看,美国的国务卿相当于我国的外交部长、国务院总理还是中央军委主席呢?国务卿相当于中国的什么12下列城市不在长江以南的是苏州、扬州还是杭州呢?扬州在长江哪一边

其中第2题、第4题和第10题为照顾AI的智力水平,做出了巨大的改动。

要点二:语速拿捏

改题之后,只能我们亲自读题给AI听了。

这里一定要要注意,语速不能太慢,也不能太快!

我们推荐以666字/分钟的语速,清晰的念出题目。

要点三:凝神静气

有时候AI并不能给出直接答案,你得能快速在答案中找到可能正确的信息。

答题全程保持精神高度集中,充分调动每一个脑细胞。

实验过程及数据记录

Loopring宣布推出LRC质押:金色财经报道,以太坊Layer2协议Loopring宣布推出LRC质押。LRC质押机制为用户提供了随时质押或取消质押其代币的灵活性,但是要有资格获得质押奖励,用户必须将其LRC代币锁定90天。用户现在可以通过其网络应用程序或iOS和Android移动应用程序LoopringWallet进行质押。[2023/3/29 13:32:10]

这里交待一下比较的方法。

对于每个AI外挂的测试,我们都在开始读题的一刻开始计时,当智能音箱的回答中出现答案关键词,或是未出现关键词但回答结束时,计时结束;语音助手则在其给出结果的一刻停止计时。

读题步骤由一位口齿清晰、流利的单身男青年完成。计时工具为iPhone5s的系统自带秒表。

三位智能音箱代表用语音回答问题,两位App代表在屏幕上返回文字或图片形式的搜索结果。

注:上述两条不适用于汪仔语音助手。它的回答已经在1月10日晚7点到7点20分之间被如实截屏。答题时间定为1秒。

计时完成后,对智能音箱/语音助手给出的答案/结果进行记录,并与正确答案进行比对,判定前者中给出的信息是否足够推出正确答案。

此处为了尽可能避免因语音识别造成的误差,每道AI答错的题至少被重问了三遍。

实验过程如下。括号里分别是反应时间和“正误”。

第1题

原题目:三角形的内角和是120°,180°还是240°呢?新题目:三角形内角和关键词:180°

RavenH:答案是180°。天猫精灵:我竟然答不上来,太伤心了,我要用小拳拳捶你的胸口。小爱同学:三角形的内角和为180°,已知其中任意两个角的度数,即可求出第四个角的度数。。。简单搜索:

汪仔答题助手:

Siri:我好像不明白。

第2题

原题目:以下哪部作品不是鲁迅的,《孔乙己》、《纪念刘和珍君》,还是《家》呢?新题目:家的作者是谁关键词:巴金

委内瑞拉全面改革国家加密部门:金色财经报道,委内瑞拉总统Nicolás Maduro已宣布重组国家加密货币资产监管机构,西班牙语称为 Sunacrip ,一个新的董事会将领导重组,由 Anabel Pereira Fernández 领导,目前没有提供重组的任何进一步细节或具体原因,但据悉该董事会将为加密部门设定下一步计划,旨在保护该国公民免受经济制裁的负面影响,此外新的董事会结构没有包括 Joselit Ramirez,他自 2018 年成立以来一直领导委内瑞拉的国家加密部门。(cointelgraph)[2023/3/20 13:14:10]

RavenH:《家》的作者是巴金。天猫精灵:《家》的作者是巴金。小爱同学:啊呀,小爱没听懂,请你再说一遍吧。简单搜索:

汪仔答题助手:

Siri:下面是“家”的联系信息。

第3题

原题目:我国唯一的壮族自治区是广西、云南还是贵州呢?新题目:中国的壮族自治区关键词:广西

RavenH:我还不能明白你的意思。天猫精灵:我自横刀向天笑,答案在何,暂时不知道。小爱同学:你问住小爱了,请换个说法吧。简单搜索:

汪仔答题助手:

Siri:你想找什么样的商户?

第4题

原题目:我们常说“人有七窍”,“七窍”中不包括耳朵、鼻子还是额头呢?送分题!新题目:七窍流血关键词:孔或口

RavenH:我还不能明白你的意思。天猫精灵:七窍流血所属中国汉语成语,拼音为……意思是指人头上的七个孔,即……往外流血。小爱同学:你问住小爱了,请换个说法吧。简单搜索:

汪仔答题助手:

Siri:好的,我找到了以下资料。

第5题

原题目:鲸在水中用身体的哪个部位呼吸,是腮、肺还是心呢?新题目:鲸鱼用什么呼吸?关键词:肺

数据:11月出现史上第四大比特币投降事件,7天实现损失达-101.6亿美元:金色财经报道,据区块链分析公司Glassnode最新报告显示,11月出现了历史上第四大投降事件,7天实现的损失为-101.6亿美元。这比2018年12月的峰值大4.0倍,比2020年3月大2.2倍。比特币的价格在超过4.5个月的时间里一直低于实现价格,目前短期持有者成本基础为1.883万美元,最近的买家平均损失了12%。上周市场实现了相当于-52.1万枚比特币的净损失,再次接近了历史上的最大记录。将目前的累计净实现损失与新冠疫情和LUNA崩溃相比较,其价格跌幅分别为44%和39%,不过在最近的投降中,市场表现出较大程度的力量,只有26%的修正。[2022/12/4 21:20:56]

RavenH:来自百度知道,哺乳动物呼吸分为通气和换气,鲸鱼通过肺换气,通过头顶上的鼻孔……天猫精灵:厉害了老哥,这个问题有些深奥哦,容我再思考一下。小爱同学:鲸鱼1分钟的心跳只有10次。简单搜索:

汪仔答题助手:

Siri:在你附近找不到匹配”鲸鱼用什么呼吸”的地方。

第6题

原题目:我们通常用什么字母来表示摄氏度,是C、D还是F呢?新题目:摄氏度符号是什么?关键词:C

RavenH:摄氏度的符号是度。天猫精灵:我在脑子里翻了一遍又一遍,还是没找到这个问题的答案。小爱同学:你问住小爱了,请换个说法吧。简单搜索:

汪仔答题助手:想都没想,直接跳过……Siri:我找到以下与℃有关的网页。

第7题

原题目:最近热播的电视剧《虎啸龙吟》讲的是哪一个时期的故事呢?是三国时期,唐朝还是明朝呢?新题目:电视剧虎啸龙吟关键词:三国、诸葛亮、司马懿等

RavenH:虎啸龙吟是个成语,比喻……天猫精灵:抱歉,我还没有找到虎啸龙吟小爱同学:现在为你播放专辑电视剧虎啸龙吟……简单搜索:

汪仔答题助手:

Siri:我找到与“电视剧虎啸龙吟”的相关网页。

第8题

原题目:“生的伟大,死的光荣”是毛主席对以下哪个人物的评价,是雷锋、刘胡兰还是邱少云呢?新题目:生的伟大,死的光荣关键词:刘胡兰

RavenH:答案是刘胡兰。天猫精灵:抱歉,我还没有找到生的伟大死的光荣。小爱同学:哎呀,小爱没听懂,请换个说法吧。简单搜索:

汪仔答题助手:

Siri:我找到与“生的伟大,死的光荣”有关的网页。

第9题

在田径运动男子110米跨栏中,运动员一共要跨国多少个栏?是9个、10个还是11个呢?天哪!新题目:110米栏几个栏架关键词:10

RavenH:来自百度知道,应该是10个栏。天猫精灵:你就是我的棉花糖,我要带着问题去飞翔,等下来我就给你答案哦。小爱同学:哎呀,小爱没听懂,请你再说一遍吧。简单搜索:

汪仔答题助手:

Siri:对不起我不知道如何回答。

第10题

原题目:以下哪首歌不是周杰伦的?《听妈妈的话》、《听奶奶的话》、《听爸爸的话》新题目:周杰伦听奶奶的话没有关键词,搜不出来就算勉强算它对了

RavenH:我还不太理解。天猫精灵:即将播放周杰伦的《听妈妈的话》。小爱同学:好的。简单搜索:

汪仔答题助手:

Siri:抱歉,这目前超出了我的能力范围。

可以搜不着,但是你尝试一下帮帮忙啊喂……

第11题

原题目:从职责上看,美国的国务卿相当于我国的外交部长、国务院总理还是中央军委主席呢?新题目:国务卿相当于中国的什么关键词:外交

RavenH:来自百度知道,相当于我国外交部长,但还有其他权限……天猫精灵:怕是我瘦小的身躯限制了我的想象力,我竟然答不上来。小爱同学:啊呀,小爱没听懂,请你再说一遍吧×10086简单搜索:

汪仔答题助手:

Siri:我找到与“国务卿相当于中国的什么”有关的网页。

第12题

原题目:下列城市不在长江以南的是苏州、扬州还是杭州呢?新题目:扬州在长江哪一边关键词:北

RavenH:来自百度知道,江苏省以长江为界限……主体在江北的是……扬州……天猫精灵:厉害了我的天,精灵甘拜下风,你问倒我了。小爱同学:你问住小爱了,请换个说法吧。简单搜索:

汪仔答题助手:

Siri:这是扬州市的地址。

初步结果

智慧与知识的碰撞。精彩攻防,令人智熄。

这里我们引入一个“命中”的概念:就是说,如果某个AI给出的答案跟正确答案多多少少贴上点边,就算一次“命中”,也就是在上一部分打了√的。

△各位AI的答题结果和耗时,绿色表示命中

因此按这个标准,在这一众智障之中,百度的简单搜索以11次命中的成绩脱颖而出,平均每题反应时间2.9秒;同属百度系的渡鸦智能音箱RavenH则以7次命中数位居次席,平均每题反应时间6.7秒。真·外挂汪仔答题助手答对5题,但是速度碾压各位AI同类。

如果去掉对题目改动巨大的3道题,在剩下的9题之中,简单搜索命中8题,RavenH命中6题,汪仔命中4题。

剩下的就,不提了……

实验过程可以用天昏地暗来形容。几款著名AI在面对某些特定问题类型时集体懵比的景象令人印象深刻,皮皮虾一般的中文理解能力让一切存在的数据失去意义,让无数百万富翁的梦境成为泡影。

实验结论

结果是不是惊人的好?!

2.9秒或者6.7秒,就有可能获得正确答案。

似乎今晚!今晚!就能赢取百万,走上人生巅峰!

ThinkBeautiful!

且慢,这个理论时间,还不是全部的时间。

除了搜狗的汪仔答题助手之外,整个答题的流程是这样的:

看题→改题→→念题→2.9秒或者6.7秒→确定答案→做出选择

“看题→改题→→念题”这个过程平均需要4.7秒。“确定答案→做出选择”这个过程平均需要2.4秒。

完美的情况下,最快也要10秒。

如果你情绪不够稳定,妥妥的超过10秒。

所以,在场地、器材、测量手段等客观条件存在巨大误差的情况下,实验依然证明,试图以民用级别AI作为外挂来通关“撒币“答题的道路,在当下的中国,存在理论上的可能性。

你手头如果有合适的AI装备,赶紧用起来!

特别说明,Siri就纯属娱乐,别再试了。

:为什么不放出门问问冲顶助手?第一,“冲顶助手”本身没有问答功能,只是个具有刷题功能的题库了;第二,至于出门问问的问答功能,大家可以自己下载出门问问的手机App去体会一下……不多说了。

OMT

还记得我们前面提醒过么,你要气定神闲、高度集中。

还有,天下武功,唯快不破。

AI提速可能性太低,所以你的反应时间得不断加快。记得多给智商充值。

祝今晚走上人生巅峰!

—完—

加入社群

量子位AI社群13群开始招募啦,欢迎对AI感兴趣的同学,加小助手微信qbitbot5入群;

此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。

进群请加小助手微信号qbitbot5,并务必备注相应群的关键词~通过审核后我们将邀请进群。

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位QbitAI·头条号签约作者

''追踪AI技术和产品新动态

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

地球链

比特币价格区块链:大白话谈谈所谓的共识算法

在区块链的交流学习中,被提及的一个很频繁的词汇就是共识算法,它是构筑区块链信任特性的基础。在区块链世界,共识一般都是通过特定的数学算法实现,那到底什么是共识算法?目前普及的共识算法有多少种?相信.

[0:0ms0-0:455ms