GPT:人类生成 or 机器生成?ChatGPT 引发了一场真假辩论

原文:英国《金融时报》

像ChatGPT这样的大型语言模型是合理性的提供者。许多聊天机器人基于所谓的生成式人工智能,经过训练可以通过在互联网上搜索相关信息并收集连贯的答案来回答用户的问题,从而生成令人信服的学生论文、权威的法律文件和可信的新闻报道。

但是,由于公开可用的数据包含错误信息和虚假信息,一些机器生成的文本可能不准确或不真实。这引发了人们争相开发工具来识别文本是由人还是机器起草的。科学也在努力适应这个新时代,现场讨论是否应该允许聊天机器人撰写科学论文,甚至产生新的假说。

区分人工智能和人类智能的重要性与日俱增。本月,瑞银分析师透露,ChatGPT是历史上增长最快的网络应用程序,1月份每月活跃用户达到1亿。一些部门已经决定没有必要锁住稳定的大门:周一,国际文凭组织表示,学生将被允许使用ChatGPT撰写论文,前提是他们注明引用了它。

风险投资家Shervin Pishevar:比特币是对人类未来长期系统的核心押注:伊朗裔美国企业家和风险投资家Shervin Pishevar最近在推特表示,SpaceX和比特币是最好的多代投资,这是对人类未来“两个核心系统”的押注。据悉,Pishevar也是优步(Uber)和Airbnb等巨头的早期投资者。(TheDailyHODL)[2020/5/26]

平心而论,这项技术的创造者坦率地指出了它的局限性。OpenAI首席执行官萨姆奥特曼(SamAltman)去年12月警告说,ChatGPT“在某些方面足够出色,足以给人一种伟大的误导印象”。我们在稳健性和真实性方面还有很多工作要做。”该公司正在为其内容输出开发加密水印,这是一种机器可读的秘密标点符号、拼写和词序序列;并且正在磨练一个“分类器”来区分合成文本和人工生成的文本,使用两者的例子来训练它。

陈宝山:法定数字货币是目前人类正在攻关的重要课题:国务院反假货币工作联席会议办公室原常务副主任陈宝山20日在金融时报发表文章《法定数字货币的可塑性论证》。文中提到,法定数字货币是目前人类正在攻关的重要课题,研发法定数字货币需在传统货币科学技术的基础上,综合采纳区块链、大数据、互联网技术。法定数字货币的运行框架是中央银行和商业银行双层运行体系,不改变现在的货币投放路径,这样能充分调动市场积极性。[2020/4/20]

斯坦福大学的研究生EricMitchell认为分类器需要大量的训练数据。他与同事一起提出了DetectGPT,这是一种发现差异的“零样本”方法,这意味着该方法不需要事先学习。相反,该方法会自行启动聊天机器人,以嗅探出自己的输出。

黄奇帆:区块链可以通过新的信任机制拓展人类协作的广度和深度:中国国际经济交流中心副理事长黄奇帆今日在北京日报刊文《数字化为何具有颠覆性?》。文章指出,数字化主要包含大数据、云计算、人工智能以及区块链技术。通常称为ABCD:A——人工智能(Artificial Intelligence),B——区块链(Block Chain),C——云计算(Cloud),D——大数据(Big Data)。区块链是一种特殊的互联网技术,是对“共识人群的一种管理方式”。如果说云计算、人工智能带来了生产力的提升,大数据让生产资料分发更高效,那么区块链就是对生产关系的变革。在此基础上,区块链技术也可以通过新的信任机制大幅拓展人类协作的广度和深度。[2020/3/1]

它是这样工作的:DetectGPT询问聊天机器人它对示例文本的“喜欢”程度,“喜欢”是示例与其自己的创作有多相似的简写。DetectGPT然后更进一步——它“扰乱”了文本,稍微改变了措辞。假设是聊天机器人在“喜欢”更改后的人工生成文本方面比更改后的机器文本更具可变性。研究人员声称,在早期测试中,该方法在95%的时间内正确地区分了人类和机器作者。

需要注意的是:这些结果尚未经过同行评审;该方法虽然优于随机猜测,但在所有生成式AI模型中的工作可靠性并不相同。对合成文本进行人为调整可能会愚弄DetectGPT。

这一切对科学意味着什么?科学出版是研究的命脉,将想法、假设、论据和证据注入全球科学经典。一些人很快就将ChatGPT作为研究助理,一些有争议的论文将AI列为合著者。

Meta甚至推出了一款名为Galactica的科学专用文本生成器。三天后它被撤回了。在它被使用的这段时间,构建了一段熊在太空旅行的虚构历史。

Tübingen的马克斯普朗克智能系统研究所的迈克尔·布莱克教授当时在推特上表示,他对Galactica对有关他自己研究领域的多项询问的回答感到“困扰”,包括将虚假论文归咎于真正的研究人员。“在所有情况下,都是错误的或有偏见的,但听起来是正确和权威的。我认为这很危险。”

危险来自于看似合理的文本滑入真正的科学提交,用虚假引用充斥文献并永远歪曲经典。《科学》杂志现在完全禁止生成文本;《自然》杂志则允许使用它,前提是必须对使用进行了声明,但禁止将其列为共同作者。

话又说回来,大多数人不会查阅高端期刊来指导他们的科学思维。如果狡猾的人如此倾向,这些聊天机器人可以按需喷出大量引用伪科学,解释为什么疫苗不起作用,或者为什么全球变暖是个局。在线发布的误导性材料可能会被未来的生成人工智能吞噬,产生新的谎言迭代,进一步污染公共话语。

贩卖怀疑的商人肯定已经摩拳擦掌,迫不及待了。

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

地球链

[0:15ms0-0:964ms