GPT:马斯克资助的ChatGPT与AIGC 对内容生态的挑战

创作者:DAOctor

ElonMusk创立的OpenAI基金会的最新聊天机器人ChatGPT以其强大写作、对话能力席卷了网络世界。ChatGPT是一种由人工智能驱动的聊天机器人,它以一种令人信服的对话方式与用户互动。ChatGPT对问题深思熟虑和全面的回答令用户震惊,包括学术界和科技行业。

该工具迅速走红。周一,OpenAI的联合创始人、著名的硅谷投资者SamAltman在Twitter上表示,ChatGPT的用户已突破100万。?

知名的科技投资人Box首席执行官AaronLevie也表示:“当一项新技术调整了你对计算的想法时,会有一种特定的感觉。谷歌、火狐、AWS、iPhone都做到了。OpenAI正在通过ChatGPT做到这一点”。

马斯克:Twitter将于3月31日开源所有用于推文推荐的代码:金色财经报道,特斯拉 CEO 马斯克发布推特表示,Twitter 将于 3 月 31 日开源所有用于推文推荐的代码。我们的“算法”过于复杂且内部未完全理解。人们会发现很多愚蠢的事情,但我们会在发现问题后立即修补。我们正在开发一种简化的方法来提供更具吸引力的推文,但这项工作仍在进行中,这也将是开源的。提供代码透明度一开始可能会令人尴尬,但它应该会让推荐质量快速提高。最重要的是,我们希望赢得您的信任。[2023/3/18 13:12:06]

与其他人工智能工具一样,ChatGPT也可能扰乱创意产业、延续偏见和传播错误信息。如StackOverflow暂时禁止用户分享ChatGPT生成的回复。因为ChatGPT很容易与用户互动,且可以快速生成大量回答,这让网站充斥着许多第一眼看起来是正确的答案,但在仔细检查后就能发现其中的错误。

马斯克:过去对加密货币感兴趣,现在对人工智能感兴趣:金色财经报道,马斯克在社交媒体发文称,“过去对加密货币感兴趣,但现在对人工智能感兴趣。”[2023/3/4 12:41:48]

因此,本文,我们将讨论最近流行的AIGC工具ChatGPT及此类工具对内容生态审核制度的挑战。

01.什么是ChatGPT

GenerativePre-trainedTransformer,是一种基于互联网可用数据训练的文本生成深度学习模型。它用于问答、文本摘要生成、机器翻译、分类、代码生成和对话AI。

2018年,NLP的预训练模型元年,GPT-1诞生,此时的GPT-1仅是一个语言理解工具而非对话式AI。2019年GPT-2采用更多的网络参数与更大的数据集进行训练,此时的GPT-2展现出普世且较强的能力,并在多个特定的语言建模任务上实现了彼时的最佳性能。随后,GPT-3出现,作为一个无监督模型,几乎可以完成自然语言处理的绝大部分任务,例如面向问题的搜索、阅读理解、语义推断、机器翻译、文章生成和自动问答等等。GPT-3的出现使人们看到了通用人工智能的希望。

孙宇晨:将购买特斯拉CEO埃隆·马斯克出售的所有比特币:加密货币平台Tron创始人孙宇晨称将购买特斯拉CEO埃隆·马斯克出售的所有比特币。(金十)[2021/6/4 23:10:45]

今天,ChatGPT的到来,也被视为文本生成器GPT-3的下一个迭代,为GPT-4到来拉开序幕。

ChatGPT是一种大型语言模型,通过大量在线信息进行训练并创建其响应。注册ChatGPT后,用户可以要求人工智能系统回答一系列问题,这些问题包括开放性问题:例“生命的意义是什么?”加密货币值得投资“?”“什么是HackerMovement”等。

Mina协议CEO Evan :感谢马斯克让加密行业越来越主流:Coinbase、币信参与投资的Mina协议近日在币信直播开启中文社区首秀,并受到中国投资者追捧。Mina CEO Evan表示,感谢马斯克让加密行业越来越主流。

Mina协议基于零知识证明ZK-SNARKs(被V神力荐),轻量级区块链协议中可将区块链的大小从几百GB压缩到只有22KB。终端用户可以直接用手机运行验证Mina的主网和节点,这个特点深受全球开发者青睐。Mina测试网已成为除ETH 2.0以外的、世界上最大的PoS测试网络。2021年,Mina将继续扩大在中国的知名度和社区规模。[2021/2/10 19:25:09]

动态 | 马斯克同意支付2000万美元罚款 并将辞去董事长职务:据美国CNN报道,当地时间周六,埃隆·马斯克同意辞去特斯拉董事长一职,并支付2000万美元的罚款,以了结美国证券交易委员会(SEC)27日提出涉嫌证券欺诈的罪名指控。另外,特斯拉公司也将支付2000万美元,以了结其未能充分监督马斯克推文的指控。[2018/9/30]

02.ChatGPT如何工作的?

谈到ChatGPT的算法模型,?其前身InstructGPT仍值得关注。

2022年初,OpenAI发布了InstructGPT。开发人员通过结合监督学习+人类反馈强化学习,提高GPT-3的输出质量。在这种学习中,人类对模型的潜在输出进行排序,强化学习算法则对产生类似于高级输出材料的模型进行奖励。

训练数据集以创建提示开始,其中一些提示是基于GPT-3用户的输入,比如“解释什么是HackerMovement”或“给一个小学生解释Hacker”。

开发人员将提示分为三个部分,并以不同的方式为每个部分创建响应:

人类作家会对第一组提示做出响应。开发人员微调了一个经过训练的GPT-3,将它变成InstructGPT以生成每个提示的现有响应。

下一步是训练一个模型,使其对更好的响应做出更高的奖励。对于第二组提示,经过优化的模型会生成多个响应。人工评分者会对每个回复进行排名。在给出一个提示和两个响应后,一个奖励模型学会了为评分高的响应计算更高的奖励,为评分低的回答计算更低的奖励。

开发人员使用第三组提示和强化学习方法近端策略优化进一步微调了语言模型。给出提示后,语言模型会生成响应,而奖励模型会给予相应奖励。PPO使用奖励来更新语言模型。

ChatGPT和InstructGPT算法模型基本一样。不同之处在于数据如何被收集和训练。

?InstructGPT:给一个输入就给一个输出,再跟训练数据对比,对了有奖励,不对有惩罚;

?ChatGPT:?给一个输入,模型给出多个输出,然后人对输出结果排序,让模型使得这些结果从“更像人话”到“没有逻辑”排序。

与其他AI聊天机器人不同,本着构建更加负责任的强人工智能原则,ChatGPT可以回答后续问题、承认错误、挑战不正确的问题并拒绝不适当的请求。

写在这里记起,科幻小说家艾萨克·阿西莫夫为机器人设定的行为准则—机器人三定律:

第一法则:机器人不得伤害人类,或坐视人类受到伤害;

第二法则:机器人必须服从人类命令,除非命令与第一法则发生冲突;

第三法则:在不违背第一或第二法则之下,机器人可以保护自己。

03.ChatGPT等AIGC工具对内容生态的挑战:

不可置疑的是AIGC对很多领域产生了积极的影响。如,文本创作、音乐创作、游戏文本生成等。随着AIGC工具的成熟,其甚至可自主编程、拼接生成新的协议。

但,此类工具向内容生态提出一个全新的问题即:如何应对AIGC的真实性。以ChatGPT为例:

a)在训练的强化学习阶段,对于问题,并没有真相和问题标准答案的具体来源;

b)训练模型更加谨慎,可能会拒绝回答;

c)监督训练可能会误导/偏向模型倾向于知道理想的答案,而不是模型生成一组随机的响应并且只有人类评论者选择好的/排名靠前的响应。

人工智能生成的答案有数千个,而这些答案通常需要具有专业知识的人详细阅读,才能确定答案实际上是错误的,这些错误信息很容易破坏以志愿者为基础的高质量问答社区。

纸质新闻时代,每个事实都必须包含权威的一手或二手资料来源,但现在已经很少有出版物有事实核查员,这就把责任推给了记者和编辑。信息爆炸时代,以人为媒介传播的虚假信息尚且让审核机制“头疼”,很难想象当人工智能开始传播虚假信息,所带来的挑战。尤其是在这个舆论时常反转的时代,只要一个消息听起来合理,许多人就会认为这是正确的。

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

地球链

BitcoinLEO:全面介绍新一代隐私公链Aleo

Aleo是第一个使用零知识证明解决隐私问题、同时保证可编程特性的公链。Aleo提供的隐私保护包括隐藏参与者、金额、智能合约等交互细节,而且Aleo还将智能合约执行转移到链下,支持各种Dapp,保.

SOLWEB:Web3领域中最值得关注的3大主题

作者:Tony2014年,以太坊联合创始人加文·伍德提出Web3.0概念,将其描述为一种全新的互联网运行模式:用户自己发布、保管信息,不可追溯并且永不被泄露,即“去中心化的网络”.

[0:62ms0-1:20ms