GPT:AIGC的里程碑 Chat GPT凭什么引爆科技圈？

摘要

事件：11月30日，OpenAI上线了新模型ChatGPT，其网页应用允许用户免费使用，ChatGPT能够理解人类语言并且回答问题，不限于普通聊天、协助写代码、解决具体难题等等应用场景。因为其高质量的回答、高效获取信息的方式、以及上瘾式的交互体验，ChatGPT引起了社交媒体的广泛传播与关注。

ChatGPT效果出人意料，“全能AI”火遍社交媒体。ChatGPT的交互界面简洁，只有一个输入框，AI将根据输入内容进行回复，并允许在一个语境下持续聊天。ChatGPT的聊天范围广泛，涵盖大部分领域，根据亲身体验以及社交媒体分享的内容来看，ChatGPT能在绝大部分知识领域给出专业回答，同时对输入的理解能力和包容度高。无论是让ChatGPT写首押韵的诗、检查代码的bug、回答科学问题、对推特未来的发展提出建议都不在话下，其回复内容每次都是随机的，但总体保持着一定的专业性和信息量，具备很强的参考意义。与ChatGPT持续对话是一种令人上瘾的体验，因此在该应用发布的短短几天内，就能看到国内外的社交媒体上就有大量关于ChatGPT对话的分享。

ChatGPT的背后离不开大模型、大数据、大算力。ChatGPT成为AIGC里程碑的背后，是算力发展和数字时代形成的大数据所共同支持的大模型训练，才能实现目前的效果。由OpenAI研发的ChatGPT是微调后的GPT-3.5系列模型，有着多达1750亿个模型参数，并在今年年初训练完成。模型训练的背后离不开大数据的支持，OpenAI主要使用的公共爬虫数据集有着超过万亿单词的人类语言数据集。在算力方面，GPT-3.5在Azure AI超算基础设施（由V100GPU组成的高带宽集群）上进行训练，总算力消耗约3640 PF-days（即每秒一千万亿次计算，运行3640个整日）。

高通全球高级副总裁：AIGC的成熟和广泛应用将大幅提升元宇宙内容的生产效率:金色财经报道，在2023年世界人工智能大会现场，高通全球高级副总裁程立新表示，5G和AI技术将赋能元宇宙全新的应用服务、环境和体验。目前看到XR的发展很大程度上受限于内容生产高成本以及应用生态的碎片化，AIGC的成熟和广泛应用将大幅度提升元宇宙内容的生产效率。（澎湃）[2023/7/7 22:23:47]

AIGC不仅改变创作，还将改变获取信息的主要方式。在之前的报告中，我们讨论过AIGC对于创作的替代，降低了创作门槛，为元宇宙数字内容的丰富打下基础。而在此之上，ChatGPT所展示了作为生产力的存在，ChatGPT在寻找答案、解决问题的效率上已经部分的超越了如今的搜索引擎，ChatGPT或许在未来会改变我们获取信息、输出内容的方式，AIGC有望成为数字经济时代驱动需求爆发的杀手级应用。

模型缺点瑕不掩瑜，未来迭代值得期待。据官网显示，ChatGPT目前存在着一些局限性，包括：有时会给出看上去正确但荒谬的答案、微调提问的方式会得到完全不同的答案、有时会反复使用某些句子等等。在我们实际体验中也能感受到，这些问题来自训练过程和数据集的局限性。ChatGPT本次面向用户免费开放能够进一步强化训练，从而完善模型质量。

投资建议：软硬件与数据集。生成算法、NLP与算力决定AIGC能否运行，而高质量的数据集决定了AIGC质量与商业模式。软件层面主要包括自然语言处理技术：谷歌、微软、科大讯飞、拓尔思；AIGC生成算法模型及数据集：视觉中国、万兴科技、蓝色光标、昆仑万维；算力层包括：三大运营商（移动、电信、联通）、英伟达、澜起科技、中兴通讯、新易盛、天孚通信、中际旭创等。

以太坊侧链Ronin Network已上线面向开发者的测试网Saigon:11月23日消息，据官方公告，以太坊侧链Ronin Network推出开发者测试网Saigon，允许开发者在测试网上进行合约部署。Ronin Network还将在该测试网上测试DPoS共识机制。此外，Ronin Network 宣布已将Ronin Protocol、Ronin Bridge以及DPoS的智能合约开源。[2022/11/23 8:01:10]

11月30日，OpenAI上线了新模型ChatGPT，该模型允许用户以对话的方式与其交互。ChatGPT是之前发布的InstructGPT的兄弟模型，后者被训练用于根据输入给出详细的一段输出。同时，ChatGPT模型为了获得更多用户反馈，在目前阶段对用户开放免费使用，用户可通过chat.openai.com进行应用交互体验。

ChatGPT的交互界面简洁，只有一个输入框，用户可以任意开启话题或者给出指令，模型将根据输入内容给出输出。ChatGPT的一大特点就是允许在同一个语境下持续交流，能够根据上下文进行回复。

ChatGPT的聊天范围广泛，涵盖大部分领域，具备参考意义。根据亲身体验以及社交媒体分享的内容来看，ChatGPT能在绝大部分知识领域给出专业回答，同时对输入的理解能力和包容度高。无论是让ChatGPT写首押韵的诗、检查代码的bug、回答科学问题、对推特未来的发展提出建议都不在话下，其回复内容每次都是随机的，但总体保持着一定的专业性和信息量，具备很强的参考意义。

Hodlonaut赢得针对自封“中本聪”Craig Wright的诉讼:金色财经报道，挪威法官裁定，周四，在推特上被称为“Hodlonaut”的Magnus Granath赢得了针对Craig Wright的诽谤案。经过一周的审判，Wright将支付Granath的律师费。Granath在挪威起诉Wright，试图抢占Wright计划在英国提起的诽谤诉讼。

金色财经此前报道，自称是比特币创造者的澳本聪（Craig Wright）在对加密人士Hodlonaut（真名Magnus Granath）提起的诉讼案中表示，他故意踩坏了包含中本聪钱包私钥信息的硬盘，这使得从密码学上证明他是比特币的创造者“极其困难”。他在挪威法庭上称，销毁硬盘是避免其被迫这种方式证明自己身份的“唯一方法”，而他希望以学术成就等传统方式确认他是中本聪，如果不这么做“人们最终会强迫我做我不想做的事情”。据悉，澳本聪自称为中本聪一事，Hodlonaut一直持反对态度并提出怀疑。澳本聪对Hodlonaut发起诉讼，称其涉嫌诽谤。[2022/10/21 16:33:16]

ChatGPT的对话内容开始在社交媒体引起关注。因为ChatGPT对话的随机性以及较为丰富的信息量，与ChatGPT持续对话令人上瘾，在该应用发布的短短几天内，国内外的社交媒体上就有大量关于ChatGPT对话的分享。这其中包括马斯克向ChatGPT请教如何改变推特，也有各类有趣的问答合辑。

动态 | Craig Wright批评Poloniex提供BCHABC和BCHSV预交易为重罪:据bitcoinexchangeguide报道，Craig Wright批评Poloniex提供BCHABC和BCHSV预交易，称该平台提供的交易在美国是重罪。此前Poloniex为保持中立性，授权用户可以预交易BCHABC和BCHSV。[2018/11/12]

AIGC里程碑的背后离不开大模型、大数据、大算力。ChatGPT成为AIGC里程碑的背后，是算力发展和数字时代形成的大数据所共同支持的大模型训练，才能实现目前的效果。由OpenAI研发的ChatGPT是微调后的GPT-3.5系列模型（GPT模型专门用于人类语言应用），有着多达1750亿个模型参数，并在今年年初训练完成。

模型训练的背后离不开大数据的支持，公共爬虫数据集有着超过万亿单词的人类语言数据集，OpenAI团队在此基础上进行整理加工形成用于训练模型的数据集。在算力方面，GPT-3.5在Azure AI超算基础设施（由V100GPU组成的高带宽集群）上进行训练，总算力消耗约3640 PF-days（即每秒一千万亿次计算，运行3640个整日）。

声音 | Craig Wright：ERC-20是“死路一条”:自称是“币特币创始人“的Craig Wright在其社交媒体发表观点称，ERC-20是“死路一条”。Craig Wright对法律监管表示担忧，并且很快就会有交易所禁止这些加密货币，不包括比特币。[2018/7/18]

AIGC不仅改变创作，还将改变获取信息的主要方式。在之前的报告中，我们讨论过AIGC对于创作的替代，降低了创作门槛，为元宇宙数字内容的丰富打下基础。而在此之上，ChatGPT所展示了作为生产力的存在，ChatGPT在寻找答案、解决问题的效率上已经部分的超越了如今谷歌等搜索引擎，ChatGPT或许在未来会改变我们获取信息的方式，AIGC成为新时代的用户入口。

模型缺点瑕不掩瑜，未来迭代值得期待。官网注明了ChatGPT目前存在着一些局限性及原因，在我们的实际体验中，也确实遇到这些问题：

1）有时ChatGPT会写一些看上去合理但错误且荒谬的答案，这个在体验中较少但会出现。据官网描述，这个问题是难以解决的，因为：第一，在训练期间，并没有提问者目前所有的事实；第二，如果让模型过于谨慎，那么他能回答的问题也会拒绝回答；第三，有观察的训练误导了模型，因为正确的答案来源于模型的数据库而非人类知道什么。

2）ChatGPT对输入的改变比较敏感。例如，给出一句问题，模型声称无法得知答案，但轻微地改变问题，就能正确地回答。这种特性在体验中表现的比较明显。

3）ChatGPT有时会非常重复表达，反复使用某些句子，例如：重申自己是OpenAI训练的语言模型。这个问题在我们的体验中也经常出现，根据官网，该问题来自于训练数据的偏差，以及过度拟合问题。

4）在理想情况下，当用户问题模糊时，模型应该会提问将问题清晰化。但目前的模型经常不去追问问题，直接猜想用户可能问的方向。

除了官网提到的局限性外，根据实际体验，ChatGPT即使在输入的明确要求下，也难以在表达中使用数据支持，这可能是因为ChatGPT所使用的语言数据集并不包含太多关于数据的内容。

相比于此前的AI绘画，ChatGPT更具有将AI能力与工作流程相结合的潜力，例如我们试着让其解释“光学模块中的光芯片和电芯片是什么？当前的全球主流供应商是谁？中国企业的竞争地位如何？未来是否有什么技术可以替代InP材料？”这类问题时，ChatGPT能够给出颇为专业的答复，且语言表达流畅。如果将ChatGPT与Midjourney等创作工具融合，有可能直接输出设计图稿等内容，毕竟文字生成是基础，而用户要做的尽量调整自己的输入，以促使AI输出更质量的内容，这本身也是一种训练和反馈过程。目前部分用户已在社交媒体上表达了对ChatGPT的付费意愿，可见C端用户为了提高效率有意愿订阅此类服务。

目前OpenAI等巨头已着手自建计算集群来满足AIGC的要求，这种集中式的训练对GPU、存储、机房、供电等基础设施均有巨大需求。国内部分创业团队目前基于公有云训练，随着需求的增加，也有望转向自建集群。

今年以来，我国“东数西算”战略自上而下快速推进，作为数字经济的基础，“算力即权力”，其重要性不言而喻，此前我们更多的互联网应用聚焦于“存”而非“算”，随着AIGC技术在全球的兴起，“东数西算”的算力需求将越来越显著。

关于AIGC的投资策略，能够从软硬件与数据集的三个角度梳理，生成算法、NLP与算力决定AIGC能否运行，而高质量的数据集决定了AIGC质量与商业模式。

软件层面主要包括自然语言处理技术：谷歌、微软、科大讯飞、拓尔思。

AIGC生成算法模型及数据集：蓝色光标、视觉中国、昆仑万维、万兴科技。

风险提示

技术创新不及预期：AIGC的技术发展不及预期，以及底层硬件技术，如：超级计算机，算力的发展不及预期。

政策监管风险：目前AIGC还处于相对早期，后续是否会出台AIGC作品相关的知识版权或其他法律监管条款尚不明确。

本文节选自国盛证券研究所已于2022年12月5日发布的报告《AIGC的里程碑——Chat GPT凭什么引爆科技圈？》，具体内容请详见相关报告。

宋嘉吉 S0680519010002 songjiaji@gszq.com

本资料不构成对具体证券在具体价位、具体时点、具体市场表现的判断或投资建议，不能够等同于指导具体投资的操作性意见，普通的个人投资者若使用本资料，有可能会因缺乏解读服务而对报告中的关键假设、评级、目标价等内容产生理解上的歧义，进而造成投资损失。因此个人投资者还须寻求专业投资顾问的指导。本资料仅供参考之用，接收人不应单纯依靠本资料的信息而取代自身的独立判断，应自主作出投资决策并自行承担投资风险。

吉时通信

个人专栏

金色早8点

金色财经

去中心化金融社区

CertiK中文社区

虎嗅科技

区块律动BlockBeats

念青

深潮TechFlow

Odaily星球日报

腾讯研究院

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时间联系我们修改或删除，多谢。

SANDNFT:能上1e吗？特朗普NFT项目 CollectTrump 复盘

1900/1/1 0:00:00

这两天特朗普NFT/img/202315215746/0.jpg" />我尝试复盘分析一下特朗普NFT,也就是我认为的Web2.5类型NFT项目.

POL币最新价格NFT:全面解读“ Listen To Earn”新玩法

1900/1/1 0:00:00

备受瞩目的古典音乐NFT平台KOLO.Market自强势杀入市场以来,受到广大古典音乐爱好者以及币圈玩家的热捧.

DYDXETF:法律视角解读：香港准入加密ETF 金融机构如何入局？

1900/1/1 0:00:00

原文：《里程牌 | HK准入虚拟货币ETF,“魔盒”来了？》作者：肖飒法律团队近期,香港在虚拟资产金融领域大动作频频.

Fil以太坊:Layer2 Token经济学：除了治理还应该具备什么价值？

1900/1/1 0:00:00

原文标题：《Layer2 Token经济学：除了治理,还应该具备什么价值？》原文作者：Michael Nadeau原文来源：The DeFi Report任何在 2021 年期间使用以太坊的人都.

地球链

GPT:AIGC的里程碑 Chat GPT凭什么引爆科技圈？

地球链