HER:何以突出重围?初创公司Cohere获2.5亿美元融资

随着OpenAI推出ChatGPT在人工智能领域掀起的千层浪,生成式AI开始被普罗大众所熟知。《日本经济新闻》在此前报道中指出,全球100多家大规模生成式AI企业总市值达480亿美元,约为2020年的6倍,OpenAI的确引领了市场对生成式AI企业的投资热潮。

实际上,除了OpenAI,AI的发展浪潮中还有Jasper、DeepMind、Stability、Cohere等竞争者。5月3日,《纽约时报》报道称,两名知情人士透露Cohere已获2.5亿美元融资,估值约20亿美元,投资者包括互联网软件巨头Salesforce、芯片制造商Nvidia、多伦多风投公司InoviaCapital和硅谷公司IndexVentures。这是自2022年ChatGPT发布后在生成式AI领域的最新重大投资。而此前,Cohere筹集的总资金已达1.7亿美元,包括2022年由TigerGlobal领投的1.25亿美元B轮融资。

“百舸争流,奋楫者先;千帆竞发,勇进者胜”。作为加拿大的一家初创企业,Cohere何以突出重围,斩获众多投资者的青睐?了解该企业的发展历程、其产品区别于ChatGPT的独特优势后,相信我们会对投融资市场风向的选择理由与生成式AI的发展动向有所理解。

一篇著名的论文

创立于2019年的Cohere是一家自然语言处理(NLP)公司,基于大型NLP模型为外界提供API服务,从而提高计算机理解和生成文本、阅读和写作的能力。该公司由艾丹·戈麦斯(AidanGomez)与两个朋友NickFrosst和IvanZhang一起创办,它的总部位于加拿大多伦多,在美国旧金山、英国伦敦均设有办事处。自合作以来,他们组建了一支约135人的团队,目前还在继续扩建以更好的提供相关API服务。

比特币矿工在过去24小时内售出约1,400个BTC:金色财经报道,加密分析师Ali监测,比特币矿工在过去24小时内售出约1,400个BTC ,价值4120万美元。[2023/8/13 16:23:07]

两位联合创始人AidanGomez和NickFrosst曾担任过谷歌研究员,其中AidanGomez是大名鼎鼎的《AttentionIsAllYouNeed》论文的作者之一。该论文提出了一种新的、被誉为ChatGPT的“祖师爷”的网络架构“Transformer”,ChatGPT通过Transformer模型进行了序列建模,并通过自回归方式进行训练,使得大语言模型能够根据前文内容和当前输入,生成符合语法规则和语义逻辑的拟人化内容,这使得国内外都掀起了一波未平一波又起的大规模语言模型训练的热潮。

Cohere提供了与ChatGPT类似的产品,目前主要包括:搜索文本、分类文本和生成文本三大类产品,帮助企业快速部署对话式AI聊天机器人、生成式搜索引擎、文本摘要总结、增强向量搜索等,是为数不多在技术层面具备与OpenAI进行竞争的AI企业之一,这也是其受到资本市场青睐的重要原因之一。

Lucky Bird经济代币在gate交易所上线理财产品:据官方消息,gate交易所公告表示,Lucky Bird经济代币WBIRD已上线gate交易所理财产品,投资期限14天,每位用户最大额度为160枚WBIRD,是gate交易所定期投资收益率最高的理财产品。[2023/8/12 16:22:29]

Cohere曾在2021年9月获得4000万美元A轮融资;2022年2月获得1.25亿美元B轮融资,投资者包括老虎环球基金、“AI教父”GeoffreyHinton、斯坦福大学教授李飞飞、深度学习专家PieterAbbeel等。在2022年10月,Cohere便开始与谷歌、Salesforce、Nvidia进行融资谈判,如今,Cohere获得巨额融资将继续与OpenAI展开激烈竞争,继续加快类似ChatGPT产品的技术创新和更新迭代。

资本为何青睐?

实际上,在OpenAI发布GPT-4之后的一段时间内,大部分人都将目光聚焦于AI大模型,包括Anthropic、AI21、Cohere和Character.AI在内的众多资金充足的初创公司都在投入大量资源来构建更大的算法和模型,以期待努力赶上OpenAI的技术。

但就在AI竞赛如火如荼开展之时,OpenAI的首席执行官SamAltman却表示巨型AI模型的时代已结束,“未来新一步的进化,将不会来自于巨型模型”。那同属该领域的Cohere又为何会获得资本的青睐呢?

CohereAI将其模型分为两类:生成模型和嵌入模型。生成模型通过对互联网上大量的数据进行训练,而嵌入模型是多语言支持的,可以支持超过109种语言。Cohere的模型有不同的规格,公司的指令模型每周都在进步,而同类领域的其他提供商通常要几个月或甚至一年才会发布重要的模型更新。

Wemade将发行区块链棒球游戏R1B:金色财经报道,Wemade将发行区块链棒球游戏Round 1 Baseball。用户可以通过游戏收集 \"金钱球 \"实用代币,并通过投注获得 \"R1 \"代币。\"R1 \"是可在R1B和R1元区使用的治理令牌。该游戏正处于开发的最后阶段,预计将于2023年底在全球推出。[2023/3/2 12:38:42]

尽管CohereAI与谷歌合作获取其硬件能力,但其并不仅限于GoogleCloud。例如,Cohere在AWSSageMaker上运营,并计划在其他云服务提供商上提供服务。CohereAI的方法非常开放,并以客户为中心,他们通过在任何云供应商上运行以使客户获得最佳体验和服务。

相较于GPT-4,CohereAI尚未采用多模态方法。CohereAI的高级副总裁SaurabhBaji表示,“我认为图像和视频非常令人兴奋。但从商业角度来看,这也是一个不同的问题。我们并不关注AGI,而是专注于客户实际面临的问题。很多客户的需求都非常以语言为中心。”

从AI竞争格局的角度来看,CohereAI和OpenAI都是目前AI领域的重要参与者。虽然两家公司都专注于大型语言模型,但它们的重点和方法略有不同。OpenAI在一系列领域都有所涉猎,包括自然语言处理、计算机视觉和强化学习等。此外,OpenAI也吸引了大量的资本,其中包括像微软、谷歌和亚马逊这样的科技巨头。

相比之下,CohereAI专注于提供易于使用和部署的大型语言模型,为企业客户提供更好的商业解决方案。尽管CohereAI在规模和影响力上与OpenAI存在一定的差距,但其在语言模型方面的专注度和灵活性使其成为一个非常有前途的公司。

CryptoSlam:与Blur有关的NFT销售中至少有5.77亿美元是清洗交易:金色财经报道,CryptoSlam已经检测到至少价值5.77亿美元的与新兴市场Blur.io有关的洗盘交易,因为该平台在2月14日情人节开始向用户空投其本地代币。据NFT数据追踪机构CryptoSlam的数据工程师斯科特-霍金斯说,检测到的清洗交易显示出可疑的行为,例如在短时间内以接近资产初始交易的价格转售NFT。这种行为表明,一些Blur用户一直在使用不同的钱包向自己出售NFT,以获得Blur代币(BLUR)并为空投积累积分。

由于NFT销售量的激增,部分被CryptoSlam标记为人工,Blur最近超过了竞争对手OpenSea的销售量,该销售量一直是行业中最大的。洗盘交易也将全球销售量提高到2022年1月以来的最高水平,造成了NFT市场复苏的虚假感觉。[2023/2/26 12:30:02]

另外,在资本方面,CohereAI也获得了很多青睐。除了几个知名风险投资公司的支持,该公司还获得了加拿大政府和Google等科技巨头的支持。这些资金的注入有助于CohereAI继续扩展其业务和规模,并在AI市场上取得更大的份额。

总的来说,虽然CohereAI和OpenAI在AI竞争格局中处于不同的位置,但它们都是这个领域中非常有前途的公司。CohereAI在语言模型方面的专注度和灵活性使其成为一个与OpenAI进行竞争的关键因素之一,而资本的支持也给了CohereAI更多的机会来发挥其潜力,并在市场上取得更大的份额。

实用角度看大语言模型

CoinShares约有11%的总净资产在FTX上,价值约3030万美元:金色财经报道,数字资产投资和交易集团CoinShares披露其对FTX的风险敞口约占其总资产净值的11%,包括约2590万美元的USDC、190枚比特币、1000枚以太坊。CoinShares首席执行官表示,资产来自其自营交易活动,公司的ETP业务不受锁定资产的影响。[2022/11/10 12:45:52]

大语言模型是一类基于深度学习技术的自然语言处理模型,它们具有大量的参数,并能够理解和生成人类语言。这类模型通常采用神经网络架构,尤其是Transformer架构。

近期,一篇综述论文《在实践中利用大模型的力量》在AI学术圈爆火,而其中一张名为“大预言模型进化树”的图片引起了不小的轰动,其梳理了2018年到2023年的大预言模型代表作。

相较于OpenAI不断深耕至今走向AI的前沿,曾经颇具影响力的谷歌BERT似乎从一开始就走向了“岔路”。当我们以年为单位看LLM发展史的时候,忍不住唏嘘“在大模型没有成功之前,一切都是场局”。

大语言模型发展进化史

2017年的时候,谷歌研究员在《Attentionisallyouneed》一文中介绍了Transformer架构——这也是目前最常用到的架构之一,是BERT、GPT等预训练模型的基础。时至今日,Transformer架构仍是GPT模型的基础架构。

Transformer架构的提出和预训练的方法将大语言模型推向了新的阶段——以谷歌为首的科技大公司在2017年后聚焦于研发能够处理多种自然语言任务的大模型。

2018年6月,OpenAI采用Transformer架构发布了它们的模型——GPT-1。紧接着,谷歌正式向世界介绍了全新预训练模型——BERT。

时间来到2019年,微软宣布与OpenAI达成10亿美金的合作。次年9月,OpenAI授权微软使用GPT-3模型,微软成为全球首个享用GPT-3能力的公司。

科技巨头Meta当然也不甘示弱,于2022年推出有着“开源版本的GPT-3”之称的OPT,并于今年推出能在单个GPU上运行的大语言模型LLaMA。

如今GPT-4也已发布,更强的文本生成能力与详细的逻辑判断能力让OpenAI在四年内快速崛起,并成功“破圈”。

Cohere的联合创始人NickFrosst对Altman认为大模型不会永远奏效的观点也是表示认同的,他表示“有很多方法可以让Transformer变得更好、更有用,而且很多方法并不涉及向模型添加参数”。Frosst还说,新的AI模型设计或架构,以及基于人类反馈的进一步优化,将会是许多人工智能研究人员已经在探索和有前途的方向。

一些有前景的LLM用例

利用LLM大模型可以做许多“很酷”的事情,但我们必须承认,基于人类实际需求的创新发展方向才是最根本的逻辑,所以“实用主义”是我们考量LLM应用的重要指标。

对于到底是选择只经过预训练的大模型LLM,还是在此基础上经过特定数据集微调后的较小模型问题,《在实践中利用大模型的力量》这篇论文给出的答案是具体情况具体分析,我们可以参照这张决策流程思维导图来获得一些启示。

各种基于LLM构建的应用程序在不断刷新我们的认知,计算机科学家ChipHuyen在其文章《为生产构建LLM应用程序》中为我们提供了一些有前景的LLM用例:

人工智能助手:针对不同用户群体来构建不同的任务,比如安排日程、做笔记、预订航班、购物等。但是,最终目标是打造一个可以帮助你做任何事情的智能助手。

聊天机器人:聊天机器人在API方面类似于人工智能助手。如果说人工智能助手的目标是完成用户交给它的任务,那么聊天机器人的目标更多的是成为一个伴侣。例如,你可以让聊天机器人像名人、电影角色、作家等一样说话。

学习:ChatGPT不仅可以生成问题,还可以评估学生输入的答案是否正确,以及对论文进行评分和反馈。同时,它也很擅长在同一个辩论话题上采取不同的立场,可以成为学生很好的辩论伙伴。

搜索引擎优化:如今,许多公司都依赖于创造大量内容,希望在谷歌上排名靠前。但在未来,搜索引擎优化可能会变得更像一场猫捉老鼠的游戏:搜索引擎会想出新的算法来检测人工智能生成的内容,而公司则会更好地绕过这些算法。人们可能也会减少对搜索的依赖,而更多地依赖品牌。

除此之外,大语言模型可以帮助生命科学研究人员更好地理解蛋白质、分子、DNA和RNA,帮助信用卡公司进行异常检测和欺诈分析以保护消费者,帮助法律团队进行法律释义和抄写等。

在未来的模型面前,或许现在我们看到的大模型只是蝼蚁。但我们可以期待,未来更加强大的语言模型将会更彻底改变人们的生活方式。

现在,我们可以看到越来越多的企业涌入AI的洪流,个体也不可避免地主动参与或者被席卷进去,我们永远不知道明天会发生什么。未来的另一个五年又会有多少大语言模型出现,谁又将冲在行业最前端呢?让我们拭目以待。

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

地球链

非小号元宇宙:互联网和区块链的尽头是元宇宙

币圈的下一波热点毫无疑问是元宇宙元宇宙是NFT的子集,也是NFTPLUS元宇宙是中心化和去中心化世界的交汇点元宇宙是人类进化之路,未来人类90%以上的活动都是在元宇宙中进行的……元宇宙火了.

[0:0ms0-1:430ms