ION:生成 AI 的下一步发展是多模型吗?

原文作者:Shritama Saha,由 DeFi 之道编译。

生成式 AI 的出现就像您身边多了一位个人创意天才。 凭借其分析模式和基于模式开发新内容的卓越能力,生成式 AI 可以创造一切,从令人惊叹的数字艺术到原创音乐作品、人类文本等等。

然而,生成式 AI 的炫酷之处也带来了 AI 艺术中复杂的盗版和版权侵权问题。 尽管如此,在过去两年中,该细分市场出现了惊人的增长。

在一次独家采访中,OpenCV 首席执行官 Satya Mallick 博士告诉 Analytics India Magazine,他认为生成式 AI 的最大突破是大语言模型或基础模型的发展,并指出 Transformer 模型,例如那些在视觉转换中使用的模型是该领域的一项重大创新。

根据 Mallick 的说法,生成 AI 的下一步是多输入和多媒体输出。 换句话说,多模型方法。

“TGV 4 Plus Opportunity Fund”拟投资生成式 AI 技术:金色财经报道,新加坡风险投资公司 True Global Ventures(TGV)已将此前募集了 1.46 亿美元的 “TGV4 Plus Follow On Fund” 更名为 “TGV 4 Plus Opportunity Fund”。根据 TGV 合伙人 Kelly Choo 透露,这家 VC 一直收到来自家族办公室的大量投资需求,要求其投资范围不局限于 Web3,而是要拓展到生成式 AI 领域,Kelly Choo 认为生成式 AI 可以帮助公司利用自己的专有数据来形成更好的产品或服务。[2023/5/12 14:59:43]

微软最近推出了一种名为 Kosmos-1 的多模型大语言模型 (MLLM)。 人工智能研究工作室 Alethea.AI 推出了 CharacterGPT,它可以从文本中生成字符。 两年前,Google AI 还发布了 MURAL:Multimodal, Multitask Representations Across Languages 模型,用于图文匹配。 它部署了应用于图像-文本对的多任务学习,并结合了涵盖 100 多种语言的翻译对。

虚拟现实与元宇宙产业联盟《可信虚拟人生成内容管理系统技术要求》标准制定工作启动:金色财经报道,据中国信通院公众号,面对加速发展的市场趋势以及伴生而来的风险和挑战,以可信原则指导技术产业发展成为推动虚拟人安全可控、可持续、高质量发展的必经之路。依托虚拟现实与元宇宙产业联盟(XRMA),中国信息通信研究院牵头,商汤科技主编,OPPO、百度、北方工业大学、二六三、VIVO、虚拟动点、优链时代、Soul APP等作为首批参与单位,共同发起《可信虚拟人生成内容管理系统技术要求》标准制定工作,并已通过XRMA联盟内立项评审。(证券时报)[2023/3/13 13:00:15]

然而,马利克说,“它有两个基本的限制,包括可以获得多少数据——是否有办法避免需要注释数据和缺乏计算能力——尽管预计未来会增加 ”。

Mallick 是 IIT-Kharagpur 校友,也是加州计算机视觉公司 Big Vision 的创始人。 早在 2006 年,当没有人真正了解 AI 或其巨大潜力时,Mallick 与他人共同创立了 TAAZ——一家为美容和时尚行业创建视觉和学习解决方案的计算机视觉公司。

首个AR NFT生成器Hololoot完成私募和种子轮融资,Enjin等参投:12月13日消息,首个 AR NFT 生成器项目 Hololoot 已完成私募和种子轮融资(具体金额暂未披露),Enjin、Ferrum Network、Otis Capital、Legion Ventures 等参投。据悉,由于目前 NFT 和元宇宙的入门成本过高,Hololoot 希望把 NFT 和元宇宙导入全球近 10 亿部支持增强现实(AR)的设备,以推动大众接触元宇宙和 NFT。[2021/12/13 7:35:35]

OpenCV 是一个开源计算机视觉和机器学习软件库,由英特尔于 1999 年创立。英特尔前计算机视觉工程师 Gray Bradsky 与主要来自俄罗斯的工程师团队开发了它。 他在英特尔工作期间开发了 OpenCV 的第一代迭代。 2002 年,他们发布了该软件的 0.9 版开源版本。

动态 | 智能合约技术提供商UMA在以太坊测试网络推出合成代币生成器:据The Block消息,智能合约技术提供商UMA推出一个平台,可以创建追踪“任何东西”价格的代币,从外汇汇率到股票价格。UMA联合创始人Allison Lu在伦敦DEFI峰会上宣布,该平台被称为合成代币生成器(Synthetic Token Builder),可以在以太坊测试网络Rinkeby上使用。Synthetic Token Builder接受DAI作为抵押品,并允许用户铸造遵循各种价格指数的代币。用户也可以交易这些代币,而其抵押品价值会根据价格指数变化。[2019/9/12]

该公司最近推出了两门新课程,作为其“Kickstarter 活动”的一部分,内容涉及如何使用 AI 高效地创作艺术。 第一门课程《人人都能 AI 艺术生成(AI Art Generation for Everyone)》不需要任何 AI 或编程背景,而第二门课程《高级 AI 艺术生成(Advanced AI Art Generation》则需要基本的编程知识。

AI 生成的艺术有能力彻底改变艺术世界并发掘未开发的可能性。 然而,它也带来了盗版和版权侵权的复杂挑战,引发了人们对所有权和知识产权的担忧。

最近,像 Midjourney 和 Stability AI 这样的图像生成平台因使用艺术家的作品来训练他们的生成 AI 算法而被起诉,激怒了艺术家社区。 与此同时,Shutterstock 通过引入自己的 AI 工具采取了更负责任的立场,与 Getty Images 形成鲜明对比的是,Getty Images 禁止在生成 AI 艺术作品中使用其照片。

Mallick 博士将 YouTube 早年与版权威胁的现状相提并论。 他说,与 YouTube 类似的解决方案,由像谷歌这样的大公司参与进来,谈判交易并向版权所有者付款,可以在这里发挥作用。

OpenAI 广受欢迎的聊天机器人 ChatGPT 在不到三个月的时间里获得了超过 1 亿用户,使其成为家喻户晓的名字。 截至 2023 年 2 月,ChatGPT 的每日访问量超过 2500 万次。 但与 ChatGPT 相比,文本-图像模型(如 OpenAI 的 DALL-E 或 StabilityAI 的Stable Diffusion)的采用率存在明显差距。

Mallick 解释说,ChatGPT 拥有如此高采用率的主要原因之一是因为写作能力是每项工作所需的主要技能,无论你是程序员、作家还是社交媒体经理。 在 OpenAI 和贝恩公司的帮助下,甚至可口可乐也在使用生成式 AI 进行营销。

此外,随着研究人员结合不同的技术和方法,生成式 AI 正在巩固并变得更加复杂。 通过利用 NLP 和计算机视觉的优势,Stable Diffusion 模型代表了生成式 AI 向前迈出的重要一步。

传统的生成模型,如生成式对抗网络 (GAN),由于缺乏语言概念,因此理解世界的能力有限。 虽然 GAN 可以创建逼真的图像,但它们需要使用特定的数据集进行训练,例如人脸或猫的图像。

相比之下,Stable Diffusion 模型利用从文本数据中获得的知识来理解单词如何聚集在一起并与世界相关。 这使他们能够在不依赖特定数据集的情况下生成更复杂和多变的图像。

他说,“Stable Diffusion 模型是生成式 AI 的重大进步,正是因为它们不依赖监督学习。 通过利用从无监督学习中获得的知识,这些模型可以生成复杂多样的图像,而无需手动标记数据,从而使其更加灵活。”

Kyle

个人专栏

阅读更多

金色财经 善欧巴

金色早8点

Arcane Labs

MarsBit

Odaily星球日报

欧科云链

深潮TechFlow

BTCStudy

澎湃新闻

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

地球链

SOL区块链:Epic激战Steam GameFi在Web2夹缝求生

在传统游戏领域,平台与发行渠道极为重要,就算是由只有几个人的独立工作室完成的游戏,只要得到了大型发行商的青睐,就很容易在 Steam 这样的平台上得到推荐,出现在玩家们的视野里.

[0:0ms0-1:74ms