|
本文作家:龙玥 源头:硬 AI 东谈主工智能领域的战火正在从妄言语模子膨胀至一个更前沿的领域——能够通晓并模拟真什物理天下的"天下模子"(World Models)。而 xAI 已悄然加入这场竞赛,与谷歌和 Meta 等科技巨头同台竞技。 据英国《金融时报》10 月 12 日报谈,马斯克的初创公司 xAI 在本年夏天从芯片巨头英伟达聘用了东谈主工智英雄人,成心从事天下模子的研发。与依赖文本的妄言语模子不同,天下模子通过对海量的视频和机器东谈主数据进行检会,旨在掌合手真实天下的物理执法。 "将来的视频模子将变得和话语模子一样智能",谷歌盘考东谈主员在论文中说谈。英伟达上月曾经清楚,天下模子的潜在商场畛域可能接近现时各人经济的总量。 戎马先行:xAI 的游戏"奇袭"与机器东谈主野望 为了在这场竞赛中占据方寸之地,xAI 正在积极招兵买马。 公司已聘用了来自英伟达的两位 AI 盘考员 Zeeshan Patel 和 Ethan He,他们辞天下模子领域领有丰富告诫。英伟达凭借其用于创建和运行模拟的 Omniverse 平台,一直是该时候的勾通者。 知情东谈主士走漏,xAI 为天下模子计划的第一个交易化落点是游戏领域,用于生成可交互的 3D 环境。这一动态赶紧激发商场眷注,因为它不仅是 xAI 交易化旅途的明笃信号,也突显了天下模子看成下一代 AI 时候的远大后劲。 马斯克本东谈主也在应付平台 X 上说明,xAI 将在"来岁年底前发布一款出色的 AI 生成游戏"。永久来看,这些时候最终可能应用于机器东谈主的东谈主工智能系统。
xAI 的招聘信息也印证了其发展概念。公司正在为其" omni 团队"招聘图像和视频生成领域的时候东谈主员,薪资范围高达 18 万至 44 万好意思元,该团队勇猛于于"创造卓绝文本的神奇 AI 体验"。 此外,公司还在以时薪 45 至 100 好意思元招聘"视频游戏导师",以检会其 AI 模子 Grok 制作视频游戏。 范式逶迤:视觉模子的" GPT 时代" xAI 的高调入局,恰逢一个关节的行业预判浮出水面:将来的视频模子将变得和话语模子一样智能。谷歌最近的一篇论文指出,其视频模子 Veo 3 正展现出与妄言语模子(LLM)相似的"涌现才调"。 正如 LLM 通过"下一词元预计"的浅陋任务,最终学会了数学和创意写稿等罕见手段,视频模子通过"下一帧预计",也运行零样本(zero-shot)地解锁一系列令东谈主骇怪的才调,举例物体分割、边际检测和模拟用具使用等,而这些王人未经成心检会。
谷歌的盘考东谈主员 Jack Clark 在论文中写谈:"咱们以为,正如当然话语处理(NLP)从特定任务模子转向通用模子一样,机器视觉领域也可能通过视频模子发生不异的革新——一个‘视觉领域的 GPT-3 时代’。" 他们将视频逐帧生成的经由类比为话语模子中的"念念维链"(chain-of-thought),并称之为"帧链"(chain-of-frames),以为这使得视频模子能够逾越时空进行推理。 这一发现真义长远,它示意着通过发展更智能的视频模子,东谈主们约略能够赢得才调极强的机器东谈主"代理"(agent)。 出息与执行:不菲的本钱与"愿景"的缺失 尽管出息诱东谈主,但通往天下模子的谈路并非坦途。当今,该时候仍濒临远大的时候挑战,其中最主要的是为模拟真实天下寻找和处理宽裕检会数据的本钱极其不菲。 与此同期,业界也存在对 AI 作用的从容注视。热点游戏《博德之门 3》的修复商 Larian Studios 的刊交运用 Michael Douse 本周在 X 上清楚,AI 无法处治游戏行业的"大问题",即"勾通力和愿景"。 他补充说,行业需要的不是"更多由数学神态出产、经过步地学检会的游戏轮回",而是对天下更万般化的抒发。这代表了一种无数的不雅点:地谈的时候打破自身,并不行保证创造出能够果然打动东谈主心的交易家具。 尽管挑战重重,但 xAI 的入局无疑为天下模子的竞赛再添一把火。 AI 的焦点正不可逆转地从地谈的数字信息处理,转向对复杂物理执行的模拟与交互。视觉模子是否能复刻妄言语模子的色泽,迎来属于我方的" GPT 时代",不仅将决定下一代 AI 霸主的包摄,更可能重塑咱们与数字及物理天下的根蒂揣测。 本文来自微信公众号"硬 AI ",眷注更多 AI 前沿资讯请移步这里 |
Powered by 云开yun·体育全站app(kaiyun)(中国大陆)官方网站 登录入口 @2013-2022 RSS地图 HTML地图
Copyright Powered by站群 © 2013-2024