对话智源研究院院长王仲远:人工智能正加速从数字世界走向物理世界
moboyou 2025-06-12 13:11 8 浏览
每经记者:可杨 每经编辑:董兴生
6月6日,智源研究院在“2025智源大会”上发布“悟界”系列大模型,宣告其从“悟道”时代迈入“具身智能”探索阶段。
智源研究院院长王仲远在接受《每日经济新闻》记者在内的媒体采访时表示,“AI(人工智能)正加速从数字世界走向物理世界”,这是推动其战略升级的根本逻辑。
王仲远 图片来源:主办方供图
这一判断背后,是AI技术与应用边界的重构。当前,主流大模型大多聚焦在C端文本生成、语言对话等“数字智能”场景,而智源试图将AI推向更具挑战性也更具想象空间的“现实世界”——包括机器人、操作系统与世界模型的构建。在王仲远看来:“这个世界不需要那么多‘博士’,更需要能执行任务、能落地的AI。”
“具身智能”正成为下一场AI竞赛的起点。王仲远判断,具身智能的“小组赛”还没结束,远没有到“淘汰赛”。但谁能在这一新赛道率先跑通技术路径、突破数据瓶颈,谁或将定义人工智能的下一个十年。
从“悟道”到“悟界”,AI正迈入现实物理世界
“人工智能正加速从数字世界走向物理世界,这是我们对整个大的技术发展趋势的判断。”在采访中,王仲远以这句话点明了智源研究院由“悟道”大模型升级至“悟界”大模型背后的核心逻辑。人工智能技术正经历从以语言理解和推理为核心的“数字智能”,迈入与现实环境互动的“具身智能”阶段。
从早期的“悟道”系列到如今的“悟界”系列,智源研究院的战略转向并非突如其来,而是“水到渠成”。王仲远坦言:“我们认为人工智能最终要造福人类社会,要帮助大家摆脱繁琐的、重复的、简单的劳动,使得大家能够更多地享受生活,享受这个世界。”他进一步指出,大模型技术不应止步于文本生成、语言对话等C端应用,而应继续向现实世界渗透,服务实际场景。
在技术路径上,王仲远强调,目前整个大模型的发展基本上都还处在数字世界,尤其是C端应用,比如聊天工具、对话模型。“但我们也坚定地认为,这个世界并不需要那么多‘博士’。”在他看来,AI不应仅用于提升智能“学术型”表现,更应拓展其实际执行力,服务现实世界需求。
此次“悟界”系列模型的发布,正是在此背景下的延伸尝试。据介绍,“悟界”不仅继续强化了模型的推理能力,也尝试将AI从虚拟认知延伸至真实物理世界的感知与交互中。这一进程的核心技术支点,就是“世界模型”(World Model)的探索。
然而,目前“世界模型”尚无标准定义。王仲远坦言:“在全世界范围内,大家都还没有非常明确的定义。有些叫空间智能,有些叫时空智能,也有其他不同叫法。”智源内部将其理解为一种原生多模态世界模型,本质上是通过单一模型捕捉世界规律的尝试。这些规律不仅包括物理规则,也涵盖人与世界交互的机制,例如类脑神经系统中的模块化处理方式。
王仲远特别强调,他并不试图为世界模型下一个绝对定义,而是“代表我们对于使用人工智能探索世界的一种实践路径”。
具身智能赛道“小组赛”尚未结束,远没有到“淘汰赛”
在人工智能走出数字世界的过程中,如何构建“具身智能”成为研究核心。所谓具身智能,意指AI系统具备与现实物理世界交互的能力,能够在复杂环境中感知、规划、执行任务。
围绕机器人形态的选择,当前学界与业界依旧存在众多分歧。例如,有观点认为当下对人形机器人的热衷或许走错了方向,四足构型可能更实用。对此,王仲远表示:“具身智能不代表一定是人形机器人。”他指出,智源开发的RoboOS操作系统已经能够适配多种构型,包括机械臂、轮式、双足、四足等。
不过,王仲远并不否认人形机器人的长远价值。他认为,人类社会的基础设施是围绕人类构型打造的,从长远看,人形机器人更容易融入现有社会系统。此外,人形构型在数据训练上也更具优势。“我们做具身大脑模型时发现,人形构型更有利于利用现有视频数据学习,而四足机器人所需的数据更稀缺,获取难度更大。”
除了机器人形态,另一个具身智能的发展关键点是“大小脑协同框架”,即如何在AI系统中实现决策层与执行层的高效配合。王仲远介绍,智源推出的RoboOS便是实现大小脑融合的一次尝试。
不过,他同时指出,目前的技术仍远未成熟。“我的一个坚定观点是,具身智能的‘小组赛’还没结束,远没有到‘淘汰赛’。”王仲远认为,从长期趋势看,大小脑融合的模型是有可能实现的,可能需要五到十年,但绝不是今天,原因很简单,就是数据受限。当前的感知数据尚无法支撑统一模型的训练和泛化,这也直接限制了人工智能在多任务场景中的能力扩展。
王仲远认为,具身智能的最大挑战,是如何从专用任务逐步过渡到具备一定泛化能力,再发展为真正能够解决各种问题的通用系统。他指出,这正是AI从1.0(专用)迈向2.0(通用)的过程。
此外,王仲远也谈到具身智能研究的另一大困境——“数据难题”。他表示:“做具身模型,现在数据非常稀缺,我们采集和补充回来的也比较少。”这一问题不仅影响训练,还限制了模型在感知层和决策层之间的协同能力。
“真实世界的数据肯定重要,但它是不是足以训练出一个有价值的模型,这在学术界是有争议的。”王仲远表示,具身智能的突破路径,或可借鉴当前大模型发展的技术演进逻辑,即在大规模已有数据的基础上进行能力预训练,随后结合少量真实世界数据,通过强化学习不断迭代模型能力。
他认为,这种“基础模型+强化学习”的技术路线,有望在物理世界中同样奏效。当前大模型的发展已经验证,基础能力达到一定水平后,借助强化学习可以进一步激发智能表现。“所以我们认为,具身智能或者物理世界的AI很可能也会有类似的技术路线。”
每日经济新闻
相关推荐
- linux下C++ socket网络编程——即时通信系统(含源码)
-
一:项目内容本项目使用C++实现一个具备服务器端和客户端即时通信且具有私聊功能的聊天室。目的是学习C++网络开发的基本概念,同时也可以熟悉下Linux下的C++程序编译和简单MakeFile编写二:需...
- Workerman的使用(workerman教程)
-
Workerman是什么?Workerman是一款纯PHP开发的开源高性能的PHPsocket服务框架。Workerman不是重复造轮子,它不是一个MVC框架,而是一个更底层更通用的socket服...
- 百万人在线的直播间实时聊天消息分发技术实践
-
本文由融云技术团队原创分享,原题“聊天室海量消息分发之消息丢弃策略”,内容有修订。1、引言随着直播类应用的普及,尤其直播带货概念的风靡,大用户量的直播间场景已然常态化。大用户量直播间中的实时互动是非常...
- 省钱兄JAVA 直播源码开发(省钱快报源码)
-
在现代社会,直播已经成为一种流行的社交和商业形式。越来越多的人通过直播平台展示自己的才艺、分享生活、进行教学,甚至进行产品销售。随着直播行业的发展,许多人希望能够参与到这一领域中,尤其是开发自己的直播...
- 编程革命彻底爆发,OpenAI最强智能体上线ChatGPT
-
OpenAI最强AI编程智能体真的来了!Codex震撼上线,由o3优化版codex-1加持,多任务并行,半小时干完数天软件工程任务。从今天起,AI编程正式开启新时代!刚刚,GregBrockman...
- Springboot下的WebSocket开发(springboot websock)
-
今天遇到一个需求,需要对接第三方扫码跳转。一种方案是前端页面轮询后端服务,但是这种空轮询会虚耗资源,实时性比较差而且也不优雅。所以决定使用另一种方案,websocket。以前就知道websocket,...
- epoll聊天室的实现(epoll使用详解(精髓))
-
1.服务端a.支持多个用户接入,实现聊天室的基本功能b.使用epoll机制实现并发,增加效率2.客户端a.支持用户输入聊天消息b.显示其他用户输入的信息c.使用fork创建两个进程子进程有...
- 自建娱乐聊天室—一起听歌吧!属于自己的交友聊天房
-
前言该项目算是老项目了,但最近粉丝群里的友友都让我写一下,那就写一下吧。项目类似于现在各大直播平台的聊天室,但又不像。它更加的自由开放,没有平台的礼物以及各种限制,如果你有来自五湖四海的朋友,想一起聊...
- 定时任务框架选型Quartz/Xxl-Job(定时任务调度框架)
-
以前公司平台中集成了定时任务功能,但平台内部实现比较简单,使用方式有些受限,比如说无法跟踪定时任务执行状态,无法自动解决集群状态下的任务争抢问题,因此考虑升级一下任务实现方式,搜集一番后,Quartz...
- 【推荐】一款开源免费的 ChatGPT 聊天管理系统,支持PC、H5等多端
-
如果您对源码&技术感兴趣,请点赞+收藏+转发+关注,大家的支持是我分享最大的动力!!!项目介绍GPTCMS是一款开源且免费(基于GPL-3.0协议开源)的ChatGPT聊天管理系统,它基于先进的GPT...
- 现在页面实时聊天都使用Websocket技术实现吗?
-
是的,现在实现页面实时聊天主要使用Websocket,在此之前,还有其它的一些技术,比如:AJAX轮询、FlashXMLSocket等。其中Ajax轮询就是定时向服务器发起请求,例如1秒钟请求一...
- 一对一源码开发,九大方面完善基础架构
-
以往的直播大多数都是一对多进行直播社交,弊端在于不能满足到每个用户的需求,会降低软件的体验感。伴随着用户需求量的增加,一对一直播源码开始出现。一个完整的一对一直播流程即主播发起直播→观看进入房间观看→...
- 揭秘PHP8.4的新特性,帮助您提高开发效率
-
PHP8.4作为一次重大版本更新,引入了多项提升开发效率和代码性能的新特性,以下是核心功能的总结:一、属性钩子(PropertyHooks)-功能描述:允许通过语法直接为类的属性定义get...
- 【验证码逆向专栏】某验三代、四代一键通过模式逆向分析
-
声明本文章中所有内容仅供学习交流,抓包内容、敏感网址、数据接口均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关,若有侵权,请联系我立即删除!本文章未经许可禁止转载,禁止任...
- 如何申请SourceForge免费PHP空间(国内免费php空间申请)
-
SF.net,即Sourceforge.net,是国外一个开源软件分享及管理平台,也是全球最大开源软件开发平台和仓库。Sourceforge.net为广大的开发者提供了软件发布平台,同时又提供了个人免...
- 一周热门
- 最近发表
-
- linux下C++ socket网络编程——即时通信系统(含源码)
- Workerman的使用(workerman教程)
- 百万人在线的直播间实时聊天消息分发技术实践
- 省钱兄JAVA 直播源码开发(省钱快报源码)
- 编程革命彻底爆发,OpenAI最强智能体上线ChatGPT
- Springboot下的WebSocket开发(springboot websock)
- epoll聊天室的实现(epoll使用详解(精髓))
- 自建娱乐聊天室—一起听歌吧!属于自己的交友聊天房
- 定时任务框架选型Quartz/Xxl-Job(定时任务调度框架)
- 【推荐】一款开源免费的 ChatGPT 聊天管理系统,支持PC、H5等多端
- 标签列表
-
- 外键约束 oracle (36)
- oracle的row number (32)
- 唯一索引 oracle (34)
- oracle in 表变量 (28)
- oracle导出dmp导出 (28)
- oracle两个表 (20)
- oracle 数据库 字符集 (20)
- matlab化简多项式 (20)
- 多线程的创建方式 (29)
- 多线程 python (30)
- java多线程并发处理 (32)
- 宏程序代码一览表 (35)
- c++需要学多久 (25)
- css class选择器用法 (25)
- css样式引入 (30)
- css教程文字移动 (33)
- php简单源码 (36)
- php个人中心源码 (25)
- php小说爬取源码 (23)
- 云电脑app源码 (22)
- html画折线图 (24)
- docker好玩的应用 (28)
- linux有没有pe工具 (34)
- mysql数据库源码 (21)
- php开源万能表单系统源码 (21)