热搜词:

维他动力余轶南:现在是机器人产业的春秋时代

当科技的浪潮拍打时代的堤岸,我们站在怎样的坐标上眺望未来?

机器人产业的发展阶段,恰似春江水暖时节的微妙变迁;而突破智能涌现的瓶颈,则是人类与机器共同谱写的壮丽诗篇。此次混沌的演讲,明星机器人产品团队维他动力创始人兼 CEO、混沌学园 6 期同学余轶南博士以深邃的洞察为 "如何攀登科技珠峰,探索通用机器人的产品化之路 "勾勒出清晰的轮廓。

余轶南博士,2012 年任百度深度学习研究院高级科学家,2015 年创业地平线,曾任地平线智能驾驶总裁,2024 年 12 月创立维他动力。

为什么说当前是机器人产业发展的黄金窗口期?技术范式变革将如何重塑产品逻辑?在百家争鸣的 " 春秋时代 ",企业应该选择怎样的技术路线?这些困扰行业的核心问题,在余轶南博士的演讲中都得到了深入解答。

"Concept is cheap(概念不值钱),我们需要的是 the product(真正的产品)"。余轶南博士的演讲直击行业本质,从技术演进规律出发,通过阐述 AI 2.0 时代大终端产品必须具备的两大特征—— " 万元级产品单价、千万台年出货量规模 ",拉开了这场思想碰撞的关键一角。

如何定义具有革命性的 " 大终端 "?

纵观过去 10 至 20 年的发展历程(前 AI 1.0 时代、AI 1.0 时代),在软件、人工智能和算法技术领域,可以观察到一个显著的演进模式:这些技术往往会经历两个阶段。第一阶段,它们首先在互联网领域引发革命性变革,重塑整个数字生态和应用范式;随后进入第二阶段,这些技术会突破虚拟世界的边界,向物理世界延伸,从而催生更广泛的社会变革。值得注意的是,在第二阶段,通常都伴随着新一代终端设备的诞生。

这一演进轨迹在科技发展史上清晰可辨:从大型计算机到个人电脑,从功能手机到智能手机,再到如今蓬勃发展的智能电动汽车。那么,在 AI 2.0 时代来临之际,下一个具有划时代意义的终端设备将是什么?我们又该如何定义一个真正具有革命性的 " 大终端 "?

我认为需要满足两个关键条件:第一,产品单价应在万元以上,而非几十或几百元的低价值品类;第二,年出货量需达到数千万至上亿规模,这种量级才能真正推动产业成熟。

通用机器人的历史机会:天时、地利、人和

产业的成熟需要几个必须条件。

首先我认为算力、电力和智力等核心能力成熟,奠定了今天机器人行业爆发的最核心基础。

回顾过去十年,我们可以看到。第一,电池的能量密度,用 10 年的时间提高了一倍左右,而且这个速度还在加快;第二,算力方面,目前仍然遵循摩尔定律,而且比过去的 CPU 时代更快一点,大概每 18 个月翻一倍;第三,AI 模型本身的进步也至关重要。全球数百万算法工程师持续优化模型架构,这形成了一个规律:最优模型的性能密度大约每 100 天提升一倍。这意味着,100 天后仅需当前一半的算力即可实现同等模型的性能。

同时,技术的范式也在不断演进;从早期的模块化设计,到端到端架构,再到如今的多模态大模型范式;

除了模型范式,训练方法同样经历了显著跃迁——从需要很多人工标注的监督学习,到大模型环境下的无监督预训练,直至当下,基于模仿学习、强化学习和世界模型的训练架构。这些突破性进展,都密集发生在短短十年间。

与此同时,需求侧也在变化。以我国市场为例:人口老龄化进程加速,劳动力人口占比持续走低,家庭服务消费比重逐年攀升。数据显示,65 岁以上老年群体对居家服务的需求正呈指数级增长。另一方面,55% 的年轻消费群体更倾向于 " 付费省时 "。对这些年轻消费者来说,过去亲力亲为的事务,如今更愿通过购买服务解决。

结合这些趋势,我们正面临通用机器人的历史性机会,而这个机会可以总结为天时、地利、人和。

"天时"是指行业成熟度的提升,包括电池能量密度、算力、模型优化等技术的进步。"地利"是中国拥有庞大的 AI 人才、互联网人才、制造业基础和完整供应链。" 人和 " 优势则表现为双重驱动:一方面是中国庞大的人才红利,另一方面是快速扩张的市场需求。

当这些关键要素形成共振,就创造了机器人产业发展的黄金窗口期。

机器人产业正处于 " 春秋时代 "

我们必须清醒认识到当前机器人产业所处的发展阶段,才能制定正确的战略,并明晰制定什么样的策略才能推进业务的发展。我的判断是:机器人产业正处在 " 春秋时代 ",而且是春秋早期。

什么是春秋时代?春秋时代是一个百家争鸣、百花齐放的时期。它跟今天有点相似:各种技术路线和商业观点都在激烈碰撞,没有绝对的对错之分,每个参与者都在积极输出自己的认知框架。可能再过几年回头看,今天的很多观点既可能被证实,也可能被证伪。

5 到 10 年后,这个阶段可能过渡到 " 战国时代 "。届时没有人再进行观点的争论,行业格局会逐渐明朗,所有战争都以一方胜利、一方失败告终。

今天的电动汽车 / 智能汽车行业已经明确进入了战国时代,但机器人行业还处在春秋时代。

在技术发展的宏大周期中," 春秋时代 "意味着创新技术和应用的爆发期。由于行业里每个人的想法和方向各不相同,各家企业都在不同领域试错,这种局面往往会催生大量创新。

以手机行业 1990-2010 年的演进为例:智能手机的完整概念早在 1992 年就已形成,但受限于当时的技术条件无法实现。在这关键的 20 年间,市场涌现出各类终端产品:手机、PDA、Game Boy 游戏机等,它们各自在细分赛道持续演进。直到 2007 年 iPhone 横空出世,才完美整合了这 20 年的技术积累和市场探索。

产品才是推动产业发展的关键锚点

Concept is cheap(概念不值钱),我们需要的是 the product(真正的产品)。VITA 的产品观是 " 拒绝完美主义 ",正如所说乔布斯,"Real   Artists   Ship"(真正的艺术家就要交付作品)。无论想法多么宏大、愿景多么美好,关键是要脚踏实地拿出产品,即使不完美,即使离理想还有差距,也要先推向市场,让用户告诉我们什么是对的。

因此我们需要打造一个以产品作为核心锚点的闭环链条。链条里包括:用好的产品去推动好的商业发展;有了好的商业、好的财务基础以后,才能够去吸引更好的人才;有了更好的人才,才能去不断地构建更深的技术的护城河,然后进一步推动整个产品的发展。

归根结底,产品才是推动产业发展的关键锚点。

VITA 的技术观

在喧嚣的市场环境中,我们每天都能听到各种概念,但真正有竞争力的产品,绝不是靠一个BUZZWORD(热门技术词汇)或某个技术单点突破就能定义的。

优秀的产品从来不是一蹴而就的,而是由一系列工程化积累、苦活、脏活、累活堆叠而成。构建真正的技术壁垒,必须同时跨越两道门槛:第一,大规模的工程化积累;第二,面向用户需求和场景时对每一个细节的深度打磨。

每个时代都有其技术主题,而认清当前技术发展的真实阶段至关重要。如果连这个基本判断都做不到,就很容易陷入盲目投入的困境。

我们认为,技术的演进通常可以划分为两个主要阶段:

第一个阶段是原理性技术的爆发期。这个阶段主要由实验室和科研机构主导,他们探索出新的技术方案和技术原理,为整个行业指明技术产品化的可能性。

第二个阶段是产业化落地期。在基础原理突破之后,产业界通过工程实现、产品设计和市场营销等手段,将这些技术转化为成熟的产品。

十年前,当 AI 1.0 到来的时候,智能家居、人脸支付、人脸识别、语音识别等技术,其实已经开始了产品化;而城市智驾、高速辅助驾驶等,还处于尚在研究的阶段。

如今,这些技术曲线都实现了明显右移。例如 ADAS 系统在新车型中的渗透率已达 60-70%,许多 AI 1.0 时代的实验室技术,已被大规模地应用在实际的产品上。

反观机器人的技术,包括四足(机器人)、夹爪、双足(机器人)、灵巧手等,目前都还处于比较早期的阶段。距离工程化技术、产业发展,还存在着巨大的差距。而这个差距,也就是如何从原理性技术过渡到工程化技术,恰恰是产业发展最大的机会点。

如何让机器人实现 " 智能涌现 "?

所以下一个关键问题是:如何抓住这个机会点?很重要的一点是数据。

我们可以参考大语言模型(large language model)的发展路径。大模型之所以能取得突破,是因为它吸收了全互联网的数据,并且不分语言种类,只要是能表达成文字序列的内容都作为自身的数据,包括图片、视频、音频等。这种海量、多样的数据,他们聚集为一体的时候,就产生了 " 智能涌现 " 的现象。

由此我们可以思考:什么样的场景能产生足够丰富的数据,让机器人也实现智能涌现?

我们的看法是,必须让机器人在物理世界中探索,才能获得足够多样且持续的场景数据。这其中最重要的两个场景就是户外和家庭环境。

户外的核心能力在于机器人的移动能力,室内的核心能力在于机器人的操作能力。

与此同时,人机交互界面也发生了根本性变革:从传统的键盘、鼠标、触屏,进化到人与机器人直接对话的交互方式(NUI:Natural User Interface)。

这些正是当前机器人技术与过去产品最本质的区别。

因此,寻找通向通用机器人的第一块拼图,我们的方法是从垂直场景切入,然后用平台化技术持续迭代,最后让产品从专用逐步走向通用。

在技术选择上,我们倾向于选择原理性更成熟的技术。在数据方面,我们希望场景和数据更加发散。在用户场景上,我们选择具有高付费能力和意愿的场景,来支撑商业化变现。通过技术、数据、用户场景的闭环迭代,最终实现通用机器人。

通用人工智能是珠峰,让我们顶峰相见

通用机器人很可能是人类科技史上的 " 珠峰 "。对于所有场景,可以从两个维度来评估:1、任务从简单到复杂;2、场景的失效成本从低到高。

通过这两个维度,我们可以把所有技术和产品放在一个二维平面上进行分析。比如用大模型写文件时,即使写得不好,影响也不大,因为有人工审核兜底(如 Chatbot、编程、学术研究)。这类场景虽然任务复杂度高,但对失误容忍度高。再比如自动驾驶,任何小失误都可能造成人身伤害甚至生命的损失,失效成本极高。

我们最终极的目标是希望机器人可以变成一个通用的机器人。所以我们需要找到一条路径——从今天已有的产品、已有的用户需求、已有的市场上,不断地去逼近。这时会有两条路线:一条路线从左边走过去,一条路线是从右边走过去。哪一条路线更对呢?我不知道,但现实是不断地技术迭代是降低眼前的产品技术难度的最佳方式。我希望不同的创业者通过不同的路径攀登珠峰,最终在顶峰相见。

VITA 的产品战略

为什么机器人难?为什么机器人比大模型其实要难?

原因在于大模型只提供建议,而机器人要完成交付,这是这两者之间最大的区别,而且也是他们之间价值和价格最大的区别。

VITA 的产品观是:" 机器人的核心价值,是随时随地提供高质量的服务,而且是面向人的高质量的服务。"

因此产品的战略上面,我们有几个核心的认知:第一,垂直应用优先;第二,优先成熟的原理性技术;第三,去物理世界获得多样性且持续长的时间长的场景,然后通过室内室外分布推进。

我们对于智能机器人的产品定义是,它需要有面向家庭和 C 端个人用户的产品设计,安全可靠存在于我们的生活空间里,它可以非常智能的去移动,用户可以跟它有很好的交互。

仔细来说,智能的移动是指全地形的移动能力。也就是说,我们能走到什么地方,我们的机器人就应该能走到什么地方。其次,是突破性的交互。一个机器人并不只是依赖于它自身去完成一些任务,而应该更像一个大的单品平台,如此一来,它才有可能构建起一个巨大而且丰富的的平台属性。

我们想要打造的机器人将拥有个性化的外观设计、可更换的配件、丰富的色彩和多样的材质选择,同时面向所有开发者开放接口。我们期待能与行业伙伴一起,共同构建一个围绕机器人的丰富生态系统。

我们公司的名字叫 " 维他动力(Vita Dynamics)"," 维他(Vita)" 象征着智能生命," 动力(Dynamics)" 则代表了机器动力。这两个词的结合体现了我们的核心理念:通过创新 AI 研发,创造生活空间的智能伙伴。

攀登科技珠峰的道路注定崎岖,但当我们回望来路,那些在 " 春秋时代 " 播下的种子,终将在 " 战国时代 " 绽放成改变世界的模样。

尾声:

从定义下一代终端标准,到分析产业发展阶段特征,再到提出 " 通用化 " 的实践路径,余轶南博士的分享不仅明确了机器人作为 " 科技珠峰 " 的战略地位,更给出了切实可行的攀登路径。对于每一位躬身入局的探索者而言,这些洞见犹如指间沙金,闪耀而珍贵。

混沌时代,每一个创业者都是洞穴中的囚徒。

终其一生,我们都在努力走出洞穴。

凯文 · 凯利、彼得 · 圣吉、尤瓦尔 · 赫拉利、张首晟、周其仁、俞敏洪、左晖……

混沌老师用 600 多堂课为创业者支起火把,照亮前路。

扫描下图,和混沌一起早半步认知这个世界: