热搜词:

将多模态技术与汽车手机等领域结合,让AI成为更多人的日常“伙伴”

“模速空间”现场,上海市人工智能战略咨询专家委员会委员印奇向总书记演示了人工智能(AI)在民生服务场景中的最新应用:用户打开手机上的AI超级助手,只需描述“我的胃不舒服”,系统就能推荐药品。家里老人倘若视力不好,手持药盒发起视频通话,可以直接询问画面中的是什么药,AI助手可以准确识别药盒上的图文信息,告诉用户这是咽炎片,可以用于慢性咽炎引起的咽干、咽痒、刺激性咳嗽。

印奇说:“基础大模型,本质上是整个AI产业链最重要的一环。便捷功能背后,由国产多模态大模型提供技术支持。”印奇向总书记汇报了该模型将图像、文字、语音三种模态有效融合,可为用户提供高智商、高情商的视频对话交互体验,总书记对上海积极发展人工智能取得的实效给予肯定。

这一产品出自阶跃星辰,一家专注基础大模型技术的人工智能独角兽企业,刚满两周岁。去年曾在10个月内连发11个模型,今年年初以“6天6款模型”迎新。“多模态”是其特长,覆盖了语音识别、语音生成、图像及视频生成等全面能力。

“工具”也是“伙伴”

多模态技术,指的是人工智能系统能够同时处理、理解和生成多种类型数据的技术。就好比为智能体加持了一套“感官系统”,让它像人类一样观察世界、倾听需求;推理能力则像大脑皮层,对感知到的数据进行逻辑加工和深度决策。

二者的协同,让AI不再停留于机械应答,而是进阶为能够提供情绪价值的“读心者”——既能从药盒的图文细节中识别慢性咽炎片的用途,也能在视频对话中捕捉老人语调的迟疑。这种“感官 认知”双重进化,正让AI从“工具”成为“伙伴”,在复杂的生活场景中“察言观色”。

“我们认为有这样好的模型,后续跟不同的硬件终端结合,就能做出非常好的应用。”阶跃星辰创始人、CEO姜大昕说,目前,阶跃星辰已经与汽车、手机、具身智能、IoT(物联网)等领域结合,推出新产品。比如,在2025上海车展上,企业与吉利汽车合作,推出最新智能座舱体验;与OPPO等头部手机厂商合作,在最新旗舰机型上深度集成阶跃多模态大模型。

同时,阶跃模型也注重多模态语音交互,已经可以支持粤语、四川话、上海话等多种方言。

起步早、生态好、政策足

在新一代AI大模型领域,有算力、系统、数据、算法“铁人四项”的说法。“模都”上海,目标很明确:筑牢AI底座,催化产业“核爆”。

姜大昕感到,上海人工智能产业有3个特点:起步早。上海很早就布局了AI赛道,2017年确立了发展人工智能产业的愿景,2018年首届世界人工智能大会举办,要远早于这一轮生成式人工智能热潮。同时,坚持一张蓝图绘到底,持续构建起产业先发优势。

生态好。以阶跃星辰所在的徐汇西岸为例,目前已汇聚“模速空间”数十家人工智能企业和科研机构,形成了方圆一公里集政、产、学、研、用为一体的AI垂直产业生态,“上下楼就是上下游”,让大模型企业能快速找到合作方、对接资源、获取服务。

政策足。市、区两级政府围绕人工智能产业发展关切,相继出台了一系列政策举措,总的来说“诚意足、力度大、很解渴”,涵盖了技术创新、算力资源、语料数据、场景应用、融资服务等方方面面。

下一个节点,阶跃星辰希望将最好的AI技术与最重要的终端结合,比如手机和车。“这是我们日常最常用到的消费电子和生活硬件载体,所以将在人们触手可及的载体上发挥更大价值。”