449阅读
2回复

[智能应用]开箱即用、全球通用：智驾界的“万能钥匙”终于出现了 [复制链接]

上一主题下一主题查看指定楼层

在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖: 185815

金币: 665178

道行: 20030

原创: 769

奖券: 510

斑龄: 0

道券: 30

获奖: 0

座驾

设备

摄影级

在线时间: 23576(小时)
注册时间: 2012-06-21
最后登录: 2026-05-30

只看楼主倒序阅读楼主发表于: 04-26

— 本帖被兵马大元帅执行加亮操作(2026-04-29) —

北京车展首日，卓驭科技正式推出了行业首个原生多模态基础模型，围绕“移动物理AI”，让智能驾驶将不再局限于乘用车领域，商用重卡、物流车、Robotaxi，甚至是车载无人机，都能用上这一套移动物理AI。
雷科技/电车通收到卓驭的体验邀请，能在北京车展展馆外抢先感受搭载这套原生多模态基础模型的红旗HS6，在北京市区路段的真实表现。

图源：电车通摄制
据官方介绍，这个模型在底层完成对物理世界通用规律的预训练，支持视频、文本、动作、语音、地图等多模态信息统一输入。由于所有模态均在统一框架下完成训练，语义翻译带来的延迟与信息损耗被消除，其最终目标是做到跨垂类开箱即用、全球零泛化或少泛化。
以下是电车通的体验分享。
上车后的第一段路，是展馆外围的主干道。路面宽阔、标线清晰，车流虽然密集但秩序良好。这套搭载11V1L1R感知方案（含激目2.0）和Thor-U芯片的系统，在这一简单场景下显得游刃有余，跟车距离控制得恰到好处，加减速线性自然。

图源：电车通摄制
真正让人提起精神的，是第二段路——展馆背后的狭窄小路。
这样的路况尤为真实，双向单车道窄路两侧停满了车，对向不时有来车需要错位通行，电动车和外卖骑手在车缝中灵巧穿梭，偶尔还有行人从路边停靠的车辆缝隙中突然探出。面对这些场景，许多智驾系统早已束手无策。
面对一条被违停车辆压缩到仅剩一车宽的窄道，系统以一个干脆的超车动作绕行前车，并没有像许多系统那样犹豫不决地原地“思考”几秒，整个过程从减速、观察、转向到加速一气呵成，电车通（ID：dianchetong233）坐在后排几乎感受不到任何顿挫或者迟疑。

图源：电车通摄制
这样的流畅表现，其实已经呈现出原生多模态基础模型和常规VLA路线的本质区别。
VLA模型本质是各种技术拼接后的结果，视觉先看懂，翻译给语言，语言想明白，再转译成动作，有点像人类思考问题的过程，我看到前面有障碍物，思考这是什么，然后做出怎样的决策。
原生多模态基础模型则不同，视觉、语言、动作在底层就完成了联合预训练，消除了语义翻译带来的延迟与信息损耗，从而直接就能做出反应。

图源：电车通摄制
有一点让电车通印象深刻，就是车辆准备右转时，此时有一辆电动车从车辆右侧直行超过，要是以往的智驾系统，很可能会急刹车，但卓驭这套大模型，只是微微降低车速，算准时机就通过，从容得像十年驾龄的老司机。
要是在几年前，智驾系统考虑到安全性，在这种情况下肯定会突然急制动。如今这个表现，已经与老司机的驾驶习惯基本一致。

图源：电车通摄制
稍显遗憾的是，虽然此次体验已经特地选择了展馆附近比较窄的道路，但旅途没有遇到太多复杂路段，没办法将系统的大部分能力展现出来。
试驾结束之后，电车通与现场的技术人员交流后了解到，这套原生多模态基础模型通过量化蒸馏技术，可以适配从高通SA8650到地平线J6M等中高算力平台，从而支持乘用车、商用车、物流车等多垂类部署。据规划，这套系统将在今年8月达到量产状态。
对于智驾系统应用在商用车和物流车上，电车通（ID：dianchetong233）十分期待。

图源：电车通摄制
一方面，为了多挣碎银几两，货车司机常常需要长时间驾驶，智驾系统能有效减轻他们的驾驶负担，降低疲劳驾驶的风险，提高运输效率。另一方面，物流车的配送任务繁重，智驾系统可以实现更精准的路线规划和调度，减少配送时间和成本。
由此看来，卓驭原生多模态基础模型的长远价值得以充分体现。

山庄提示：道行不够，道券不够？---☆点此充值☆

我有我可以

在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖: 185815

金币: 665178

道行: 20030

原创: 769

奖券: 510

斑龄: 0

道券: 30

获奖: 0

座驾

设备

摄影级

在线时间: 23576(小时)
注册时间: 2012-06-21
最后登录: 2026-05-30

只看该作者沙发发表于: 04-26

申请VIP---在山庄畅通无阻还送FTP单独下载账号!

智驾界"万能钥匙"揭秘
您提到的这款"开箱即用、全球通用"的智驾产品，是卓驭科技在2026年北京车展上正式推出的行业首个原生多模态基础模型
。

📋 核心亮点
特性    说明
技术路线    原生多模态基础模型（非VLA拼接方案）
感知方案    11V1L1R（含激目2.0）+ Thor-U芯片
多模态输入    视频、文本、动作、语音、地图统一框架
量产时间    2026年8月
适配平台    高通SA8650到地平线J6M等中高算力平台
🚗 应用场景突破
这套系统不再局限于乘用车，可广泛应用于：

✅ 商用重卡
✅ 物流车
✅ Robotaxi
✅ 车载无人机
🎯 技术优势
传统VLA模型：视觉→语言→动作，多环节翻译，存在延迟和信息损耗

卓驭原生多模态模型：视觉、语言、动作在底层完成联合预训练，消除语义翻译延迟，直接做出反应，表现接近十年驾龄老司机

💡 实际体验
试驾中，系统在狭窄道路（仅一车宽）场景下，能干脆超车绕行，无犹豫；遇到电动车从右侧直行超过时，仅微微降速，算准时机通过，而非急刹车——这与传统智驾系统的安全保守策略形成鲜明对比。

🔮 行业意义
这套系统通过量化蒸馏技术，可适配多种算力平台，支持多垂类部署，预计未来将大幅降低商用车和物流车的驾驶负担，提高运输效率。

如何不发帖就快速得到金币和道行

我有我可以

在线jjybzxw

UID: 551814

精华: 0
职务: 超级斑竹
级别: 得道成仙

发帖: 253262

金币: 953669

道行: 2006

原创: 2471

奖券: 3665

斑龄: 46

道券: 1613

获奖: 0

座驾

设备

摄影级

在线时间: 52969(小时)
注册时间: 2008-10-01
最后登录: 2026-05-30

只看该作者板凳发表于: 04-26

电车通的体验分享为我们提供了卓驭科技在北京车展上推出的原生多模态基础模型的实际表现情况。以下是对这次体验的总结和分析：

1. 技术特点：
原生多模态基础模型在底层完成对物理世界通用规律的预训练，支持视频、文本、动作、语音、地图等多种信息的统一输入。
该模型消除了语义翻译带来的延迟与信息损耗，能够实现跨垂类开箱即用、全球零泛化或少泛化。

2. 实际表现：
在宽阔、车流密集但秩序良好的主干道上，系统表现出色，跟车距离和加减速控制自然。
在狭窄小路和复杂交通环境下，系统能够流畅地处理各种情况，如超车、错位通行等，没有出现犹豫或顿挫。

3. 与传统VLA的区别：
传统VLA模型需要经过多个步骤进行信息处理和决策，而原生多模态基础模型则在底层完成了联合预训练，能够直接做出反应。

4. 驾驶体验：
系统在右转时遇到直行电动车，能够像经验丰富的司机一样从容应对，微微降低车速后算准时机通过。

5. 未来应用：
该模型预计将在8月达到量产状态，并能够适配从中高算力平台，支持乘用车、商用车、物流车等多垂类部署。
在商用车和物流车上的应用将减轻司机负担，降低疲劳驾驶风险，提高运输效率，并实现更精准的路线规划和调度。

6. 期待与展望：
电车通对智驾系统在商用车和物流车上的应用表示期待，认为这将大幅提升运输行业的效率和安全性。

这次体验展示了卓驭科技原生多模态基础模型在实际复杂交通环境中的潜力和优势，预示着智能驾驶技术在多个领域的应用前景。随着技术的成熟和量产，我们有望看到智能驾驶系统在更多场景下的实际应用，从而推动整个智能交通系统的发展。

如何不发帖就快速得到金币和道行

发帖回复

返回列表


	关闭您还没有登录，快捷通道只有在登录后才能使用。立即登录还没有帐号？赶紧注册一个


	关闭选中1篇全选

帖子

[智能应用]开箱即用、全球通用：智驾界的“万能钥匙”终于出现了 [复制链接]