切换到宽版
  • 45阅读
  • 2回复

[智能应用]从陪伴儿童到守护老人,机器人将温情“落地” [复制链接]

上一主题 下一主题
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君
 

发帖
145348
金币
274753
道行
20030
原创
756
奖券
185
斑龄
0
道券
0
获奖
0
座驾
设备
摄影级
在线时间: 16928(小时)
注册时间: 2012-06-21
最后登录: 2025-07-18
儿童节前期,银河通用正式推出自主研发的产品级端到端导航大模型——TrackVLA,一款具备纯视觉环境感知、语言指令驱动、可自主推理、具备零样本(Zero-Shot)泛化能力的具身大模型。
TrackVLA 是银河通用推出的产品级导航大模型,纯视觉环境感知、自然语言指令驱动、端到端输出语言和机器人动作,是一个由仿真合成动作数据训练的“视觉-语言-动作”(Vision-Language-Action, VLA)大模型。它让机器人拥有“听→看→懂→走”的闭环运动能力:一双眼睛看世界、一个智能“大脑”做推理,无需提前建图、不依赖遥操控制,真正实现语言驱动、泛化感知、自主推理、智能交互与运动。
TrackVLA 到底能做什么?八大核心能力,一起看懂!
1. 听得懂你说话,还能换人跟
你只需说一句:“跟着妈妈”,它就能立即识别“妈妈”对应的目标位置。如果改口说“换成跟孩子”,它也能瞬间切换对象,并通过语音回复确认。甚至,Ta还能跟踪你的宠物。这背后,是模型具备的自然语言理解与目标识别能力的协同工作。
2. 不怕人多也不跟错人
在人流密集的购物中心中,面对复杂的场景、多变的环境中多个相似穿着的人,它能准确识别原始目标并长时自主跟随。通过空间理解和视觉记忆机制,避免“认错人”。
3. 丢了目标能找回来
如果目标走出视野,它不会原地“发呆”,而是通过实时的空间智能和大模型推理能力根据目标运动轨迹“分析出”目标的大致位置,并规划轨迹重新找回目标。
4. 从没见过的地方也能走
TrackVLA不依赖建图,靠纯视觉输入理解环境。可在不依赖额外采集训练数据的情况下,直接部署在陌生商场、电梯、游乐区等环境,实现长时稳定自主跟随。
5. 灵活避障,适应复杂场景
在儿童游乐区、狭窄通道等复杂场景中,它能实时识别障碍物(包括儿童、玩具、地面水渍等),分析可通行区域,并可正确认知自身本体能力,自主推理出自身构型支持的合理路线。
6. 环境光线变化?不怕
从室外阳光到室内昏暗、从电梯镜面反射到超市货架夹缝,TrackVLA展现出极强鲁棒性,无需专门调参或切换模式。
7. 远程可视守护,一目了然
通过 App,你可以实时看到机器人眼中的第一视角,掌握家人动态。系统还能主动提醒风险行为(如小朋友奔跑、老人跌倒),提供“移动守护”。
8. 技能涌现!
TrackVLA不仅能稳定跟随人类,还可以泛化至任意移动目标。比如视频最后展示了让机器狗跟随一只路上偶遇的动物狗狗,其目标形态、运动方式、遮挡情况都非常不确定。 TrackVLA 也表现了同样稳定的跟随能力,而这一能力是训练时从而教过的!
TrackVLA的发布,是银河通用具身大模型发展战略的重要里程碑,标志着多项关键突破的同步实现并已达到产品级能力。机器人导航正式迈入端到端模型可商业化落地的阶段,TrackVLA无需建图、不依赖遥控、自主推理、智能交互。从陪伴儿童到守护老人,从商场巡逻到室内物流,机器人在泛服务场景中的应用路径已经被银河通用带到公众面前。具身智能真正具备了“看得懂、想得明白、动得起来”的一体化能力。
未来,TrackVLA 将赋能不同形态的机器人本体,加速具身智能整个行业在不同维度的产品落地,打造更加繁荣的产业生态,提供多样的社会服务并创造更多样的社会价值。
山庄提示: 道行不够,道券不够?---☆点此充值☆
 
我有我可以
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖
145348
金币
274753
道行
20030
原创
756
奖券
185
斑龄
0
道券
0
获奖
0
座驾
设备
摄影级
在线时间: 16928(小时)
注册时间: 2012-06-21
最后登录: 2025-07-18
只看该作者 沙发  发表于: 06-01
从陪伴儿童到守护老人,机器人将温情“落地”
TrackVLA助力机器人温情陪伴与守护
TrackVLA简介
儿童节前期,银河通用正式推出自主研发的产品级端到端导航大模型——TrackVLA,这是一个由仿真合成动作数据训练的“视觉 - 语言 - 动作”(Vision - Language - Action,VLA)大模型。它具备纯视觉环境感知、自然语言指令驱动、端到端输出语言和机器人动作的能力,让机器人拥有“听→看→懂→走”的闭环运动能力,无需提前建图、不依赖遥操控制,真正实现语言驱动、泛化感知、自主推理、智能交互与运动。

TrackVLA核心能力体现温情陪伴与守护
灵活跟随功能:它能听懂人类指令,如说“跟着妈妈”就能立即识别对应目标位置,若改口“换成跟孩子”也能瞬间切换对象并语音确认,甚至还能跟踪宠物。在人流密集的购物中心,能准确识别原始目标并长时自主跟随,即便目标走出视野,也能通过实时空间智能和大模型推理能力找回目标。这对于陪伴儿童在商场游玩、守护老人出行等场景非常实用,能时刻保证目标在其跟随范围内,给予陪伴与守护。
适应复杂环境:不依赖建图,靠纯视觉输入理解环境,可在陌生商场、电梯、游乐区等环境实现长时稳定自主跟随。在儿童游乐区、狭窄通道等复杂场景能灵活避障,实时识别障碍物并分析可通行区域,规划合理路线。而且对环境光线变化有极强鲁棒性,无需专门调参或切换模式。这使得机器人能在各种复杂的现实场景中正常工作,无论是陪伴儿童玩耍还是守护老人行动,都能适应不同的环境条件。
远程可视守护:通过App可以实时看到机器人眼中的第一视角,掌握家人动态,系统还能主动提醒风险行为(如小朋友奔跑、老人跌倒),提供“移动守护”。这为家长和子女远程了解儿童和老人的情况提供了便利,增强了陪伴与守护的效果

泛化跟随能力:不仅能稳定跟随人类,还可以泛化至任意移动目标,如让机器狗跟随偶遇的动物狗狗。这种泛化能力为机器人在更多场景的应用提供了可能,进一步拓展了其陪伴与守护的范围。
TrackVLA的重要意义
TrackVLA的发布是银河通用具身大模型发展战略的重要里程碑,标志着多项关键突破的同步实现并已达到产品级能力。机器人导航正式迈入端到端模型可商业化落地的阶段,从陪伴儿童到守护老人,从商场巡逻到室内物流,机器人在泛服务场景中的应用路径已经被银河通用带到公众面前。未来,它将赋能不同形态的机器人本体,加速具身智能整个行业在不同维度的产品落地,打造更加繁荣的产业生态,提供多样的社会服务并创造更多样的社会价值。


如何不发帖就快速得到金币道行
 
我有我可以
在线jjybzxw

UID: 551814


发帖
169446
金币
287220
道行
2004
原创
2405
奖券
2855
斑龄
36
道券
1035
获奖
0
座驾
设备
摄影级
在线时间: 38489(小时)
注册时间: 2008-10-01
最后登录: 2025-07-18
只看该作者 板凳  发表于: 06-01
TrackVLA 是银河通用推出的一款具有革命性的导航大模型,它具备以下八大核心能力:

1. 自然语言理解与目标识别:能够理解简单的语言指令,并识别并跟踪指定的目标,如“跟着妈妈”或“换成跟孩子”。

2. 复杂环境下的跟随能力:即使在人流密集的购物中心等复杂环境中,也能准确识别并长时间跟随原始目标。

3. 目标丢失后的找回能力:如果跟踪的目标暂时离开视野,TrackVLA能够通过空间智能和大模型推理能力重新找回目标。

4. 无需建图的导航能力:不依赖于预先建立的地图,依靠纯视觉输入来理解环境,并在陌生环境中实现稳定自主跟随。

5. 灵活避障与复杂场景适应性:能够实时识别障碍物,并分析出可通行区域,自主推理出合理的路线。

6. 强鲁棒性的环境适应性:无论是室外阳光还是室内昏暗环境,TrackVLA都能展现出强大的适应性,无需调整参数。

7. 远程可视守护:通过App,用户可以实时查看机器人的第一视角,监控家人动态,系统还能主动提醒风险行为。

8. 零样本泛化能力:TrackVLA不仅能跟随人类,还能泛化至任意移动目标,如跟随偶遇的动物,即使这些目标的形态和运动方式在训练时未被特别教导过。

TrackVLA的发布标志着机器人导航技术的重大突破,使得机器人能够无需建图、不依赖遥控、自主推理、智能交互。它的应用范围广泛,从陪伴儿童到守护老人,从商场巡逻到室内物流等多个泛服务场景。未来,TrackVLA将赋能不同形态的机器人本体,加速具身智能行业的发展,并在社会服务领域创造更多价值。
如何不发帖就快速得到金币道行
 
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个