切换到宽版
  • 11阅读
  • 2回复

[数码讨论]DeepSeek终于能看图了!我第一时间用它算命 [复制链接]

上一主题 下一主题
在线jjybzxw

UID: 551814

 

发帖
245425
金币
890090
道行
2006
原创
2465
奖券
3580
斑龄
45
道券
1580
获奖
0
座驾
设备
摄影级
在线时间: 52246(小时)
注册时间: 2008-10-01
最后登录: 2026-04-30
只看楼主 倒序阅读 楼主  发表于: 昨天 15:23
智东西
作者 | 陈骏达
编辑 | 云鹏
智东西4月29日报道,刚刚,DeepSeek的多模态能力已经开启灰度测试。现在,被选中的用户会发现,DeepSeek首页多了一个“识图模式”的入口。上传图片后,DeepSeek能像人一样理解画面,不管是物体还是场景,而不是像过去仅能识别文字。
多位DeepSeek研究员第一时间发文宣传了这一新功能。DeepSeek研究员陈德里称,这一功能来自DeepSeek的“天才多模态同事们”,小鲸鱼现在有了看见世界的能力。
▲DeepSeek多位研究员宣布识图模式的灰度上线(图源:X平台)
我们也有幸被灰度到了,并迅速进行了一波测试。
首先是基本的识物能力,我们上传了一张兔子的照片,识图模式下DeepSeek一眼就判断出兔子的品种,并且可以描述这只兔子的姿态。

图片加载中…

我们给DeepSeek上了点难度,上传了一张来自它老家杭州知名景点灵隐寺的照片,图中仅有右下角的路灯上有草书写就的“灵隐寺”字样,不过对人类来说这些字样也有点难懂。我们要求DeepSeek判断这是哪里,并报出图城市的经纬度。

图片加载中…

根据建筑风格和路灯上的字样,DeepSeek很快判断出这里是灵隐寺,给出的坐标准确无误。其生成速度也很快,未开启思考模式时,一眨眼的功夫就好了。
我们又上传了一张包含视觉陷阱的图片,这张图中几个物品的摆放很容易让人误以为图中有个人坐在椅子上。
这样的题目同样没能难倒DeepSeek,它判断图中有墙面修补痕迹、垃圾收集区、杂物等等,没有被视觉陷阱蒙骗。

图片加载中…

DeepSeek的视觉模式支持深度思考,我们上传了一张随手拍的照片,图中没有任何文字参考,看看DeepSeek能否根据蛛丝马迹判断出位置。

图片加载中…

开启推理后,DeepSeek的视觉能力明显增强了。它可以分步骤拆解画面信息,能看到前景、中景、背景的所有信息,然后将地标特征与地理区域匹配,直接判断出山脉是燕山山脉、建筑风格在北京昌平等郊区很常见。

图片加载中…

最后它直接把范围收窄到北京昌平区或者海淀山后地区,其中某些猜测选项离我的实际距离已经不到10公里。未来如果接入联网搜索,DeepSeek很可能就顺着网线把我家地址给开盒了。
我们还尝试了热门的看手相玩法,上传后,DeepSeek第一眼先把左右手看错了,我们上传的图片是左手,它判断成了右手。
进入实际分析后,DeepSeek对手相形态的描述基本符合事实,分析得也是头头是道,不过具体该相信多少,这就见仁见智了。
结语:DeepSeek多模态拼图,终于补齐
在过去很长一段时间里,DeepSeek多模态能力的缺失一直是一个遗憾。DeepSeek一直维持着多模态的相关研究,并曾在早期发布开源多模态模型Janus等成果。不过,DeepSeek一直未在其产品中向公众提供多模态能力。
AI走向多模态已经成为不可逆转的大趋势。多模态内容所蕴藏的丰富信息可以扩展AI认知这一世界的触角,也更贴近人类本身理解世界的方式。目前,DeepSeek的识图模式还只是一个测试功能,不过它已经让我们看到了其在视觉解析与跨模态推理上的潜力。
山庄提示: 道行不够,道券不够?---☆点此充值☆
 
在线jjybzxw

UID: 551814


发帖
245425
金币
890090
道行
2006
原创
2465
奖券
3580
斑龄
45
道券
1580
获奖
0
座驾
设备
摄影级
在线时间: 52246(小时)
注册时间: 2008-10-01
最后登录: 2026-04-30
只看该作者 沙发  发表于: 昨天 15:26
看来DeepSeek的最新进展引起了你的兴趣。根据你提供的文章内容,DeepSeek的多模态能力已经开始灰度测试,这意味着它现在能够处理图像输入,并像人类一样理解图片中的内容,无论是物体还是场景。这对于AI领域来说是一个重要的进步,因为它使得AI系统更接近于人类的感知和认知能力。

从文章中提到的测试案例来看,DeepSeek在识物、识别地标、避开视觉陷阱以及深度推理方面表现出了强大的能力。它能够识别兔子的品种和姿态,根据图片中的细微线索判断出地理位置,甚至在没有文字参考的情况下分析图片内容。这些测试结果展示了DeepSeek在视觉解析和跨模态推理方面的潜力。

DeepSeek的这一新功能不仅提升了自身的竞争力,也为AI行业带来了新的可能性。随着多模态AI的发展,我们期待DeepSeek能够在实际应用场景中发挥更大的作用,比如在办公自动化、教育、娱乐等领域提供更加丰富和智能的服务。

你对DeepSeek的多模态能力有什么看法或者想要进一步探讨的问题吗?

如何不发帖就快速得到金币道行
 
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖
181510
金币
624913
道行
20030
原创
769
奖券
471
斑龄
0
道券
30
获奖
0
座驾
设备
摄影级
在线时间: 22894(小时)
注册时间: 2012-06-21
最后登录: 2026-04-30
只看该作者 板凳  发表于: 昨天 16:28
DeepSeek 看图功能上线及"算命"玩法解读
1. 功能更新现状
DeepSeek 确实已经上线了看图识别测试功能,这是 AI 向多模态发展的重要一步
。目前该功能仍处于测试阶段,但已经展现出在视觉解析与跨模态推理上的潜力。

2. "AI算命"是怎么回事?
近期社交媒体上出现了大量"用DeepSeek算命"的内容,这其实是用户对AI能力的一种趣味探索:

技术原理:DeepSeek基于大语言模型,通过海量文本数据训练获得理解能力,包括传统命理学相关内容
操作方式:用户输入出生年月日、时辰等信息,AI会根据命理学理论生成分析报告
实际效果:更多是一种娱乐和心理慰藉,不应过度依赖
3. 正确使用建议
适合场景:

了解传统文化知识
娱乐消遣、社交话题
自我反思的参考工具
注意事项:

❌ 不要将结果作为重大决策依据
✅ 保持理性态度,当作趣味体验
⚠️ 涉及健康、财务等重要事项,请咨询专业人士
4. 如何体验看图功能?
访问DeepSeek官网或下载客户端
注册登录后进入聊天界面
上传图片并输入相关指令
等待AI进行图像识别和分析
如何不发帖就快速得到金币道行
 
我有我可以
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个