• 最近访问:
发表于 2026-06-18 23:41:20 股吧网页版
DeepSeek新功能认不出梁文锋
来源:上海证券报

  近日,多位网友发现,DeepSeek已面向更多用户开放“识图模式”。

  DeepSeek在回答中表示,识图(多模态视觉理解)功能已全面上线。目前,该功能支持识别和分析图片内容,但暂不支持图片生成(画图)或生成视频,侧重点在于“看懂”和“分析”图片。

Image

  据了解,今年4月底,DeepSeek开启识图功能灰度测试,并于5月进一步扩大测试范围。虽然官方尚未正式发布公告,但DeepSeek多模态研究员陈小康6月18日在社交平台X发文也证实了这一消息:“Vision现已在网页端和App端上线。”

  不过,从实际测试情况来看,DeepSeek的识图能力仍有提升空间。记者上传了一张DeepSeek创始人梁文锋的照片后,系统将其识别为寒武纪创始人陈天石;而同一张照片上传至豆包、元宝和千问后,均能够正确识别。

Image

  此外,记者还用kimi创始人杨植麟、智谱创始人唐杰的照片进行了测试,DeepSeek均未能正确识别。但对公众知名度较高的小米创始人雷军,DeepSeek则能够准确给出答案。

Image

  今年4月发布V4系列模型时,DeepSeek仍将推理和Agent能力作为核心卖点,并未将多模态列为重点方向。不过,V4发布后不久,公司便开始测试并逐步开放识图功能。

  事实上,多模态已成为头部大模型产品的标配。ChatGPT、Gemini,以及国内的豆包、腾讯元宝、阿里千问等产品均已支持图像理解,字节跳动Seedance、快手可灵等产品则进一步拓展至视频生成领域。

  相比之下,DeepSeek此前主要依靠V3、R1等模型在推理领域建立优势,主产品长期以文本交互为主。此次识图功能上线,意味着其能力边界正从文本推理向多模态延伸。

  中信建投此前在研报中表示,谷歌、快手等头部模型重点解决了角色一致性与物理逻辑难题,快手可灵月活破千万并实现订阅收入增长,标志着多模态工具从娱乐走向生产力。未来,原生多模态与世界模型技术共同演进,有望重塑营销、影视、游戏等下游产业格局。

  值得关注的是,在产品能力持续升级的同时,DeepSeek近期也被曝正推进成立以来首次大规模外部融资。据外媒报道,DeepSeek最新一轮融资规模超过500亿元人民币,投后估值超过500亿美元,成为中国估值最高的AI创业公司之一。

图片
郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500