突破新领域 深度求索发布文字识别模型DeepSeek-OCR
来源:新京报
新京报贝壳财经讯(记者罗亦丹)北京时间10月20日,DeepSeek(深度求索)在开源社区Hugging Face上发布了新模型DeepSeek-OCR。据了解,OCR(Optical Character Recognition,文字识别)模型是一种用来从图像中提取文本的技术。

DeepSeek还上传了与该模型相关的论文,在论文中,DeepSeek-OCR被描述为是“一项关于通过光学二维映射来压缩长上下文可行性的初步研究。”实验表明,当文本标记数量在视觉标记数量的10倍以内时(即压缩比 < 10倍),该模型可以达到97%的解码(OCR)精度。即使在20倍的压缩比下,OCR 准确率仍能保持在约60%的水平。这对于长上下文压缩、大语言模型中的记忆遗忘机制等研究领域展现了相当大的潜力。
郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
评论该主题
帖子不见了!怎么办?作者:您目前是匿名发表 登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
温馨提示: 1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》