
文丨晓静开封护角胶
编辑|徐青阳
" Soon, we see you. "
DeepSeek 多模态团队负责人陈小康在 X 平台发出这样句话。配图中,DeepSeek 标志的蓝鲸鱼,只眼睛被黑眼罩蒙住,另只摘下了眼罩。
4 月 29 日,DeepSeek 正在网页端和 App 端灰度测试"识图模式",与"快速模式""模式"并列,用户进入后可上传图片,并让 DeepSeek 对图片内容进行理解、描述和分析。部分用户已经可以正常使用,另些用户表示虽然能看到入口,但会收到"识图模式暂不可用,请稍后再试"的提示。
但准确地说开封护角胶,这次灰度上线的是多模态理解能力,而不是完整意义上的多模态生成能力。所谓"多模态",并不定意味着同时具备识图、生图、语音、等全部能力。只要模型能够处理不止种输入模态,例如文本与图片,就可以被称为多模态能力。
但从腾讯科技体验来看,DeepSeek 这次开放的主要是图片理解,也就是"看图、读图、分析图",尚未看到图像生成、理解或跨模态生成能力上线。
Deepseek 识图能力测试
实测 Deepseek 还不具备图片生成能力
从产品界面看,"识图模式"并不是简单附加在输入框中的图片上传,而是被放在与"快速模式""模式"同的产品入口中。用户进入后,页面会显示"使用识图模式开始对话",输入框旁也出现图片上传按钮。这说明 DeepSeek 正在将视觉理解作为个立模式进行灰度,并不是仅作为文本模型的辅助。
但现阶段,"识图模式"的产品定位接近视觉问答、图片理解和截图分析,而非类似文生图、图生图的或图像生成工具。
事实上,万能胶生产厂家DeepSeek 并不是次做多模态。
奥力斯 PVC管道管件粘结胶价格 联系人:王经理 手机:18231788377(微信同号) 地址:河北省任丘市北辛庄乡南代河工业区/p>
早在 2024 年,DeepSeek 就发布过 DeepSeek-VL 系列模型,主真实世界视觉语言理解,覆盖图表、网页、公式、科学文献、自然图片等场景。此后,DeepSeek 又出过 Janus 系列,尝试将多模态理解和视觉生成放在统框架下;Janus-Pro 也曾被视为 DeepSeek 在图像生成向的次重要尝试。此外,DeepSeek 还发布过 DeepSeek-OCR,强调从大语言模型角度重新理解视觉编码器的作用,面向文档、截图和结构化信息识别。
从技术路径看,"识图"通常不是简单 OCR。OCR 主要解决的是图片中文字的识别,比如截图、票据、文档和表格;视觉语言模型则要进步理解图片内容,包括物体关系、图表含义、页面结构、场景描述和用户意图。
对于 DeepSeek 这次灰度的"识图模式"而言,底层看起来可能像是结 OCR 与文本理模型完成图片分析。
但目前,DeepSeek 官尚未披露"识图模式"的底层模型名称、参数规模、训练式和开放计划。DeepSeek API 文档目前仍主要显示 V4 Preview、V4-Pro、V4-Flash、1M 上下文和工具调用等能力,并未出现 Vision、Image Input 或识图相关接口。这意味着,至少在 API 层面,DeepSeek 多模态能力尚未正式开放。
但这步对 DeepSeek 仍然重要。过去年,DeepSeek 的核心标签主要集中在理能力、开源、低成本和长上下文。论是 R1 还是 V4 Preview,DeepSeek 突出的都是文本理和 Agent 场景能力。"识图模式"的出现,意味着 DeepSeek 可能即将在多模态能力上发力。
相关词条:罐体保温施工 异型材设备 锚索 玻璃棉 保温护角专用胶1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述开封护角胶,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》,以此来变相勒索商家索要赔偿的违法恶意行为。