阿拉善盟万能胶厂开源版的 GPT Image 2，信息图、连续图文、本地部署全拿下

发布日期：2026-04-30 11:24:45 点击次数：107

近 GPT Image 2 火了之后，网上都是那些以假乱真的 AI 生成图片。大模型在视觉这条路上越走越远，让人兴奋又让人敬畏。

而 GPT Image 2 在眼下的 AI 生图域，几乎是没什么好争的。但如果说云端闭源收费的好模型是 GPT Image 2，那能部署在本地的，费开源模型或许会是 SenseNova U1。

▲由 SenseNova U1 生成

SenseNova U1 是商汤新发布的个开源的多模态模型，它的 Lite 系列 8B 和 A3B 参数版本，目前已经在 Hugging Face 和 GitHub 上开源。

从模型参数和选择开源的路线上，我们就能看到它和 GPT Image 2 是不太样的向。

APPSO 也提前拿到了测试资格，我们发现商汤这款新代原生理解生成统模型，就开源模型来说，已经做到了好水平。

它带来了大模型行业创的连续图文生成输出，就是用单模型就能连贯输出图片和文字，这个新鲜很值得去试试。

目前 SenseNova U1 开源模型的权重已经在 Hugging Face 和 GitHub 上开放下载。

GitHub：https://github.com/OpenSenseNova/SenseNova-U1

Hugging Face：https://huggingface.co/collections/sensenova/SenseNova-U1

带着图片的思考

我们可能遇到过这样的需求，想让 AI 解释个复杂概念，同时配上示意图，而且图要跟着文字的逻辑走，解释到几步，图里就画到几步。

般的模型可能会直接采用生成代码的式来解决这个问题，像 Claude 使用的流式构图，或者些 Vibe Coding 的网页，包含文字和配图。

但是要用个模型同时在回复流里面，生成文字和图片，并且不借助外部工具的调用，基本上现有的模型做不到这点。因为文字生成和图像生成在模型底层，往往是两件事。

SenseNova U1 的项特点，就是在单模型上进行连续的图文创作输出。

比如我们试了个场景，让他生成份简单的绘本故事，讲述只小熊历经四季的变化。

▲ 提示词：请创作个图文绘本故事，主角是只棕的小熊，故事讲述它经历四季变化。

生成的连续图文不仅理解到位，有定的故事，而且能很好的保持致，同时图片的文字渲染全部准确，小熊也在冬天穿上了毛衣，戴上了帽子。

实测中发现用 SenseNova U1 来进行些创意的工作也非常有意思。

在官的测试案例里，上传张大头贴给模型，然后要求它设计几款不同的发型。可以看到，在生成连续图文的完整过程中，人物的致，以及结构、细节，SenseNova U1 都做到了保持。

▲ 提示词：帮我设计几款适的发型，希望好看的同时比较有特，然后帮我选款适我的

还能直接让他设计个游戏角，展示从整体视觉基调、核心交互细节，再到环境叙事和格刻画的逻辑迭代过程。

有意思的是，基于时序的回答，用 SenseNova U1 创作是再适不过。我们要求他生成颗牛油果变成颗室内盆栽的过程，连续图文的形式很好地呈现了完整的生长过程。

▲ 提示词：怎么把颗普通的牛油果种成棵室内盆栽

番测试下来，图片从来没有离开过文字的逻辑，理的思路走到哪里，图片就跟到哪。

以前的图文结或许是调用不同模型，和对应工具的写作，确保回复的内容里，图文是在说同件事。现在这项写作从底层直接发生在模型内部，论是工具还是软件，都不需要参与对齐的过程了，我们也只需要看到后的结果。

对内容创作者、设计师和营销人员来说，SenseNova U1 的出现，开始解决了个以来的痛点，即如何让 AI 边写边画，而且图文逻辑严丝缝。

量大管饱的强开源

确认了它的原生理解生成统能力后，我们要看 SenseNova U1 能否在复杂信息图生成面，达到开源模型的好水平。

信息图是把大段复杂的文字或数据，压缩成张眼能看懂的图。这件事其实比「画张漂亮的图」难得多，需要理解内容，知道哪些是核心，哪些是辅助，信息之间的逻辑关系，以及文字渲染等，都是难题。

闭源的 GPT Image 2 在这面已经做得很好了阿拉善盟万能胶厂，我们在测试的时候开始也没有抱着太大的希望，会比 GPT Image 2 还要好。但 SenseNova U1 的表现，拿下开源 SOTA 的称号也确实是当之愧。

我们先是就用句话「用张信息图解释下 DeepSeek V4」，没有任何附加的提示词，看看它生成的信息图表现如何。

▲ 由 SenseNova U1 生成

能看得出来 SenseNova U1 有联网搜索到和 DeepSeek V4 相关的信息，像是原生多模态，还有万亿参数，以及百万的上下文 Token。

而除了简单的提示词，还可以直接发送个链接给它，SenseNova U1 也有对应的网页抓取工具，提取网页内容，来进行信息图的生成。

这些知识科普类的信息图，SenseNova U1 的表现基本上都能驾驭。简单的像是「张什么是电子烟的 3D 拆解科普」，它也能很快生成。

而如果提示词稍微详细点，它也能照着提示词的内容，把这些文字准确渲染成可视化程度较的信息图。

还有像是近很火的武汉三鲜豆皮，直接告诉 SenseNova U1，pvc管道管件胶生成张三鲜豆皮完整制作流程的步骤图。

还有夏天来了，挑选不同的晒霜，也是张信息图，就能把 SPF 和 PA 值这些复杂的挑选参数讲清楚。

甚至是要它画张 AI 大模型从训练到理的工作原理图，适不懂技术的人看懂；SenseNova U1 也能用轻松有趣的风格，简单的描述 AI 大模型的工作过程。

在其他场景的应用，像是营销、办公、设计参考和商业分析，我们都用不同的例子来测试了 SenseNova U1 的表现。

奥力斯泡沫板橡塑板专用胶报价联系人：王经理手机：18232851235（微信同号）地址：河北省任丘市北辛庄乡南代河工业区

般来说阿拉善盟万能胶厂，营销场景对视觉风格的要求，也是能看出模型有没有真正理解「用户想传递什么感受」的地。张好的营销图片，放在文章中间，甚至有可能直接被我们误认为是微信的文章内广告。

就像这张 SenseNova U1 生成的上海旅行信息图，不仅把地图描绘出来了，还列举了上海的特。

在办公场景里，好看又要比准确和重要。我们测试了它对信息处理的能力，把份五页的会议纪要压缩成张屏能看完的总结图，要求逻辑清晰、突出，适直接转发给没参会的同事。

复杂的信息之外，SenseNova U1 也能做到很好的视觉风格参考，给它段的调描述，要求生成张包含配建议、排版建议、氛围关键词的风格参考图，结果居然也还不错。

在些数据分析的任务上，我们也测试了 SenseNova U1 数据可视化的能力，用图表的式来呈现理的信息图。

可以看到，SenseNova U1 在信息提炼这步做得不错，它确实读懂了内容，知道什么重要什么次要。

但是在视觉表达上还有提升空间，有时候些文字的渲染，还是会出现错误，对于需要快速出图、不想花时间在设计工具上反复调整的场景，已经够用。

下个多模态模型的样子

实测完 SenseNova U1，我们发现它的意义，在于它是个把「理解和生成统」这件事认真做出来的开源模型。而这，或许是整个多模态域下步要走的向。

GPT Image 2 的刷屏，说明图像生成的「生成质量」这条线已经被闭源模型拉得很了。开源模型如果继续在同个维度继续追，大概需要很长的时间才能赶上，并且开源的价值也会被压缩到只剩下「便宜」。

SenseNova U1 提供了个不同的技术路径，对于整个开源社区的向都有着重要意义。它除了在解决「怎么生成好的图」，也在告诉我们多模态模型的下步会是什么样子。

▲ SenseNova U1 采用了行业创的 NEO-unify 原生架构，实现多模态理解生成的统

过去的多模态模型，理解图和生成图是两套系统在协作。套负责看懂输入，套负责画出输出，中间靠接口传递信息。两套系统各有各的内部语言，信息在传递过程中会有损耗，就像两个人用翻译软件沟通，意思大体到了，但总有点什么没传过去。

SenseNova U1 则是从底层把这两件事，进了同个表征空间。他们今年 3 月的技术博客里，就讲解了 NEO-unify 这项架构。

目前大模型行业的惯例是，多模态 AI 看图要靠个叫「视觉编码器（VE）」的东西压缩处理，然后再交给生成器。在 NEO-unify 架构里，商汤把这套臃肿的传统范式直接扔了。

结 NEO-unify 结构的 SenseNova U1，所使用的视觉接口是近似损的，它直接把图像分块（Patch）吃进去，不经过任何预训练编码器压缩；然后在同个主干网络里，让文本和视觉的训练端到端统进行。

在理解与生成各项基准测试上，SenseNova U1 的表现也达到同量开源模型的 SOTA 水平，甚至在多项指标上的表现能和 Nano Banana 这些闭源模型相媲美。

▲ 分别是图像理解、图像生成，和视觉理基准测试结果

它回归了多模态的原理，从底层的像素和文字开始，自己构建内部的认知。

这也能解释为什么它消耗的 token 少，生成率。即使它只有 8B 的参数的版本，也能出强的致价比。

本次开源的是 SenseNova U1 的轻量版本 SenseNova U1 Lite，目前它有两个版本：8B 参数的 SenseNova-U1-8B-MoT，可以在边缘设备上跑；38B 总参数但激活只有 3B 的 SenseNova-U1-A3B-MoT，提供强能力，同时将理成本控制得很低。

▲ SenseNova U1 已经在 GitHub 和 Hugging Face 上开源，链接：https://github.com/OpenSenseNova/SenseNova-U1、https://huggingface.co/collections/sensenova/sensenova-u1

两个版本都可以本地部署、可以微调、可以接进自己的数据管道。对需要把图像生成能力嵌进自己产品的开发者来说，能够对模型行为有的控制权，数据也不用出去。

如果你需要个能够实现理解与生成的模型，作为开源模型里的强代表，SenseNova U1 确实值得尝试。

商汤还在 GitHub 上开源了面向 Agent 运行时的 AIGC 技能库 SenseNova-Skills。我们可以直接把 SenseNova U1 这种强大的能力，接入到自己的智能体（Agent）工作流中。

利用这个工具包，我们可以直接在像 OpenClaw、Hermes 这样的 Agent 平台中键调用。模型会自动评估我们的提示词，选择适的版式，经过多轮生成，输出佳的业信息图结果。

▲ Skills 链接：https://github.com/OpenSenseNova/SenseNova-Skills

回顾整个测试，SenseNova U1 这次交出了份不错的答卷，它是目前我们能拿到手里的同量强开源模型。

对创作者来说，它行业创的连续图文创作输出能力，破了过去文字与配图割裂的窘境，真正让边思考、边写作、边配图的连贯创作成为现实。

相关词条:铁皮保温塑料挤出机钢绞线玻璃卷毡厂家保温护角专用胶

1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定阿拉善盟万能胶厂，并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方，并积极配合修改。
3.凡用户访问本网页，均表示默认详情页的描述，不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》，以此来变相勒索商家索要赔偿的违法恶意行为。

上一篇：玉林万能胶生产厂家华曙科拟位不39亿定增 Q1亏近1年2股东套现12亿下一篇：拉萨pvc管粘接胶【女轮综述】卫冕北京城建女足强势开启卫冕征程

阿拉善盟万能胶厂 开源版的 GPT Image 2，信息图、连续图文、本地部署全拿下

发布日期：2026-04-30 11:24:45 点击次数：107

阿拉善盟万能胶厂开源版的 GPT Image 2，信息图、连续图文、本地部署全拿下