阶跃星辰开源图像编辑模型 Step1X-Edit
创始人
2025-04-27 12:16:04
0

上证报中国证券网讯(记者 孙小程)4月27日,阶跃星辰正式发布并开源图像编辑大模型Step1X-Edit。该模型总参数量为19B (7B MLLM + 12B DiT),具备语义精准解析、身份一致性保持、高精度区域级控制三项关键能力;支持11类高频图像编辑任务类型,如文字替换、风格迁移、材质变换、人物修图等。据介绍,Step1X-Edit不只能“改图”,更能“听得懂、改得准、保得住”。

在技术层面,Step1X-Edit采用MLLM(Multimodal LLM)+ Diffusion的解耦式架构,分别负责自然语言理解与高保真图像生成,相比现有图像编辑模型,该架构在指令泛化能力与图像可控性上更具优势。

MLLM模块负责处理自然语言指令与图像内容,具备多模态语义理解能力,可将复杂编辑需求解析为latent控制信号;Diffusion模块作为图像生成器(Image Decoder),根据MLLM生成的latent信号完成图像的重构或局部修改,确保图像细节保真与风格统一。这一结构打破了传统pipeline模型中“理解”和“生成”各自为政的问题,使模型在执行复杂编辑指令时具备更高的准确性与控制力。

相关内容

热门资讯

福睿斯加满一箱油跑多少公里 福... 福睿斯加满一箱油能跑多少公里?福睿斯加满一箱油大约能跑500公里以上。请注意,这里的油箱容积指的是厂...
私营加油站的油能加吗 私营加油... 关于私营加油站的油品是否可加,这确实是许多车主心中的疑问。虽然有个别车主反映私营加油站的成品油质量不...
驾驶姿势不正确的原因 驾驶姿势... 驾驶姿势不正确的5个原因及解决办法驾驶姿势不正确是科目三考试中常见的问题,其原因主要有以下5点:1....
l档是什么档 l档是什么档 l... L档,即低速档,是自动变速器汽车上的一个特定档位。在这个档位下,汽车的变速器会被限制在较低的档位,使...
北京车牌摇号中签技巧 北京车牌... 北京车牌摇号中签技巧 想要提高北京车牌摇号中签的几率,除了靠个人运气外,还有一些小技巧可以尝试...
车身稳定系统平时开吗 车身稳定... 建议开启车身稳定系统。 车身稳定系统通过传感器检测汽车的行驶状态,当车辆发生侧滑时,会对车轮进行制动...
奔驰ml400属于什么级别 奔... 奔驰ml400是一款属于中大型SUV的车型,它的前悬架采用了双叉臂式独立悬架,后悬架则是多连杆式独立...
定速巡航是什么意思 定速巡航是... 定速巡航,顾名思义,是一种使车辆保持固定速度行驶的功能。它借助了现代电子技术,能够自动调节车速,使汽...
汽车电瓶充电多少正常 汽车电瓶... 汽车电瓶充电多少正常?汽车电瓶充电电压在13到15v之间是正常的。汽车电池充电的电压标准是12v汽车...
卖车需要车主本人到场吗 卖车需... 卖车时,车主本人并不需要到场。但是,需要提供一些必要的证件,如机动车注册登记证、购车原始发票、行驶证...