热点：

智谱AI 级联扩散文生图模型开源：性能远超SDXL

2024-10-14 11:41:26 [ 中关村在线原创 ] 作者：一便士的月亮

智谱AI 级联扩散文生图模型开源：性能远超SDXL

智谱技术团队今天宣布开源了他们的文生图模型CogView3和CogView3-Plus-3B，并且这些模型已经通过“智谱清言”App上线了。CogView3是一个基于级联扩散的text2img模型，包含了三个阶段：第一阶段是利用标准扩散过程生成低分辨率图像，第二阶段是利用中继扩散过程进行超分辨率生成，第三阶段将生成结果再次基于中继扩散迭代，以得到高分辨率的图像。

在人工评估方面，CogView3比目前最先进的开源文本到图像扩散模型SDXL高出77.0%，并且只需要SDXL大约1/10的推理时间。而CogView3-Plus则是在CogView3（ECCV 24）的基础上引入了最新的DiT框架，以实现整体性能进一步提升。它采用Zero-SNR扩散噪声调度，并引入了文本-图像联合注意力机制。与常用的MMDiT结构相比，它在保持模型基本能力的同时有效降低训练和推理成本。CogView-3Plus使用潜在维度为16的VAE。

以下是两个模型的开源地址：

- CogView3仓库地址：https://github.com/THUDM/CogView3

- CogView3-Plus-3B仓库地址：https://huggingface.co/THUDM/CogView3-Plus-3B

本文属于原创文章，如若转载，请注明来源：智谱AI 级联扩散文生图模型开源：性能远超SDXLhttps://dcdv.zol.com.cn/907/9079868.html

猜你喜欢
最新
精选
相关

手机版阅读即时更新

点击加载更多内容

中关村在线首页数码影音首页

数码摄像机品牌大全热门数码摄像机上升最快的数码摄像机

数码摄像机报价

热门搜索

苹果发布会 AWE Chinajoy IFA mwc CES Asia CES

热词：镜头卡西欧佳能

24小时热文
本周热评

推荐视频
精品图赏

大底传感器+主动散热佳能PowerShot V1一体镜头Vlog相机深度评测

推荐经销商

投诉欺诈商家: 010-83417888-9185

北京
上海
广州

数码摄像机
新品上市

1索尼 FX3￥32000

参考报价： ¥27399
去购买>
2索尼 PXW-Z280￥38800

参考报价： ¥36730
去购买>
3索尼 PXW-Z200￥35500

参考报价： ¥31999
去购买>
4佳能 PowerShot V10￥2999

参考报价： ¥2488
去购买>
5索尼 FDR-AX700￥11998

参考报价：￥11998
去购买>
6松下 AJ-UPX360MC￥38000

参考报价：￥38000
去购买>
7索尼 PXW-FX9￥76999

参考报价： ¥73899
去购买>
8索尼 PXW-Z190￥27150

参考报价： ¥24999
去购买>
9索尼 FDR-AX45A￥7599

参考报价： ¥6399
去购买>
10索尼 HXR-NX200￥14999

参考报价：￥14999
去购买>

推荐问答

提问

论坛精选
最热回答

摄影
手机
硬件
笔电
平板

0

下载ZOL APP
秒看最新热品

内容纠错