中国两大科技巨头阿里巴巴和字节跳动发布了各自最新的AI图像生成模型。字节跳动推出了Seedream 5.0,主打智能理解和高分辨率输出;阿里巴巴则推出了Qwen-Image-2.0,集图像生成与编辑于一体。

这两款模型今日正式上线。阿里巴巴通过阿里云百炼平台开放API邀测,用户可通过Qwen Chat免费体验;字节跳动将Seedream 5.0集成于旗下剪映、CapCut、小云雀等应用,并提供限时免费使用,未来计划在美国市场开放。
Qwen-Image-2.0的核心创新在于首次将图像生成与编辑功能统一到单一模型架构中,显著提升了性能和灵活性。该模型支持长达1000 token的复杂文本输入,能够生成高达2K分辨率的图像,适合专业PPT、海报、多格漫画等复杂场景。尤其在中文文字渲染方面表现卓越,能够准确生成多种字体和复杂文本内容,如《兰亭集序》全文配图。AI Arena评测数据显示,Qwen-Image-2.0在文本生成图像任务中以1029分位列全球第三,图像编辑能力得分1034,排名第二,接近顶尖水平。
相比之下,字节跳动的Seedream 5.0强调智能水平的提升,增强了对提示词的理解能力,支持检索生图、多步逻辑推理和联网知识整合,适合复杂知识驱动的任务,如生成详细步骤说明图。Seedream 5.0支持2K及4K分辨率输出,细节纹理和照明效果更为精细,新增了精准编辑功能。尽管在艺术设计感方面略逊于竞争对手,但其在实用性和智能推理方面表现突出。
从技术参数来看,Qwen-Image-2.0的长文本输入能力(1K token)远超行业平均,极大拓展了模型对复杂指令的理解和执行能力,尤其适合需要精细文字排版和多元素组合的专业应用。Seedream 5.0通过多步逻辑推理和联网知识整合,提升了模型对复杂任务的适应性,在生成步骤说明图等知识密集型场景中表现优异。此外,Seedream 5.0支持4K分辨率输出,满足更高端视觉需求。

![[快讯]在山西过个非遗焰火年 烟花里的浪漫与传承](http://cn.gzbj58.com/file/upload/202602/18/000613371.jpg)
![[快讯]孙志禹已任水利部领导 新春茶话会亮相](http://cn.gzbj58.com/file/upload/202602/12/004401211.jpg)
![[快讯]在苗寨沉浸式过年 抓鱼又追猪 体验侗家年味](http://cn.gzbj58.com/file/upload/202602/11/003558101.jpg)
