百度的 AI 绘画产品与其他公司的对比如何

AI攻略 2024-09-16

百度的 AI 绘画产品与其他公司的对比如何

百度的 AI 绘画产品主要有文心一格。在与其他公司产品的对比中,文心一格在某些方面表现出一定的特点和不足。
与 OpenAI 的 DALL・E 相比,差距较为明显。例如在 “冬天的一把火” 的描述下,DALL・E 给出的是一堆火,较为直观地体现了描述内容;而文心一格虽然有一点意境,但画面中的人物被评价为太丑。在 “一个黑色的猫和一只白老鼠相爱相杀” 的描述中,DALL・E 能给出 4 幅黑白分明的猫和老鼠,而文心一格则提示无法理解输入内容,需要增加中文描述后重试。在对 “蛾儿雪柳黄金缕,笑语盈盈暗香去” 的诗词理解上,文心一格给出的画图被认为素材没有可借鉴使用的,相比之下 DALL・E 的效果被认为还是可以的。
与阿里的通义万相对比,在画 “一家三口全家福” 时,文心一言多次出现错误理解,如出现两个老头加女儿还伴有一堆孙子孙女等情况,甚至出现三个老头加一群女儿和孙辈的诡异画面。而通义万相虽然一次性出来四幅图只有第二幅画对了,但整体表现相对稳定一些。


与国内其他产品对比,文心一格在与智谱清言、讯飞星火对比生成产品图时,被评价质量差不多。在与头条 “豆包” 对比中,文心一言在生成图质量上被认为不如豆包,豆包能根据准备描述生成图片,还有各种风格选择,画质也比较优质。
在与国外 Midjourney 对比中,两者在不同主题的绘画上表现各异。在涉及中国传统特色的内容如孙悟空、绿巨人和葫芦娃一起打扑克、抽雪茄的主题中,Midjourney 对 “孙悟空” 识别成日本漫画《七龙珠》里的悟空,且 “葫芦娃” 被忽视;文心一格也只能识别 “猴子” 和 “绿巨人” 两个关键词,与 “孙悟空”“葫芦娃” 没有半点关系。但在不涉及中国传统特色的通用参数下,如两个矩形透明材质屏幕立在星球上的主题,两者生成的图像几乎没有区别,都包含了该有的外星球、玻璃屏幕等元素,充满科技感。
综上所述,百度文心一格在与其他公司的 AI 绘画产品对比中,既有一定的优势,如可以直接用中文输入命令,但在理解复杂描述和对中国传统文化特色的识别上还有很大的提升空间。

百度文心一格与 OpenAI 的 DALL・E 对比差距


文心一格在与 DALL・E 的对比中仍有一定提升空间。例如在描述 “冬天的一把火” 时,DALL・E 给出的是一堆火,较为直观地体现了描述内容;而文心一格给出的图虽有一定意境,但图中的人较丑。在 “一个黑色的猫和一只白老鼠相爱相杀” 的描述下,DALL・E 能给出四幅黑白分明的猫和老鼠,效果不错;而文心一格则提示无法理解输入内容。对于 “蛾儿雪柳黄金缕,笑语盈盈暗香去” 这句中国传统诗词,DALL・E 作画效果尚可,文心一格画的人却像阿凡达,且素材缺乏可借鉴性。总体来看,文心一格在 AI 作画方面还需不断进步,DALL・E 基于 GPT-3 的模型,学习能力更强,GPT-4 发布后其效果预计会更完美,百度与 OpenAI 在这方面差距较大。

百度文心一格与阿里通义万相对比表现


在人像绘制方面,文心一格和通义万相在国产 AI 绘画模型中都有一定的劣势。但二者在细节处理上各有特点,文心一格在毛发处理上较为逼真,通义万相的图像整体风格统一,但人脸处纹理僵硬,眼睛瞳孔形状变形。在二次元风格方面,两款产品各有千秋。通义万相更偏向于韩式漫画风格,所创作图像有 3D 感觉,人物立体;文心一格更接近传统二次元画风,但在部分测试中未能完全体现特定元素,如 “欧式背景”。在 3D 动漫人物方面,文心一格的画面颜色统一,面容精致立体,若能体现出特定特征会更好;通义万相整体色调与背景融合,细节精明,但眼部妆容色彩若淡一些可能效果更佳。在使用体验上,百度文心一格无法使用复杂的英文激励词,必须逐句翻译成中文才能使用,而通义万相没有这个问题。

百度文心一格与国内其他产品对比质量


与国内其他产品如智谱清言、讯飞星火等相比,文心一格在不同方面表现各异。在画人物方面,文心一言画人物较真实,细节处理较到位,给予 4 星评价。在画动物方面,文心一格基本符合要求,细节处理稍微不足,给予 3 星评价。在画植物方面,文心一格漫画风格,细节处理较差,给予 2 星评价。与商汤秒画、阿里通义万相相比,在绘画技能 PK 中,对于不同的描述词,三款工具各有优势和不足。例如在 “森林里的精灵” 描述下,难分伯仲;在 “黑夜,北极星发出一束光照射到大海上,杰作,细节丰富,8K,HDR” 描述下,各有特色;在 “万马奔腾” 描述下,商汤秒画后面许多马有些失真,通义万相的扬沙效果较好,文心一格马的细节不错但未画出万马的感觉;在 “武松打虎” 描述下,商汤秒画表现最佳,通义万相有点闹着玩,文心一格至少画出了老虎。

百度文心一格与头条豆包对比生成图质量


头条 “豆包” 在生成图片方面有多种风格选择,画质也比较优质,但有时不能完全理解描述内容,比如河边路可能会出现汽车开到河里的情况。文心一格在生成效果上也有其特点,但也存在一些问题,如人物质感假、五官扭曲失真等情况。整体来看,豆包在生成图方面可能稍占优势。

百度文心一格与国外 Midjourney 对比特色


在使用体验方面,文心一格对国内用户来说几乎没有学习成本,输入几个关键词,选择风格和尺寸,就可以生成画作,一般不需要等很久,生产画作消耗 “电量”,可花钱购买电量值或做任务获得。Midjourney 的使用需要一些门槛,首先要使用魔法注册官网,然后登录已经准备好的 Discord,生成画作过程在 Discord 的新人 Channel 里进行,Midjourney 官网只用来付费和展示画作成品。在绘画效果方面,Midjourney 善于适应实际的艺术风格,创造出用户想要的任何效果组合的图像,擅长环境效果,特别是幻想和科幻场景,看起来像游戏的艺术效果。文心一格也有其独特之处,能根据用户的文字描述生成艺术作品,且能识别和生成一些中国风的描述关键词的内容,还有自己的分享平台,方便用户参考他人创作。
综上所述,百度的 AI 绘画产品文心一格在与其他公司的产品对比中,既有优势也有不足。在与 OpenAI 的 DALL・E 对比中,文心一格在某些方面还有较大的提升空间;与阿里通义万相、国内其他产品、头条豆包相比,各有特色和不足之处;与国外 Midjourney 相比,在使用体验和绘画效果上也有不同的特点。文心一格作为百度推出的 AI 艺术和创意辅助平台,在不断发展和进步中,未来有望在 AI 绘画领域发挥更大的作用。
©️版权声明:若无特殊声明,本站所有文章版权均归AI工具集原创和所有,未经许可,任何个人、媒体、网站、团体不得转载、抄袭或以其他方式复制发表本站内容,或在非我站所属的服务器上建立镜像。否则,我站将依法保留追究相关法律责任的权利。

相关文章