了解AIGC、GPT模型的小伙伴应该或多或少都了解到的情况:国内外AIGC领域,各大小厂商、AI创业者正如火如荼地开展“军备竞赛”。而就在上两周,我申请了一个多月的百度文心一言内测账号也终于下发了下来。那么,前段时间百度发布的多模态GPT模型——文心一言的AI 绘图水平如何?我们一起尝尝鲜~
便于量化绘图质量,我将从【答题契合度】、【绘图质量】、【创意创新度】3个角度进行打分(满分均为10分),当然,这是带有个人主观意见的~
1 人物篇
CASE1 卖火柴的小女孩
【答题契合度】10、【绘图质量】8、【创意创新度】9
您别说,这还挺像那么回事儿的,如果解决了版权问题,这图片是不是可以直接放在书中做插画、墙上做海报?再来一张,看看表现如何?
【答题契合度】10、【绘图质量】10、【创意创新度】10
感觉还更好看了呢。。。
CASE2 看书的帅哥(动漫)
【答题契合度】9、【绘图质量】8、【创意创新度】8
还是达到了文字描述的诉求。
CASE3 弹钢琴的美少女
那让它画“弹钢琴的美少女”呢?
【答题契合度】10、【绘图质量】9、【创意创新度】9
再来一张,看看如何?
【答题契合度】10、【绘图质量】6、【创意创新度】9
感觉眼睛有点不自然以外,别的都还好~
人物篇就先这样吧~
2 自然风景篇
CASE4 九曲十八弯的山水
【答题契合度】10、【绘图质量】9、【创意创新度】9
有弯曲的河流、有山、有水,题目这是完全契合上了。总体来说,题目符合度、意境,都还是蛮不错。怕它骄傲,满分10分的画,给个9分。
CASE5 拨云见日
【答题契合度】8、【绘图质量】9、【创意创新度】9
3 成语与天马行空篇
CASE6 蚍蜉撼树
【答题契合度】8、【绘图质量】7、【创意创新度】7
说实话,有丢丢丑了。。。
CASE7 大象开花
【答题契合度】8、【绘图质量】9、【创意创新度】9
没毛病,这确实是大象开花
CASE8 猪猪白菜
【答题契合度】10、【绘图质量】9、【创意创新度】9
CASE9 鸳鸯火锅
作为一只四川人,看看经常点的“鸳鸯火锅”如何?哈哈
【答题契合度】10、【绘图质量】9、【创意创新度】9
没毛病,老铁!这就是字面意思的“鸳鸯”+ “火锅”~
CASE10 鸡蛋灌饼
【答题契合度】10、【绘图质量】9、【创意创新度】9
CASE11 虎头虎脑的胖小子
CASE12 数据海洋
【答题契合度】8、【绘图质量】8、【创意创新度】8
CASE13 数据知音
替我想一个logo如何?“数据知音”~
【答题契合度】10、【绘图质量】9、【创意创新度】9
Nice、简直是赛博朋克风爆棚呦!
小结
1、百度文心一言的AI绘图能力的客观评价。其实,我还提过一些别的问题,只是生成出来的差得有点离谱。这种失败率,大致在30%左右。但相比传统的,人找图、设计图而言,AI根据人类的需求指令快速绘图这种生产效率,是前者难以望其项背的。
2、AIGC生成图的工具与模型。除了百度的文心一言外,AIGC绘图的大模型,比较知名的有:
- midjourney - https://www.midjourney.com/
- Stable Diffusion - Stable Diffusion Online
- Adobe Firefly - https://www.adobe.com/tw/sensei/generative-ai/firefly.html
- ...
3、AI绘图的应用场景。我暂且想到的场景:
- 新媒体,写作的插画与配图
- 出版领域,插画/配图
- 短视频领域,快速生成核心创意的封面、或关键帧
- 广告营销领域,出具创意idea、生成创意海报
4、AI绘图领域面临的风险或亟待解决的问题:
- 数据确权 & 知识产权/版权归属问题
- 题目契合度,还有待提高(这一块的技术挑战还存在不少)
- 难点1:完全理解用户需求
- 难点2:将需求完全转换为合理的、高质量的图像内容
- 对生物识别技术(人脸识别、...)构成的网络欺诈风险。
- 对设计师(平面设计师、UI与UE设计师、...)的职业挑战
感谢您的阅读,我是致力于通过从事探索、研究、分享软件工具或从事软件开发,为提升社会生产力贡献一份力量的软件工程师【小所】~
如果你也喜欢这篇文章,亦可点赞、收藏、评论、转发~祝您生活愉快~