在关于人工智能讨论度高居不下的今天,各个行业的领路企业也纷纷不甘落后。Adobe作为媒体界的行业标杆,就在近期推出了自己的人工智能图像应用——萤火虫firefly。虽然这只萤火虫刚刚“起飞”,它已经展现的文字生图和能力算是及格。我分别在网页版和PS中尝试了firefly。下面简单来介绍下我使用已经开放的功能的一些体验。
(图片源于Adobe Firefly)
Text to image
非常直观的“文字描述>>>图片”功能。但一千个人心中有一千个哈姆雷特,训练出初始的模型不可能是每个人心目中理想的神笔。为了改善这个问题,firefly中有“show similar”和“use as reference image”。“Show similar”相当于让机器给出和这张图片相似的一些结果。”Use as reference image”则是将所选的图片作为参考,会影响下一次、在下一次个机器给出的结果,相当于允许用户简单的“训练”这个模型。(但这种训练只是单次的,并不会影响初始的模型。你会当你关闭网页再重新打开,输入同样的词汇时,机器并不会根据你选定的参考图片来给出理想的结果)。除了交互操作来筛选更理想的结果外,用户还可以用firefly自带的功能进行一些简单的图片处理。比如说改变图片长宽比、内容类型、风格、颜色、构图等。
对于这类AI工具,产生的图片更接近描述才是赢家。既然是Adobe,注定就是要被拿来比较的。firefly刚刚开放体验之际就有源源不断的对比测评,被拿来与其他AI文字生成图片功能来比较。Firefly相比市面上已有的其他AI图片生成工具并不理想,甚至被比作Midjourney一年前的v1版本,可见用户对其效果不太满意。一部分原因是新生的小萤火虫的文字处理和图片生成模型确实还无法与相对成熟、迭代数次的其他AI画图工具在同一水准竞争。二是Adobe坚持保护图片的版权,声明firefly仅使用Stock中的图片来训练模型。相比其他AI绘图工具,大量训练图片的缺失自然而然会导致不理想的效果,尤其是艺术作品里的人物形象或流行元素,firefly都无法给出准确的答案。比如,其他工具可以轻而易举且准确的画出皮卡丘,而firefly顶多给你一只大黄耗子。
(图片源于文章实测MidJourney吊打Adobe Firefly,老牌权威也跟不上新时代了-36氪 & @DrJimFan on Twitter)
关于训练所使用图片的版权问题,现在仍具有很大争议。但无疑,仅凭Adobe Stock中有限的图片无法将机器提高到理想的水平。鱼与熊掌不可兼得,在版权保护和AI能力之间,不知道Adobe的下一步会如何取舍。
2. Generative Fill
可以将这个功能理解为一键修改图像,AI会按照你的描述在图中可以增添或者删除某些元素到原本的画面中。我们用刷子来确定元素的位置,AI会自动做一个简单的整合,使之更好的契合原本的画面。虽然细节上肯定赶不上人工,但仅仅几秒内的完成效果已经很不错了。
移除同样是用刷子来表示移除元素的位置。AI会提供给我们几个备选的方案,如果不满意则可以点击more来查看新的方案。但这里没有像文字作画那样“赞同”某一个选择,所以机器没有一个明确的方向来产生新的方案,可能会导致新的方案更加糟糕或没什么变化。
另外一个选项则是更改背景。有点类似于P图软件的抠图,但只需要一个简单的指令就可以完成。这个功能普遍来说对于背景模糊的图片效果更好。
3. 创造字体
简单试用了一下文字方面的功能。与其说是创造字体,更准确的描述是是在文字上加入特殊的纹理。是一个很有艺术性的想法。但可以选择的字体有限。
(图片源于Adobe Firefly官网)
此外,firefly还展望了下美好未来,发布了一些仍在探索的、概念性的功能:比如
3D模型转图像:即用户来更改3D模型,就可以得到模型相应的图像。
图片尺寸延伸:将图片从4:3改为16:9时,不需要伸缩图片,AI会自动生成内容填补空余的尺寸。
这些功能目前还未能在adobe官网体验,官方也未给出概念视频。但是如果真的能实现的这些很有吸引力的功能的话,将有潜力运用在建筑、设计、城市规划等多种行业中。就看Adobe什么时候能做出这块饼了。
比起firefly目前展现出的能力,我更看好它另外的优势:融合在已经非常常用的Adobe studio软件里。在官方发布的视频中,可以看到,将未来更加强大的firefly融合到常用的Adobe系列软件中的概念。比如Ps,Ilustrator,甚至是用于视频处理的Premier中。虽然目前来看AI生成的结果还不够理想,但如果萤火虫将来的光亮真能够耀眼得无法忽略,相信它必然会带来巨大的效率提升。