下载草莓视频,一色屋精品屋兔免费视频

AI生圖王者之戰(zhàn)！深度體驗(yàn)實(shí)測(cè)，誰(shuí)是真正的藝術(shù)家？

發(fā)布時(shí)間：2023-12-18 11:15瀏覽次數(shù)：

美譽(yù)度品牌管理

10月11日凌晨，設(shè)計(jì)軟件巨頭Adobe宣布推出一系列圖像生成模型，其中Firefly Image 2作為新一代圖像生成器，通過(guò)改善皮膚、頭發(fā)、眼睛、手和身體結(jié)構(gòu)增強(qiáng)了人體渲染質(zhì)量，提供更好的色彩和改進(jìn)的動(dòng)態(tài)范圍，并為用戶(hù)提供更大的控制輸出的能力。

此前，OpenAI于9月21日宣布旗下圖像生成工具DALL-E的升級(jí)，新版本DALL-E 3大幅提升圖像生成質(zhì)量，尤其改進(jìn)了在圖像上生成文字的功能。

在國(guó)外圖像生成賽道，Midjourney和DALL-E常被視為兩大競(jìng)爭(zhēng)對(duì)手。Adobe Firefly 2的發(fā)布，意味著又一強(qiáng)大競(jìng)爭(zhēng)對(duì)手加入，形成三強(qiáng)對(duì)陣的格局。

雖然Adobe在今年3月便推出了Firefly模型的測(cè)試版，但當(dāng)時(shí)一些圖像分析師批評(píng)Firefly在生成效果方面落后于Midjourney和DALL-E 2等競(jìng)爭(zhēng)對(duì)手，他們將這一差距部分歸因于Adobe承諾僅使用授權(quán)和公共領(lǐng)域內(nèi)容進(jìn)行培訓(xùn)。

下面是一組Adobe Firefly、Midjourney與DALL-E 2生成圖像對(duì)比，提示詞為：山谷，童話般的樹(shù)屋村莊覆蓋，啞光繪畫(huà)，高度精細(xì)，動(dòng)態(tài)照明，電影，現(xiàn)實(shí)主義，逼真，照片真實(shí)，日落，詳細(xì)，高對(duì)比度，去噪，居中。

▲Adobe Firefly、Midjourney與DALL-E 2生成圖像對(duì)比（圖源：Muhammad Usman，mdorazio）

從上圖的對(duì)比可以看出，Midjourney生成的圖像內(nèi)容最豐富，有很多細(xì)節(jié)描繪；DALL-E 2的生成更類(lèi)似于油畫(huà)風(fēng)格，雖然不夠逼真，但表現(xiàn)尚可。

相比之下，F(xiàn)irefly的生成效果則不盡人意，既沒(méi)有符合大多數(shù)提示詞，整體質(zhì)量也較差，甚至在物體輪廓上出現(xiàn)雜色。

此次更新，F(xiàn)irefly 2大幅提升了生成圖像質(zhì)量和準(zhǔn)確性，尤其是人像渲染方面。

▲Firefly 2與Firefly 1生成圖像對(duì)比（圖源：Adobe）

那么，目前的Firefly 2在其他方面具體表現(xiàn)如何？它能否與DALL-E 3和Midjourney競(jìng)爭(zhēng)，幫助Adobe在生成式AI領(lǐng)域占據(jù)一席之地？這三款圖像生成器各自具有什么樣的特點(diǎn)和優(yōu)勢(shì)？近日，外媒Gold Penguin從8個(gè)方面的生成圖像效果對(duì)比中，也許找到了這些問(wèn)題的答案。

總體來(lái)看，三款圖像生成器各具風(fēng)格，也各具優(yōu)勢(shì)。如DALL-E 3擁有優(yōu)秀的文字生成功能，更適合高語(yǔ)境提示；Adobe Firefly 2生成效果最逼真，在人像細(xì)節(jié)等寫(xiě)實(shí)表現(xiàn)上最具優(yōu)勢(shì)；Midjourney則時(shí)常迸發(fā)出一些“藝術(shù)性”的創(chuàng)作，可提供創(chuàng)作靈感。

下表總結(jié)了這三款圖像生成器在可用性、輸出效果、運(yùn)行速度等方面的特點(diǎn)，供讀者參考。簡(jiǎn)單來(lái)說(shuō)：Firefly 2更逼真，Midjourney更藝術(shù)，DALL-E 3善解人意。

▲三款A(yù)I圖像生成器性能對(duì)比（圖源：Gold Penguin，美譽(yù)度譯制）

一、三路選手PK，行業(yè)巨頭對(duì)決兩家AI獨(dú)角獸

今天，我們讓三位選手來(lái)進(jìn)行一場(chǎng)大PK。

首先是一號(hào)選手Adobe Firefly Image 2，它是Adobe于10月11日凌晨推出的新一代圖像生成模型。

Adobe公司在圖像處理領(lǐng)域的地位可謂是不言而喻。背靠Adobe，F(xiàn)irefly系列一經(jīng)推出便獲得了巨大的關(guān)注。

據(jù)介紹，F(xiàn)irefly 2通過(guò)改善圖像中人體皮膚、頭發(fā)、眼睛、手和其它身體結(jié)構(gòu)，來(lái)增強(qiáng)圖像的渲染質(zhì)量，為用戶(hù)生成更高質(zhì)量圖像。

Firefly 2模型有三大新功能：生成匹配（Generative Match）、照片設(shè)置（Photo Settings）、提示指導(dǎo)（Prompt Guidance）。

它支持100多種語(yǔ)言的文本提示，以及包括“快速”生成積分在內(nèi)的新付費(fèi)計(jì)劃。

▲Firefly 2的生成匹配功能（圖源：Adobe）

二號(hào)選手DALL-E 3來(lái)頭也不一般。

DALL-E 3是OpenAI于9月21日凌晨推出的升級(jí)版文生圖工具，與之前的版本相比，它的提示理解能力更強(qiáng)，對(duì)文本的處理效果也更好。

OpenAI作為現(xiàn)象級(jí)應(yīng)用ChatGPT的開(kāi)發(fā)商，可謂是刮起了一陣AIGC熱潮。

升級(jí)后的DALL-E 3原生集成至ChatGPT，對(duì)兩款產(chǎn)品而言都是“如虎添翼”。10月3日，微軟宣布DALL-E 3可供所有Bing Chat和Bing Image Creator用戶(hù)免費(fèi)使用，再次降低了它的使用門(mén)檻。

值得一提的是，DALL-E 3在此次升級(jí)中增強(qiáng)了“在圖像上生成文字”的功能，此功能目前在Firefly 2和Midjourney中暫未實(shí)現(xiàn)。

▲DALL·E 3可在圖像上生成準(zhǔn)確的文字（圖源：OpenAI）

三號(hào)選手Midjourney與前兩位相比，背后的公司可能沒(méi)有太大的名頭，但它憑借著強(qiáng)大的圖像生成質(zhì)量，一度成為圖像生成領(lǐng)域的現(xiàn)象級(jí)應(yīng)用，一年實(shí)現(xiàn)1000萬(wàn)用戶(hù)和1億美元營(yíng)收。

Midjourney公司成立于2021年8月，創(chuàng)始人大衛(wèi)·霍爾茨（David Holz）曾是體感控制器公司Leap Motion的聯(lián)合創(chuàng)始人。Midjourney以詳細(xì)的輸出、通過(guò)提示工程參數(shù)進(jìn)行的廣泛定制和細(xì)微差別而著稱(chēng)，其最新5.2版本于6月23日推出。

Midjourney 5.2版本的最大亮點(diǎn)在于放大（Zoom Out）功能，允許用戶(hù)將放大圖像的畫(huà)布擴(kuò)展到其原始邊界之外，而不更改原始圖像的內(nèi)容。新擴(kuò)展的畫(huà)布將根據(jù)提示和原始圖像的指導(dǎo)進(jìn)行填充。

▲Midjourney的放大功能（圖源：Midjourney）

9月，Midjourney首席執(zhí)行官曾向媒體透露，Midjourney 6會(huì)在今年內(nèi)發(fā)布，將實(shí)現(xiàn)品質(zhì)上的巨大飛躍。

二、Adobe Firefly 2、Midjourney、DALL-E 3生成圖像大比拼

接下來(lái)，讓我們從8個(gè)方面對(duì)比一下Adobe Firefly 2、Midjourney和DALL-E 3生成圖像的效果，分別是寫(xiě)實(shí)人像、建筑設(shè)計(jì)、風(fēng)景、超現(xiàn)實(shí)主義、抽象概念、風(fēng)格化藝術(shù)、矢量平面設(shè)計(jì)以及文字生成。

1、寫(xiě)實(shí)人像

首先是Adobe Firefly 2“大肆宣揚(yáng)”的人像，下面兩組圖的提示詞分別為：一個(gè)疲憊大學(xué)生的特寫(xiě)；一位身著黃色襯衫女士的肖像照。

▲寫(xiě)實(shí)人像（圖源：Gold Penguin）

▲寫(xiě)實(shí)人像（圖源：X博主@saana_ai）

可以看出，Adobe Firefly 2生成的人像確實(shí)非常逼真，面部表情清晰，具有明顯的皮膚、毛發(fā)質(zhì)感，光照效果也很好。

Midjourney的輸出也相當(dāng)不錯(cuò)，但與Firefly 2相比更柔和，皮膚質(zhì)感略遜一籌。對(duì)于第一組提示詞，Midjourney生成的圖像中桌面上的書(shū)本存在渲染失誤，不過(guò)并不明顯。

對(duì)比之下，DALL-E 3生成的人像有些遜色，幾乎不存在皮膚和毛發(fā)質(zhì)感。對(duì)于第一組提示詞，DALL-E 3過(guò)分強(qiáng)調(diào)了學(xué)生的疲憊，“黑眼圈”有些夸張。

值得一提的是，這些圖像都沒(méi)有產(chǎn)生“恐怖谷”效應(yīng)，這是一個(gè)很大的優(yōu)點(diǎn)。

2、建筑設(shè)計(jì)

再來(lái)看看建筑設(shè)計(jì)，第一組圖的提示詞為：從廣角俯瞰，帶下沉式客廳的時(shí)尚磚墻曼哈頓風(fēng)格閣樓。

▲建筑設(shè)計(jì)（圖源：Gold Penguin）

對(duì)于第一組提示詞，這三個(gè)圖像生成器都沒(méi)有完全理解提示意圖。它們都創(chuàng)造了一個(gè)曼哈頓風(fēng)格的閣樓，但很難將下沉式客廳的部分表現(xiàn)出來(lái)。

Adobe Firefly 2的照明效果最好，強(qiáng)調(diào)了陰影與光線來(lái)源的對(duì)應(yīng)關(guān)系，并將它們完美地融合在一起。

Midjourney最大的優(yōu)點(diǎn)是注重細(xì)節(jié)。從一樓的書(shū)籍到二樓的畫(huà)作，都符合典型閣樓式公寓的設(shè)計(jì)。

DALL-E 3的燈光則顯得有些夸張，質(zhì)感也比較柔和。不過(guò)，它是唯一表現(xiàn)了“下沉式客廳”這一提示詞的生成器，雖然表現(xiàn)方式有些失誤。

第二組圖的提示詞為：臥室，大窗戶(hù)，現(xiàn)代家具，灰色和金色，豪華，中世紀(jì)現(xiàn)代風(fēng)格。

▲建筑設(shè)計(jì)（圖源：X博主@chaseleantj）

對(duì)于第二組提示詞，三個(gè)圖像生成器都表現(xiàn)得很好。不過(guò)相比之下，DALL-E 3生成的圖像對(duì)“豪華”和“金色”提示詞的表現(xiàn)比其他兩個(gè)生成器少。

3、風(fēng)景

在風(fēng)景景觀方面，第一組提示詞為簡(jiǎn)短的詞組：野花草地日落景觀。

▲風(fēng)景（圖源：Gold Penguin）

對(duì)于第一組提示詞，Adobe Firefly 2的輸出效果栩栩如生，但與網(wǎng)絡(luò)上的草地圖片過(guò)于相似。此外，野花的渲染似乎出現(xiàn)了故障，細(xì)看會(huì)發(fā)現(xiàn)沒(méi)有一朵花是正常渲染的。

Midjourney的草地色彩非常鮮艷，但傾向于風(fēng)格化，比起寫(xiě)實(shí)照片更像是一幅畫(huà)。

DALL-E 3更加強(qiáng)調(diào)“日落”這個(gè)提示詞，整體色彩呈橘色色調(diào)，給人一種雄偉壯觀的感覺(jué)。雖然它不是色彩最豐富的，但質(zhì)感細(xì)膩。

第二組提示詞比較詳細(xì)：無(wú)人機(jī)航拍波拉波羅島令人驚嘆的陸地景觀，陽(yáng)光下波光粼粼的水面。

▲風(fēng)景（圖源：X博主@chaseleantj）

對(duì)于第二組提示詞，F(xiàn)irefly 2和Midjourney生成圖像相似，有種宏大的史詩(shī)感，不過(guò)后者的樹(shù)木渲染更具細(xì)節(jié)。

DALL-E 3的水面渲染則顯得有些粗糙，強(qiáng)調(diào)了“陽(yáng)光”，但卻沒(méi)有表現(xiàn)出強(qiáng)烈光照下的陰影投射，因此顯得很扁平。

4、超現(xiàn)實(shí)主義

看完了現(xiàn)實(shí)，再來(lái)看看超現(xiàn)實(shí)主義。下圖的提示詞為：一幅超現(xiàn)實(shí)主義油畫(huà)，牛仔布做的房子中有一只大螢火蟲(chóng)。

▲超現(xiàn)實(shí)主義（圖源：Gold Penguin）

對(duì)于第一組提示詞，三個(gè)生成器采取了完全不同的處理方式。

Adobe Firefly 2的作品大量借鑒了兒童讀物，風(fēng)格很像兒童繪本。

Midjourney結(jié)合了現(xiàn)實(shí)世界的圖像和奇幻的概念。與其他兩張圖像不同，它將視角放在了房間內(nèi)部，也因此對(duì)“牛仔布”的表現(xiàn)并不明顯。此外，Midjourney似乎連螢火蟲(chóng)都渲染成了牛仔布質(zhì)感。這可能有些偏離提示詞的描述，但測(cè)試者表示很喜歡這個(gè)處理。

DALL-E 3的處理方式則更具藝術(shù)性，它模糊了房子的界限，創(chuàng)造了一種新的敘事方式。它還“創(chuàng)作”了一些細(xì)節(jié)，比如兩個(gè)月亮和口袋窗戶(hù)。

再試試更抽象的提示詞：震驚、美麗的外星人，科幻、未來(lái)，淺茶色和琥珀色。

▲超現(xiàn)實(shí)主義（圖源：X博主@saana_ai）

對(duì)于第二組提示詞，三個(gè)生成器的處理方式也是各具風(fēng)格。

Adobe Firefly 2仍然采用了類(lèi)似于插畫(huà)的風(fēng)格，Midjourney和DALL-E 3則更偏向于“寫(xiě)實(shí)”。但DALL-E 3忽略了“琥珀色”這個(gè)提示詞，并且生成的圖像比起“外星人”，似乎更接近“機(jī)器人”。

5、抽象概念

如果說(shuō)超現(xiàn)實(shí)主義還提供了一些細(xì)節(jié)上的表述，接下來(lái)我們?cè)僭囋囃耆橄蟮母拍?。下圖的提示詞為：無(wú)限的可視化。

▲抽象概念（圖源：Gold Penguin）

“無(wú)限”是無(wú)法被創(chuàng)造出來(lái)的，但三幅作品進(jìn)行了不同的嘗試來(lái)表現(xiàn)這個(gè)概念。

Adobe Firefly 2和DALL-E 3都選取了螺旋化的表達(dá)方式，F(xiàn)irefly 2類(lèi)似于斐波那契數(shù)列的可視化，DALL-E 3生成的圖像則更加迷幻，具有豐富的色彩，看起來(lái)就像一件復(fù)雜的扎染襯衫。

Midjourney生成的圖像則具有故事性，一個(gè)人類(lèi)的背影向光芒走去，四周?chē)@著像藤蔓或樹(shù)枝一樣的東西。

6、風(fēng)格化藝術(shù)

在一些風(fēng)格化藝術(shù)的理解上，三位選手也表現(xiàn)各異。第一組圖的提示詞為：達(dá)達(dá)主義（Dadaism）風(fēng)格插圖，婦女為爭(zhēng)取平等而斗爭(zhēng)。

▲風(fēng)格化藝術(shù)（圖源：Gold Penguin）

達(dá)達(dá)主義誕生于20世紀(jì)初，具體可以追溯到第一次世界大戰(zhàn)期間。達(dá)達(dá)藝術(shù)以非傳統(tǒng)材料、拼貼、組合和表演為特征，旨在挑釁和震撼觀眾，達(dá)到質(zhì)疑藝術(shù)和社會(huì)的意義和目的。

Adobe Firefly 2的輸出看起來(lái)不像任何達(dá)達(dá)藝術(shù)，且多次調(diào)整提示詞后，得到的結(jié)果總是相似。

Midjourney和DALL-E 3則理解了背景，它們的作品完全模仿了達(dá)達(dá)主義。

Midjourney傾向于拼貼藝術(shù)，與著名的俄國(guó)藝術(shù)家漢娜·霍克（Hannah H?ch）風(fēng)格相似；DALL-E 3更偏向于模仿法國(guó)藝術(shù)家馬塞爾·杜尚（Marcel Duchamp）。這兩位藝術(shù)家都是達(dá)達(dá)主義運(yùn)動(dòng)時(shí)期的杰出代表。

再來(lái)看看像素風(fēng)格藝術(shù)，采用的提示詞為：白色背景上的Q版像素藝術(shù)，RPG游戲的游戲資產(chǎn)，以揮舞火之力量的龍巫師盔甲為特色，周?chē)h(huán)繞著配套的物品組。

▲風(fēng)格化藝術(shù)（圖源：X博主@chaseleantj）

對(duì)于像素風(fēng)格藝術(shù)，DALL-E 3的表現(xiàn)非常突出。它覆蓋了幾乎所有提示詞，同時(shí)生成了Q版人物（Chibi characters）、像素藝術(shù)和物品套裝。

Firefly 2成功地完成了像素藝術(shù)，但忽略了“白色背景”和“物品組”的提示詞。

Midjourney的作品甚至沒(méi)有像素化。

7、矢量平面設(shè)計(jì)

接下來(lái)是辦公領(lǐng)域比較實(shí)用的矢量平面設(shè)計(jì)。首先我們讓AI助手來(lái)畫(huà)一下AI助手，提示詞：一個(gè)AI助手的平面矢量插圖。

▲矢量平面設(shè)計(jì)（圖源：Gold Penguin）

Adobe Firefly 2又一次理解失誤。輸出本身仍然是矢量藝術(shù)，但沒(méi)有表現(xiàn)“AI助手”這個(gè)關(guān)鍵詞。

Midjourney和DALL-E 3的輸出則更像傳統(tǒng)的矢量藝術(shù)。前者著重表現(xiàn)AI助手幫助人類(lèi)工作這一場(chǎng)景，后者則將重點(diǎn)放在“AI助手”本身。

值得注意的是，DALL-E 3甚至在沒(méi)有提示的情況下自行添加了文字，且具有邏輯性。

再試一下更具象的提示詞：白色背景上簡(jiǎn)單的平面矢量插畫(huà)，一位女性和一只小狗坐在辦公桌前，拿著筆記本電腦。

▲矢量平面設(shè)計(jì)（圖源：X博主@chaseleantj）

第二組提示詞三位選手整體都表現(xiàn)不錯(cuò)。

但細(xì)看之下，F(xiàn)irefly 2和Midjourney都有些細(xì)節(jié)上的缺陷。Firefly 2生成圖像中，女人的左手似乎“消失”了；Midjourney生成圖像中，小狗的耳朵太過(guò)尖銳，看起來(lái)更像一只貓。

DALL-E 3的表現(xiàn)風(fēng)格則更加扁平化，色塊干凈，很適合用在演示文稿和宣傳材料中。

8、文字生成

最后是DALL-E 3引以為傲的文字生成功能，提示詞：白色背景上的定制貼紙?jiān)O(shè)計(jì)，采用優(yōu)雅的字體書(shū)寫(xiě)“Rachel”字樣，并點(diǎn)綴以水彩蝴蝶、雛菊和柔和的粉彩色調(diào)。

▲文字生成（圖源：X博主@chaseleantj）

在文字生成方面，DALL-E 3取得了壓倒性的勝利。Firefly 2和Midjourney均無(wú)法生成準(zhǔn)確的文字，不過(guò)相比之下，F(xiàn)irefly 2比Midjourney稍微接近正確答案一些。

Firefly 2和DALL-E 3對(duì)“貼紙”的表現(xiàn)更明顯，均采取了白色描邊的方式來(lái)表現(xiàn)。水彩風(fēng)格上，F(xiàn)irefly 2表現(xiàn)最佳。

值得注意的是，F(xiàn)irefly 2似乎總是在忽略“白色背景”這一提示詞，“執(zhí)著地”以淺綠色的背景來(lái)代替。

結(jié)語(yǔ)：行業(yè)巨頭加入戰(zhàn)場(chǎng)，AI圖像生成器混戰(zhàn)開(kāi)始

生成式AI正在重塑藝術(shù)創(chuàng)作領(lǐng)域，通過(guò)圖像生成器，任何人都可以通過(guò)編寫(xiě)文本提示打開(kāi)藝術(shù)創(chuàng)作的新世界，從事創(chuàng)造性工作的人們也可以節(jié)省大量時(shí)間、激發(fā)想象力的更多可能性。

作為老牌的創(chuàng)意軟件巨頭，Adobe通過(guò)一系列更新再次強(qiáng)化了其在圖像編輯領(lǐng)域的深厚積累，F(xiàn)irefly 2的表現(xiàn)比升級(jí)前大幅提升，可以與Midjourney、DALL-E 3打得有來(lái)有回。

與此同時(shí)，國(guó)內(nèi)的百度文心一言、訊飛星火認(rèn)知大模型等都上線了圖像生成能力，并面向全社會(huì)開(kāi)放；國(guó)內(nèi)知名的圖像軟件公司美圖也在積極布局生成式AI，于10月9日發(fā)布自研視覺(jué)大模型3.0，增強(qiáng)了圖像生成質(zhì)量以及提示詞智能聯(lián)想功能。

良性的競(jìng)爭(zhēng)可以為用戶(hù)提供更多選擇，促使產(chǎn)品不斷迭代進(jìn)化。也許，一年后我們回過(guò)頭來(lái)看，會(huì)發(fā)覺(jué)如今的圖像生成效果是多么“稚嫩”。

上一篇：從平板手寫(xiě)筆到電競(jìng)鼠標(biāo)，星閃正重新定義短距無(wú)線通信

下一篇：萬(wàn)物互融時(shí)代的軟件底座，OPPO潘塔納爾亮出了首份年度成績(jī)單

公司資訊

新聞中心

公司資訊

公司資訊

新聞中心

公司資訊

微信號(hào)：15221830078微信二維碼