Grok 與 Gemini 在 7 項 AI 影像生成測試中的比較:哪個比較好?
每個圖像生成器都有自己的優勢。
AI 影像產生器正在快速發展,變得更加聰明、快速且更具創造力。在測試了 ChatGPT-5 和 Gemini 的圖像生成能力後,我想將Google的 Gemini 與伊隆馬斯克的「免費」聊天機器人 Grok 的性能進行比較。

在七輪角逐中,我測試了每個模型對指令的執行情況以及生成令人信服圖像的能力,其中包括照片級逼真的請求和皮克斯風格的請求。以下是每個模型的主要優勢,以及最終勝出的AI。本次比較將幫助您了解Gemini和Grok哪個模型最適合您的AI影像產生需求。
1.超現實的產品概念

宣稱: “創建一張逼真的照片,照片中一台可折疊的透明智慧型手機擺放在木製咖啡桌上,其表面反射著城市的燈光。”
它起作用了 格羅克 為了滿足我的要求,他拍攝了兩張寫實的照片,涵蓋了我要求的所有細節。兩張版本都經過精心打磨,準確反映了設計理念。
結果是 雙子座 不錯,但不完美。這款透明智慧型手機看起來有點不成比例,而城市燈光的倒影(宣傳語中的關鍵部分)也沒有 Grok 的那麼逼真。
優勝者: 勝利 格羅克 產生高品質的圖像,並最佳地解讀聲明。在本次 AI 影像生成測試中,Grok 的表現明顯優於其他工具。
2. 描繪有情感的人物

宣稱: 「畫一幅漫畫風格的插圖,描繪一位年輕宇航員意識到自己忘記了火星上的頭盔——帶有誇張的表情、鮮豔的色彩和卡通式的幽默感。”
生產 格羅克 兩張照片中,太空人似乎都戴著頭盔,一臉驚訝。由於兩張照片間隔很近,很難對影像進行具體的解讀,而且「遺忘」的現像也不太明顯。
生產 雙子座 這張圖描繪了一位健忘的太空人。思維泡泡更好地表明了太空人不適的原因,儘管如果太空人實際上沒有戴頭盔,圖像效果會更好。背景和整體設計都很清晰。
獲勝者:雙子座 因更嚴格遵循提示說明並創造出更滑稽的形象而獲勝。
3. 重塑歷史

宣稱: “以列奧納多·達·芬奇的風格,畫一幅文藝復興風格的克利奧帕特拉手持現代智慧型手機的畫作。”
生產 格羅克 這幅畫作看起來像是一位身著文藝復興風格服飾、手持智慧型手機的現代女性的照片。這幅畫作看起來更像是一張自拍照,非常具有現代感。
聚焦 雙子座 從藝術角度來看,這幅畫看起來更像是一幅文藝復興時期的畫作,也更像克莉奧佩特拉本人,而不僅僅是一位穿著現代服裝的女性。
獲勝者:雙子座 它因對請求的最佳解釋和最佳的歷史準確性而獲勝。
4. 複雜人群場景

宣稱: “拍攝一張跨年夜時代廣場的空拍照片,照片中擠滿了人群,廣告牌閃閃發光,夜空中飄落著五彩紙屑。”
格羅克 這一輪真的太失望了。兩張照片都一樣糟糕,有點模糊,而且沒能很好地捕捉到時代廣場的跨年夜。照片中人與人之間的距離太遠,而且一些可能暗示跨年夜的細節也缺失了。
雙子座 捕捉時代廣場跨年的活力與人潮。這張照片顯然是在紐約市拍攝的,而且這些標語也凸顯了這一盛事。人群擁擠,與格羅克的攝影作品截然不同。
獲勝者:雙子座 榮獲時代廣場跨年最清晰、最準確的照片。
5. 超現實混音

宣稱: “想像一下,一隻巨大的章魚在海底的玻璃室裡與阿爾伯特愛因斯坦下棋。”
臉 格羅克 這次測試有點難。它「思考」的時間比測試中迄今為止的任何其他提示都要長得多。圖片不錯,但沒有考慮到「玻璃房間」這個提示。
腳 雙子座 我立刻拍了一張看起來像肖像的照片。玻璃房子很有趣,也很逼真。章魚比格羅克的要大得多,也更襯托出這幅奇怪的圖像。
獲勝者:雙子座 憑藉卓越的畫質和精準的指向取勝。
6. 資訊圖表清晰度

迅速的: “設計一個清晰的資訊圖表來展示蝴蝶的生命週期,標記各個階段,使用箭頭和盡可能少的顏色的平面圖像。”
這是一次嘗試 格羅克 建立一個既成功又失敗的圖表。第一版過於繁瑣,多了一隻不必要的蝴蝶,分散了人們對生命週期的注意力。第二個版本更接近聲明,但在生命週期細節上缺乏精確性。
雙子座 提供清晰的圖像,準確描述蝴蝶的生命週期,標籤清晰、顏色少、易於閱讀。
獲勝者:雙子座 他贏了,因為他一次就完成了索賠。影像準確無誤,可直接顯示。
7. 保持風格化的個人資料圖片的一致性。

宣稱: “創建一個皮克斯風格的 3D 角色模型,一個 40 歲的金發記者,手裡拿著一本筆記本,然後創建 3 種不同服裝的變體。”
格羅克 他完全沒有註意到這個主題中「皮克斯風格」的要求,以及「不同的服裝」部分。他設計了三種不同的髮型,這值得稱讚。
雙子座 以皮克斯風格粉碎記者,但忽略了三個不同之處。
贏家:平局 兩個機器人都沒聽懂指令。如果非要選一個,我會選Gemini,因為它的風格很到位,而且更好地捕捉了記者的氛圍。
總冠軍:雙子座
七條指令之後,Gemini 被證明是整體上最可靠的影像產生器。它能夠更一致、更準確地執行指令,產生更清晰的構圖,並掌握了 Grok 經常忽略的細節。換句話說,Gemini 非常擅長理解和執行文字命令來產生所需的圖像。
Grok 確實展現了創造力的閃光點,並在照片級寫實主義方面取得了顯著的勝利,但它在準確性方面卻常常有所欠缺,並且偏離了常規。如果您想要實驗性且突破常規的效果,Grok 也有其亮點。但對於注重清晰度、精準度和精細度的日常使用來說,Gemini 是我信賴的 AI 影像產生器,能夠勝任這項工作。簡而言之,對於尋求在各種場景下獲得一致、高品質結果的用戶來說,Gemini 是更好的選擇。
你試過 Grok 嗎? Gemini 怎麼樣?你最喜歡哪一個?請在評論區留言告訴我。
評論被關閉。