Grok 與 Gemini 在 7 項 AI 影像生成測試中的比較：哪個比較好？

每個圖像生成器都有自己的優勢。

AI 影像產生器正在快速發展，變得更加聰明、快速且更具創造力。在測試了 ChatGPT-5 和 Gemini 的圖像生成能力後，我想將Google的 Gemini 與伊隆馬斯克的「免費」聊天機器人 Grok 的性能進行比較。

在七輪角逐中，我測試了每個模型對指令的執行情況以及生成令人信服圖像的能力，其中包括照片級逼真的請求和皮克斯風格的請求。以下是每個模型的主要優勢，以及最終勝出的AI。本次比較將幫助您了解Gemini和Grok哪個模型最適合您的AI影像產生需求。

1.超現實的產品概念

宣稱： “創建一張逼真的照片，照片中一台可折疊的透明智慧型手機擺放在木製咖啡桌上，其表面反射著城市的燈光。”

它起作用了 格羅克 為了滿足我的要求，他拍攝了兩張寫實的照片，涵蓋了我要求的所有細節。兩張版本都經過精心打磨，準確反映了設計理念。

結果是 雙子座 不錯，但不完美。這款透明智慧型手機看起來有點不成比例，而城市燈光的倒影（宣傳語中的關鍵部分）也沒有 Grok 的那麼逼真。

優勝者： 勝利 格羅克 產生高品質的圖像，並最佳地解讀聲明。在本次 AI 影像生成測試中，Grok 的表現明顯優於其他工具。

2. 描繪有情感的人物

宣稱： 「畫一幅漫畫風格的插圖，描繪一位年輕宇航員意識到自己忘記了火星上的頭盔——帶有誇張的表情、鮮豔的色彩和卡通式的幽默感。”

生產 格羅克 兩張照片中，太空人似乎都戴著頭盔，一臉驚訝。由於兩張照片間隔很近，很難對影像進行具體的解讀，而且「遺忘」的現像也不太明顯。

生產 雙子座 這張圖描繪了一位健忘的太空人。思維泡泡更好地表明了太空人不適的原因，儘管如果太空人實際上沒有戴頭盔，圖像效果會更好。背景和整體設計都很清晰。

獲勝者：雙子座 因更嚴格遵循提示說明並創造出更滑稽的形象而獲勝。

3. 重塑歷史

宣稱： “以列奧納多·達·芬奇的風格，畫一幅文藝復興風格的克利奧帕特拉手持現代智慧型手機的畫作。”

生產 格羅克 這幅畫作看起來像是一位身著文藝復興風格服飾、手持智慧型手機的現代女性的照片。這幅畫作看起來更像是一張自拍照，非常具有現代感。

聚焦 雙子座 從藝術角度來看，這幅畫看起來更像是一幅文藝復興時期的畫作，也更像克莉奧佩特拉本人，而不僅僅是一位穿著現代服裝的女性。

獲勝者：雙子座 它因對請求的最佳解釋和最佳的歷史準確性而獲勝。

4. 複雜人群場景

宣稱： “拍攝一張跨年夜時代廣場的空拍照片，照片中擠滿了人群，廣告牌閃閃發光，夜空中飄落著五彩紙屑。”

格羅克 這一輪真的太失望了。兩張照片都一樣糟糕，有點模糊，而且沒能很好地捕捉到時代廣場的跨年夜。照片中人與人之間的距離太遠，而且一些可能暗示跨年夜的細節也缺失了。

雙子座 捕捉時代廣場跨年的活力與人潮。這張照片顯然是在紐約市拍攝的，而且這些標語也凸顯了這一盛事。人群擁擠，與格羅克的攝影作品截然不同。

獲勝者：雙子座 榮獲時代廣場跨年最清晰、最準確的照片。

5. 超現實混音

宣稱： “想像一下，一隻巨大的章魚在海底的玻璃室裡與阿爾伯特愛因斯坦下棋。”

臉 格羅克 這次測試有點難。它「思考」的時間比測試中迄今為止的任何其他提示都要長得多。圖片不錯，但沒有考慮到「玻璃房間」這個提示。

腳 雙子座 我立刻拍了一張看起來像肖像的照片。玻璃房子很有趣，也很逼真。章魚比格羅克的要大得多，也更襯托出這幅奇怪的圖像。

獲勝者：雙子座 憑藉卓越的畫質和精準的指向取勝。

6. 資訊圖表清晰度

迅速的: “設計一個清晰的資訊圖表來展示蝴蝶的生命週期，標記各個階段，使用箭頭和盡可能少的顏色的平面圖像。”

這是一次嘗試 格羅克 建立一個既成功又失敗的圖表。第一版過於繁瑣，多了一隻不必要的蝴蝶，分散了人們對生命週期的注意力。第二個版本更接近聲明，但在生命週期細節上缺乏精確性。

雙子座 提供清晰的圖像，準確描述蝴蝶的生命週期，標籤清晰、顏色少、易於閱讀。

獲勝者：雙子座 他贏了，因為他一次就完成了索賠。影像準確無誤，可直接顯示。

7. 保持風格化的個人資料圖片的一致性。

宣稱： “創建一個皮克斯風格的 3D 角色模型，一個 40 歲的金發記者，手裡拿著一本筆記本，然後創建 3 種不同服裝的變體。”

格羅克 他完全沒有註意到這個主題中「皮克斯風格」的要求，以及「不同的服裝」部分。他設計了三種不同的髮型，這值得稱讚。

雙子座 以皮克斯風格粉碎記者，但忽略了三個不同之處。

贏家：平局 兩個機器人都沒聽懂指令。如果非要選一個，我會選Gemini，因為它的風格很到位，而且更好地捕捉了記者的氛圍。

總冠軍：雙子座

七條指令之後，Gemini 被證明是整體上最可靠的影像產生器。它能夠更一致、更準確地執行指令，產生更清晰的構圖，並掌握了 Grok 經常忽略的細節。換句話說，Gemini 非常擅長理解和執行文字命令來產生所需的圖像。

Grok 確實展現了創造力的閃光點，並在照片級寫實主義方面取得了顯著的勝利，但它在準確性方面卻常常有所欠缺，並且偏離了常規。如果您想要實驗性且突破常規的效果，Grok 也有其亮點。但對於注重清晰度、精準度和精細度的日常使用來說，Gemini 是我信賴的 AI 影像產生器，能夠勝任這項工作。簡而言之，對於尋求在各種場景下獲得一致、高品質結果的用戶來說，Gemini 是更好的選擇。

你試過 Grok 嗎？ Gemini 怎麼樣？你最喜歡哪一個？請在評論區留言告訴我。

雙子座格羅克