現在您可以在 Gemini 上上傳和編輯照片了。

後綴:

  • 現在您可以在 Gemini 上免費上傳和編輯照片了。此功能從今天開始逐步向所有用戶推出。
  • 使用者還可以透過對話式文字提示在 Gemini 上建立和編輯 AI 驅動的圖像。
  • 谷歌確認,Gemini 上人工智慧創建的所有影像都將包含可見浮水印和看不見的數位浮水印 SynthID。

最後,Google在 Gemini 應用中推出了透過文字提示編輯照片的功能。現在,您可以透過文字對話在 Gemini 中上傳和編輯現有照片。此外,您還可以使用 Gemini 建立 AI 影像,並複製這些影像進行編輯。這項 Gemini 照片編輯功能從今天開始逐步向所有用戶推出。這項新功能提升了使用者體驗,並提供了強大的創意工具。

谷歌率先在 AI Studio 中使用 Gemini 2.0 Flash 模型提供原生影像編輯功能。我二月測試了這個模型,它讓我驚訝於以對話方式編輯影像的便利性。為了應對Google的原生圖像創建模型,OpenAI 也在其 ChatGPT 中引入了原生圖像編輯和創建功能。

這導致了 吉卜力工作室 ChatGPT 迅速傳播並提高了其使用率。現在,Google已在其面向消費者的應用程式 Gemini 中引入了原生圖像編輯功能。值得注意的是,您可以在 Gemini 行動應用程式和網頁版上編輯圖片。這項功能使 Gemini 成為生成式人工智慧領域的有力競爭者。

因為我比較過 ChatGPT 與 Gemini 之間的原始影像編輯我可以肯定地說,Gemini 在保持角色/場景跨世代一致性方面遠勝於 ChatGPT。 ChatGPT 每次迭代都會改變整體影像,而 Gemini 則保持了高度一致性。然而,在影像生成方面,ChatGPT 的表現優於 Gemini。這反映了兩者模型結構的差異。

現在我們需要確定Google是否仍在使用 Imagen 3 的基於擴散的影像生成模型,還是利用了 Gemini 模型的原生影像生成功能。順便一提,OpenAI 使用 GPT-4o AI 模型進行影像生成和修改。這一發展趨勢顯示人工智慧領域競爭依然激烈。

除此之外,Google表示,所有使用Gemini建立或編輯的影像都會嵌入一個名為SynthID的隱形數位浮水印。此外,谷歌還將為所有使用Gemini創建的圖​​像添加可見水印。此舉旨在提升人工智慧使用的透明度和問責制。

評論被關閉。