谷歌的Gemini可能很快就能幫你完成你的工作。

有報導指出,Google正在對其生成式人工智慧助理進行重大升級。 雙子座這可能會使其從單純的對話助理轉變為更接近真正的商業代理商的工具。 [作者姓名]最近對Google應用程式程式碼進行的一項實驗性分析表明… 9to5Google開發者發現了一些程式碼片段,指向一項內部稱為「螢幕自動化」的功能。這表明,Gemini 可能很快就能在某些 Android 應用程式中代表用戶直接執行操作,例如下訂單或預訂航班,而無需用戶手動點擊螢幕。

雖然 Gemini 目前已經能夠處理諸如撰寫電子郵件或創建研究計劃之類的對話任務,但此次更新似乎旨在使其能夠與應用程式介面進行直接交互,例如點擊按鈕和瀏覽螢幕來完成用戶通常需要手動執行的任務。測試版的早期證據表明,這些功能最初將僅限於少數支援的應用程序,並且會強調用戶監督。谷歌警告“Gemini 可能會出錯”,用戶仍需對其代表自己執行的操作負責。

Gemini Advanced 徽標

這次升級如何將人工智慧從助理轉變為智慧體?

螢幕自動化的概念標誌著人工智慧在日常數位工作流程中邁出了重要一步,賦予了人工智慧更多自主權。 Gemini 不僅會給予操作建議,可能很快就會直接在應用程式中執行這些選擇。谷歌測試版中的早期程式碼片段也表明了隱私保護措施,例如建議用戶不要在人工智慧對話中輸入登入或支付信息,並警告用戶螢幕截圖可能會被審核以改進該功能。谷歌已經透過其在 Workspace 和網頁上的 Gemini Agent 平台提供了一些代理功能,人工智慧可以處理複雜的工作流程並協調不同服務,但螢幕自動化可以將這些功能直接帶到智慧型手機和日常應用程式的使用中。

圖片顯示了Google Gemini 在 Pixel 手機上運行的情況。

如果這些功能廣泛推廣,人們與行動裝置的互動方式可能會轉變,從手動點擊和滑動轉變為授權人工智慧工具代表自己執行操作。這或許能簡化日常流程,但也引發了關於控制、安全和監管的問題,尤其是在自動化涉及預訂或金融交易等敏感任務時。

據報道,Google將這些升級定位為可選且受監管的,允許用戶隨時停用或覆蓋 Gemini 的預設設定。然而,螢幕自動化功能仍在開發中,尚未發布穩定版本。

評論被關閉。