Google Gemini 現在支援上傳音訊檔案和其他新檔案類型。
幾個月來,Google的 Gemini 應用能夠處理上傳的圖片、PDF 甚至視頻,但音頻卻明顯缺失。這種情況今天正在改變。谷歌悄然推出了 Gemini 中最受歡迎的功能之一:音訊檔案上傳。

更廣泛的支持,更多的用途
期待已久的功能

Google 實驗室和 Gemini 副總裁 Josh Woodward 證實, X 上的功能發布,並將其描述為“請求 #1”。此更新現已在 Android、iOS 和網路上發布,您可以透過點擊熟悉的「上傳檔案」選項來新增 MP3、WAV 和大多數其他流行格式。
正如您可能想的那樣,存在一些限制。 對於免費訂閱的 Gemini 用戶 一次最多上傳 10 個文件,但這些上傳文件的音訊總時長不得超過 10 分鐘。如果您訂閱 Google 的付費方案(Gemini Advanced via AI Pro 或 AI Ultra),此限制將大幅增加,達到 3 小時。
✅ Papercut 已修復:您現在可以將任何檔案上傳到 @GeminiApp。包括 #1 請求:現在支援音訊檔案! pic.twitter.com/4Te3xwLC6W
— 喬許·伍德沃德(@joshwoodward) 2025 年 9 月 8 日
雖然不是無限的,但相對來說也比較慷慨。相比之下,它仍然 Gemini 上的影片下載 免費用戶限制使用五分鐘,付費用戶則為一小時。音訊的使用時長是免費限制的兩倍,而付費用戶則提供三倍的空間,這對於轉錄、分析會議記錄或播客分析等用例來說非常有意義。
自從今年稍早推出檔案上傳功能以來,Gemini 一直缺乏音訊支援,這真是一個奇怪的缺陷。 Gemini 已經能夠總結 YouTube 影片並處理你提交的短視頻,但錄製快速語音備忘錄並讓 AI 處理的功能卻直到現在才得以實現。
有了這項功能,Gemini 的功能更接近 OpenAI 的 ChatGPT 等競爭對手,後者幾個月來一直支援音訊和文字上傳。但問題依然存在:10 分鐘對一般用戶來說夠用嗎?這種差異表明,Google希望音訊處理成為訂閱的另一個激勵因素。無論如何,如果您一直在等待將播客片段、講座片段,甚至是您自己的隨機語音筆記輸入 Gemini,現在是時候嘗試一下了。
評論被關閉。