雙子座將我複雜的研究變成了播客:我再也不會受苦了
從 Google Assistant 過渡到 Era 雙子座,幾乎已進入最後階段。人們可能會懷念同名的虛擬助手,但不可否認的是,Gemini 的到來確實改變了人工智慧代理為我們所能做的事情。
使用 Gemini,語言理解能力顯著提升。對話自然流暢,應用程式互動流暢順暢,與其他 Google 產品的整合也令人欣喜。 即使處於自由狀態即使在 iPhone 上,Gemini 的表現也比 Siri 更好。
然而,有一些技巧可以將雙子座歸入完全不同的類別。 深入研究 這是我每天都會用到的代理功能之一,至今仍讓我讚嘆不已。今年 3 月,Google為 Gemini 增添了一項實用功能:音訊概覽。
將所有內容變成播客

想像一下,將枯燥乏味的文檔、極其複雜的研究論文或學術閱讀材料變成生動活潑的雙向播客對話。這就是 Audio Briefings 的精髓。該功能最初出現在Google備受詬病的 NotebookLM 中,現已移植到行動端和網頁端的核心 Gemini 體驗中。
您無需執行任何技術程式或編寫非常特定的腳本即可獲得這些音訊編輯。只需從附件選擇器上傳文件,「建立音訊來源」投影片就會出現在聊天框正上方。點擊它,您的播客即可開始。
這可能需要幾分鐘才能完成,但在此期間,您可以安全地切換到其他應用程式(或視窗)。完成後,您會收到通知,告知您播客已準備好收聽或與他人分享。
畫外音通常是流暢的雙向對話,語調自然得令人毛骨悚然。聽起來就像在和 Gemini Live 對話,它本身的音質比我迄今為止在語音對話模式下使用過的任何智慧聊天機器人都要自然得多。
我想說這些人工智慧生成的播客製作得非常精良。但我之所以被它們吸引,有幾個原因。首先,我每天大部分時間都在盯著螢幕,閱讀研究文章,以及創作自己的內容。

這使得與其他文本材料(無論是學術的、工作相關的,還是娛樂性的)互動的空間很小。然而,如果你能簡單地改變與這些材料互動的感官模式,閱讀疲勞就會減少。
播客提供了一種全新的方式,讓我們能夠以更沉浸的方式與文字內容互動。這引出了它的第二個優點:感官刺激,或者說對比。這一模式已在學術界和專業培訓中得到充分證實和驗證。
它對我有什麼幫助?
閱讀疲勞會影響你的注意力。它會讓即使是有趣的作品也變得像一件苦差事,因為你不想錯過它。然而,透過不同的感官媒介來接觸同一部作品或其精髓,可以減輕這種對文本超載的恐懼。事實上,它還有其他一些好處。
「調動多種感官可以增強記憶力,」語言學專家亞西爾·納西姆(Yasser Naseem)說道,他的研究重點是教學方法的現代化和發展。 「當我們傾聽並參與時——無論是透過閱讀、寫作還是行動——大腦都會建立更強大的連接,使日後更容易回憶。”
納西姆目前在一家領先的線上教育公司擔任課程專家,他告訴我,學習方法不能只依賴一種。相反,他告訴我,你需要結合不同的方法來最大限度地提高效益,從情緒影響到記憶力的提升。

期刊發表的研究亮點 電腦與教育 學生們也發現播客是最好的學習和複習材料。靈活性和感官多樣性是他們選擇播客而非其他媒體的主要原因。
「真正的理解和長期記憶需要將聆聽與視覺效果、討論或實踐活動相結合,」納西姆補充道。我自己使用 Gemini 音訊摘要的體驗也印證了他的建議。 我對透過音頻播客吸收的知識的記憶比閱讀相同材料更深刻。.
你看,這些音訊播客並非簡單的文字轉音訊。相反,它們將枯燥的文字牆分解成兩個人之間的對話,你基本上是唯一的聽眾。對於那些無法立即吸引你並鼓勵你立即閱讀的文本內容來說,這無疑是一大福音。
在我最近的實驗中,Gemini 音訊播客幫助我了解一篇研究論文的意義,該論文討論了「基於局部資訊目標函數的可解釋神經學習框架」。簡單來說,這項研究討論了神經元如何自我組織。
你明白我的意思了吧?
舒適至上

在資訊吸收方面,舒適度起著重要作用,對整個過程的熱情和興奮感也起著重要作用。根據發表在《 在人類行為的計算機播客「促進了資訊和知識的便利性、靈活性和獲取途徑。」我很快就意識到了這一點。
住在首都,每天塞車或搭乘大眾運輸工具兩三個小時對我來說是家常便飯。但比起不方便,最讓我難受的是時間的浪費。音頻學習資料提供了最便捷的方式,讓我可以有效率地利用這些時間。
使用 Gemini,您還能獲得另一個至關重要的優勢。您無需依賴特定書籍、新聞文章或學術資料的音訊。您可以直接上傳任何可用的資料,Gemini 會將其轉換為播客風格的對話。
大量跨學科研究證實了音頻學習方法的益處。它不僅僅關乎聆聽,更重要的是將內容分解,並以更易於理解的方式呈現。
「有些人說……他們喜歡我們提供一些他們在報紙上讀不到的內容,」研究人員引述一位新聞編輯的話說。 「他們喜歡…我們試著以不同的方式展現自己。」這篇由雪城大學發表的研究論文發表於2006年,當時正值播客熱潮興起之初。

截至2025年,播客已成為真正的資訊消費現象,涵蓋從教育材料到娛樂等各個領域。據 皮尤研究中心近一半的美國人聽過播客。超過一半的受訪聽眾收聽播客是為了學習、娛樂,或是在做其他事情時聽聽音訊。
其中近三分之一的人希望聽取他人的意見,相當一部分人上網是為了關注新聞和時事。我的參與模式與上述模式相差無幾。對於長篇新聞或調查報道,我常常覺得他們的播客版本更令人滿意。
也更有效
有趣的是,播客似乎也推動了實際的改變。近三分之二的聽眾在聽完播客後開始閱讀書籍或觀看電影,超過一半的聽眾開始在社群媒體上關注某人,三分之一的聽眾改變了生活方式,例如鍛鍊身體或改變飲食習慣。
已發表的研究亮點 社群媒體行銷雜誌 媒體聆聽和觀眾準備背景下的媒體替代和功能相似等概念。 主要想法是用戶評估媒體並選擇最適合自己的媒體。
研究指出,「播客內容的特殊性對收聽意願和媒體替代性有正向影響,這表明獨特的內容、高品質和多樣性會讓人們產生收聽播客的興趣。」我個人也認同這項發現。
— Nadeemonics(@nsnadeemsarwar) 2025 年 3 月 30 日
過去幾天,我一直在把幾篇探討纖維、肉類和包裝食品攝取對睡眠模式、認知健康和腸道健康影響的研究論文「轉化」成播客。相較於那些科學論文過於技術化的語氣,兩位主持人用感性且富有說服力的語氣解釋研究結果,對我的影響要深刻得多。
想像一下,就像你從書本學習社交禮儀或文化敏感度一樣。多年以後,你才能親眼看到這些東西。或者想像一下,你獨自從書本上學習一門外語,而當你從一位向你灌輸所有知識的人那裡學習時,你會獲得多麼不同的體驗。
後一種方法效果更好。這主要是因為多感官互動的複合效應加快了學習過程,或者說提高了學習效率。 Gemini 的音訊概覽也達到了類似的效果,對我幫助很大。
一些障礙
Gemini 的音訊概覽功能聽起來很有效率,但其實並不完美。它可能會因為試圖「播客」一個精彩故事而失去其精髓,或者遺漏一些細節。此外,它還存在一些功能上的缺陷。音訊概覽的長度與來源材料的深度成正比,因此可能完全不受控制。
例如,當我為 Gemini 讀一本 260 頁的波斯語動詞變位和形態學書籍時,Gemini 生成的音訊概覽只有七分鐘多一點。從品質上看,它涵蓋了最重要的部分,但忽略了更細微的細節。
還有一次,我把一份長達四頁的深入研究文件轉換成了音訊播客。這個播客大約13分鐘長。可惜的是,Gemini的自動任務晶片不允許你在音訊概覽中調整對話的長度或深度。
如果您使用的是 Google NotebookLM(音訊概覽功能首次推出),您可以編寫一個提示來決定播客對話的深度。幾週前,我在 NotebookLM 上創建了一個 59 分鐘的音訊播客。
雙子座不會讓你這麼做。至少現在還不行。
此外,還有語言障礙,因為谷歌目前正在努力改進其整個流程,使其不再局限於英語。另一個問題是英語發音被盜用。例如,這位人工智慧播客主持人就把波斯語單字「Raf-thin」讀成了「Raaf-tin」。
對於不熟悉英語和波斯語翻譯之間的雙語語言差異,或者不熟悉口音如何影響不同語言的聽覺感知的人來說,人工智慧播客主持人可能會說一些完全胡言亂語的話。
整體而言,Gemini 的「音訊概覽」功能並非革命性創新。它只是提供了一種與眾不同、更具吸引力的內容互動方式。雖然它並非總是有效,但確實能減輕閱讀冗長文字的乏味,避免讓人昏昏欲睡。
評論被關閉。