ChatGPT 和 Gemini 全面對比:哪個才是更好的 AI 助理?
OpenAI 和 Google 目前正競相提供最佳的深度研究用戶端。 Gemini 深度研究用戶端是基於最新的 Gemini 2.0 Flash Thinking 模型,而 ChatGPT 深度研究用戶端則使用改良版的 o3 模型。值得注意的是,Google 的客戶端是免費的,而 OpenAI 的客戶端則收費 20 美元。不過,我們已經測試了 Google 和 OpenAI 的深度研究客戶端,接下來讓我們來看看它們的對比。
任務一:研究中國在人工智慧領域的崛起
為了測試ChatGPT和Gemini這兩位深度研究客戶的能力,我請他們對中國人工智慧的崛起進行深入研究。我要求這兩家客戶分析中國領先的人工智慧公司、政府政策以及與美國實驗室的競爭情況。此外,中美兩國都在爭取人工智慧領域的領導地位,因此這項研究與該技術的未來發展息息相關。
ChatGPT 的深度研究客戶端耗時 10 分鐘完成任務,引用了 30 個不同的來源,最終產生了一份 9000 字的報告。相比之下,Gemini 的深度研究客戶端僅用了 8 分鐘就完成了搜索,並產生了一份篇幅較短的 3000 字報告。然而,它分析了超過 170 個網站,這令人印象深刻。

至於研究結果,我仔細審閱了兩份報告,發現客戶 ChatGPT深度研究徹底失敗了 他甚至沒有提及中國最近在人工智慧領域的進展。 深尋R1百度推出的全新 Ernie 4.5 模型以及 Plus 版本,都體現了更新人工智慧研究資訊來源的重要性。
事實證明,ChatGPT深度研究客戶嚴重依賴史丹佛大學的一篇文章和一個維基百科頁面,而這兩篇文章和頁面分別於2017年和2021年最後一次發布和更新。因此,大部分資訊已經過時,甚至沒有涵蓋最新的影片生成模型和機器人公司。在這個快速發展的領域,及時更新資訊至關重要。

儘管 Gemini Deep Research 客戶的聲明很簡短,但其中確實提到了“值得注意的是,成立於 2023 年的新創公司 DeepSeek 憑藉其 R1 模型迅速崛起。此外,Gemini 還寫道:「DeepSeek 也憑藉其在開發新的架構創新方面的開創性工作而脫穎而出,例如多頭潛在註意力(MLA)。“
他也討論了Kling AI和MiniMax等人工智慧視訊生成工具,以及Unitree等人工智慧機器人公司。我的評估是: Gemini的優點在於其Google搜尋索引。這個資料庫會定期更新各個主題的新網頁,但它很可能依賴必應搜尋引擎進行查詢,因此會選擇一些過時的資訊。這凸顯了在人工智慧領域,強大而準確的搜尋引擎的重要性。
任務二:研究人工智慧晶片的未來發展趨勢,並與英偉達GPU進行比較
在接下來的任務中,我讓 ChatGPT 和 Gemini 上的深度研究代理研究專用 AI 晶片的未來發展趨勢,並將其與目前用於訓練和 Plus 的 Nvidia GPU 進行比較。 ChatGPT 使用了 22 個資料來源,並產生了一份包含嵌入式表格和參考文獻的大型文件。 Gemini 和之前一樣,分析了 100 多個網頁,但產生的文檔篇幅較短。

兩款智能體都提到了TPU、ASIC、FPGA、LPU和WSE的興起,並指出英偉達在CUDA領域的統治地位。它們也討論了Groq、Cerebras、SambaNova、Graphcore等新興晶片公司。 ChatGPT的Deep Research AI智能體也提到了華為的昇騰AI晶片,而Gemini智能體則沒有提及。
ChatGPT Deep Research 也提到了亞馬遜的 Trainium 和 Inferentia 晶片組、微軟的 MAIA 晶片、英特爾的 Gaudi 加速器以及谷歌的 TPU。然而,和先前的錯誤一樣,ChatGPT 的預測仍停留在過去。例如,它沒有任何資訊表明谷歌已經發布了 TPU v6e(Trillium)晶片。 ChatGPT 也認為英偉達的 Blackwell B200 是一款即將推出的 GPU,但實際上它要到 2024 年才會發布。

儘管有這些缺陷,我仍然更傾向於使用 ChatGPT 的深度研究代理,因為它的報告比 Gemini 的報告更具深度和洞察力。然而,需要注意的是,ChatGPT 的深度研究代理存在一個根本性問題。
該智能體由 OpenAI 的 o3 模型修改版運行,該模型的訓練截止日期為 2023 年 10 月。因此,其內部模型缺乏最新的知識。儘管它會利用互聯網獲取最新信息,但往往無法掌握最新的發展動態。
任務3:2025年肥胖症管理研究
在第三項任務中,我請ChatGPT和Gemini的深度研究團隊對2025年的肥胖症管理進行研究。我特別要求他們涵蓋2025年的最新進展,包括所有類型的治療方法。 ChatGPT的深度研究團隊引用了高品質的資料和醫學期刊,解釋了目前的肥胖症治療方法。

會議討論了GLP-1肽等新進展、其副作用、新藥的FDA審批狀態,甚至包括基因療法。總體而言,ChatGPT重點介紹了美國、英國和加拿大目前的肥胖症管理政策。
另一方面,Gemini 的深度研究代理也做得非常出色。它列出了所有醫療幹預措施,包括… 即將進行的藥物試驗 以表格形式呈現。我發現有趣的是,Gemini提到了諸如三激素受體激動劑(Retatrutide)之類的新藥,這些藥物在醫學界引起了廣泛關注,因為它們能顯著減輕體重。

此外,Google的Gemini也深入研究了諾和諾德和禮來等正在進行新型減肥藥物試驗的公司,全面展現了相關進展。總的來說,我認為Gemini產生的這份報告條理清晰,包含了肥胖症管理的最新資訊。
應該使用 ChatGPT 深度研究還是 Gemini 深度研究?
就我個人經驗而言,我更喜歡使用 Gemini 深度研究人工智慧代理,因為它能持續提供各種主題的最新資訊。雖然 ChatGPT 深度研究代理涵蓋了廣泛的觀點,但由於其對最新發展的了解有限,因此無法呈現完整的圖像。此外,Gemini 深度研究人工智慧代理對所有用戶免費開放,而 OpenAI 的人工智慧代理則需要付費 20 美元才能使用。深度研究、ChatGPT 和 Gemini 是目前最重要的幾款人工智慧研究工具。
Gemini性能顯著提升的原因在於它現在採用了Gemini 2.0 Flash Thinking模型。與先前的Gemini 1.5 Pro模型相比,新的模型能夠分析並規劃完成搜尋所需的資訊。這項進步使Gemini能夠提供更深入、更精準的搜尋結果。
然而,ChatGPT Deep Research代理的一大優點在於其檔案上傳功能,而Gemini在使用代理程式時不允許檔案上傳。這對於STEM(科學、技術、工程和數學)研究特別有用,因為使用者可以上傳付費科學期刊的PDF檔案。此功能大大簡化了科學研究流程。
由於許多期刊都位於防火牆後,無法透過網路搜尋訪問,您可以手動上傳檔案以建立更豐富的知識庫。這將使代理能夠整合有價值的見解。此外,Gemini 還允許您將產生的報告匯出到 Google 文檔,方便共用。此功能有助於協作和研究成果共享。
一般來說,我建議在訂閱 ChatGPT Plus 套餐之前先使用 Gemini Deep Research AI 代理程式。谷歌已經顯著改進了該代理,現在速度更快了。對於正在尋找功能強大且經濟實惠的研究工具的研究人員來說,Gemini 是個絕佳的選擇。
評論被關閉。