ChatGPT 和 Gemini 全面對比：哪個才是更好的 AI 助理？

OpenAI 和 Google 目前正競相提供最佳的深度研究用戶端。 Gemini 深度研究用戶端是基於最新的 Gemini 2.0 Flash Thinking 模型，而 ChatGPT 深度研究用戶端則使用改良版的 o3 模型。值得注意的是，Google 的客戶端是免費的，而 OpenAI 的客戶端則收費 20 美元。不過，我們已經測試了 Google 和 OpenAI 的深度研究客戶端，接下來讓我們來看看它們的對比。

任務一：研究中國在人工智慧領域的崛起

為了測試ChatGPT和Gemini這兩位深度研究客戶的能力，我請他們對中國人工智慧的崛起進行深入研究。我要求這兩家客戶分析中國領先的人工智慧公司、政府政策以及與美國實驗室的競爭情況。此外，中美兩國都在爭取人工智慧領域的領導地位，因此這項研究與該技術的未來發展息息相關。

ChatGPT 的深度研究客戶端耗時 10 分鐘完成任務，引用了 30 個不同的來源，最終產生了一份 9000 字的報告。相比之下，Gemini 的深度研究客戶端僅用了 8 分鐘就完成了搜索，並產生了一份篇幅較短的 3000 字報告。然而，它分析了超過 170 個網站，這令人印象深刻。

至於研究結果，我仔細審閱了兩份報告，發現客戶 ChatGPT深度研究徹底失敗了 他甚至沒有提及中國最近在人工智慧領域的進展。深尋R1百度推出的全新 Ernie 4.5 模型以及 Plus 版本，都體現了更新人工智慧研究資訊來源的重要性。

事實證明，ChatGPT深度研究客戶嚴重依賴史丹佛大學的一篇文章和一個維基百科頁面，而這兩篇文章和頁面分別於2017年和2021年最後一次發布和更新。因此，大部分資訊已經過時，甚至沒有涵蓋最新的影片生成模型和機器人公司。在這個快速發展的領域，及時更新資訊至關重要。

儘管 Gemini Deep Research 客戶的聲明很簡短，但其中確實提到了“值得注意的是，成立於 2023 年的新創公司 DeepSeek 憑藉其 R1 模型迅速崛起。此外，Gemini 還寫道：「DeepSeek 也憑藉其在開發新的架構創新方面的開創性工作而脫穎而出，例如多頭潛在註意力（MLA）。“

他也討論了Kling AI和MiniMax等人工智慧視訊生成工具，以及Unitree等人工智慧機器人公司。我的評估是： Gemini的優點在於其Google搜尋索引。這個資料庫會定期更新各個主題的新網頁，但它很可能依賴必應搜尋引擎進行查詢，因此會選擇一些過時的資訊。這凸顯了在人工智慧領域，強大而準確的搜尋引擎的重要性。

任務二：研究人工智慧晶片的未來發展趨勢，並與英偉達GPU進行比較

在接下來的任務中，我讓 ChatGPT 和 Gemini 上的深度研究代理研究專用 AI 晶片的未來發展趨勢，並將其與目前用於訓練和 Plus 的 Nvidia GPU 進行比較。 ChatGPT 使用了 22 個資料來源，並產生了一份包含嵌入式表格和參考文獻的大型文件。 Gemini 和之前一樣，分析了 100 多個網頁，但產生的文檔篇幅較短。

兩款智能體都提到了TPU、ASIC、FPGA、LPU和WSE的興起，並指出英偉達在CUDA領域的統治地位。它們也討論了Groq、Cerebras、SambaNova、Graphcore等新興晶片公司。 ChatGPT的Deep Research AI智能體也提到了華為的昇騰AI晶片，而Gemini智能體則沒有提及。

ChatGPT Deep Research 也提到了亞馬遜的 Trainium 和 Inferentia 晶片組、微軟的 MAIA 晶片、英特爾的 Gaudi 加速器以及谷歌的 TPU。然而，和先前的錯誤一樣，ChatGPT 的預測仍停留在過去。例如，它沒有任何資訊表明谷歌已經發布了 TPU v6e（Trillium）晶片。 ChatGPT 也認為英偉達的 Blackwell B200 是一款即將推出的 GPU，但實際上它要到 2024 年才會發布。

儘管有這些缺陷，我仍然更傾向於使用 ChatGPT 的深度研究代理，因為它的報告比 Gemini 的報告更具深度和洞察力。然而，需要注意的是，ChatGPT 的深度研究代理存在一個根本性問題。

該智能體由 OpenAI 的 o3 模型修改版運行，該模型的訓練截止日期為 2023 年 10 月。因此，其內部模型缺乏最新的知識。儘管它會利用互聯網獲取最新信息，但往往無法掌握最新的發展動態。

任務3：2025年肥胖症管理研究

在第三項任務中，我請ChatGPT和Gemini的深度研究團隊對2025年的肥胖症管理進行研究。我特別要求他們涵蓋2025年的最新進展，包括所有類型的治療方法。 ChatGPT的深度研究團隊引用了高品質的資料和醫學期刊，解釋了目前的肥胖症治療方法。

會議討論了GLP-1肽等新進展、其副作用、新藥的FDA審批狀態，甚至包括基因療法。總體而言，ChatGPT重點介紹了美國、英國和加拿大目前的肥胖症管理政策。

另一方面，Gemini 的深度研究代理也做得非常出色。它列出了所有醫療幹預措施，包括… 即將進行的藥物試驗 以表格形式呈現。我發現有趣的是，Gemini提到了諸如三激素受體激動劑（Retatrutide）之類的新藥，這些藥物在醫學界引起了廣泛關注，因為它們能顯著減輕體重。

此外，Google的Gemini也深入研究了諾和諾德和禮來等正在進行新型減肥藥物試驗的公司，全面展現了相關進展。總的來說，我認為Gemini產生的這份報告條理清晰，包含了肥胖症管理的最新資訊。

應該使用 ChatGPT 深度研究還是 Gemini 深度研究？

就我個人經驗而言，我更喜歡使用 Gemini 深度研究人工智慧代理，因為它能持續提供各種主題的最新資訊。雖然 ChatGPT 深度研究代理涵蓋了廣泛的觀點，但由於其對最新發展的了解有限，因此無法呈現完整的圖像。此外，Gemini 深度研究人工智慧代理對所有用戶免費開放，而 OpenAI 的人工智慧代理則需要付費 20 美元才能使用。深度研究、ChatGPT 和 Gemini 是目前最重要的幾款人工智慧研究工具。

Gemini性能顯著提升的原因在於它現在採用了Gemini 2.0 Flash Thinking模型。與先前的Gemini 1.5 Pro模型相比，新的模型能夠分析並規劃完成搜尋所需的資訊。這項進步使Gemini能夠提供更深入、更精準的搜尋結果。

然而，ChatGPT Deep Research代理的一大優點在於其檔案上傳功能，而Gemini在使用代理程式時不允許檔案上傳。這對於STEM（科學、技術、工程和數學）研究特別有用，因為使用者可以上傳付費科學期刊的PDF檔案。此功能大大簡化了科學研究流程。

由於許多期刊都位於防火牆後，無法透過網路搜尋訪問，您可以手動上傳檔案以建立更豐富的知識庫。這將使代理能夠整合有價值的見解。此外，Gemini 還允許您將產生的報告匯出到 Google 文檔，方便共用。此功能有助於協作和研究成果共享。

一般來說，我建議在訂閱 ChatGPT Plus 套餐之前先使用 Gemini Deep Research AI 代理程式。谷歌已經顯著改進了該代理，現在速度更快了。對於正在尋找功能強大且經濟實惠的研究工具的研究人員來說，Gemini 是個絕佳的選擇。

ChatGPT 雙子座