Manus AI 並非中國的 DeepSeek:深入探討炒作背後的真相

短短一週內,就有超過2萬用戶加入了候補名單,以存取該服務。 Manus通用人工智慧代理 中國版Manus AI被宣傳為中國版的下一個「DeepSeek時刻」。目前該代理伺服器正處於封閉測試階段,僅限受邀用戶存取。

一種狂熱的氣氛瀰漫開來,許多人將Manus AI描述為一項“突破”,是對OpenAI的Deep Research智能體的恰當回應,尤其是在中國持續提供技術支援的情況下。 以更低的成本實現人工智慧創新然而,圍繞 Manus 的炒作有些過頭,部分原因是人工智慧領域的意見領袖在社群媒體平台上大肆宣傳。以下是我認為 Manus AI 是一個有希望的開端,但還稱不上突破性進展的原因。

為什麼 Manus AI 沒有被視為顛覆性技術?

DeepSeek 的突破源自於其成功模仿了 OpenAI 的強化學習 (RL) 方法,並取得了與 O 系列思維模型相媲美的表現。此外,DeepSeek 團隊以遠低於 OpenAI 訓練成本的預算實現了這項壯舉。隨後,DeepSeek 發布了 GRPO培訓方法論作為開源這有助於其他實驗室訓練複雜的思考模型。

這些都是突破性的創新,由DeepSeek的中國團隊克服了美國對圖形處理器(GPU)的限製而取得。同時,通用人工智慧程式Manus整合了Anthropic的Claude 3.5 Sonnet模型和幾個改進的Qwen模型,並且基於開源的Browser Use專案。

manus 人工智慧代理首頁

雖然改進的整合和工具是優勢,但真正的突破在於開創性地開發先進的、最佳化的代理模型。 Anthropic 的 Claude 3.5 Sonnet 是用於代理和程式設計的最佳 AI 模型之一。事實上,Manus 背後的團隊正在內部測試新的統一模型 Claude 3.7 Sonnet,並認為它「很有前景」。

從本質上講,建立強大的AI模型仍然是最大的挑戰,而且在可預見的未來仍將如此。然而,Manus AI團隊將如此多的工具和環境連接起來以完成任務,值得稱讚。如前文所述,這是邁向基於智能體的未來的一個充滿希望的開端。

Manus AI 絆倒

我們目前無法使用 Manus AI,但一些 X 用戶提前體驗了軟體並分享了他們使用的感受。生物醫學科學家 Derya Onmutmaz 在 X 上並排運行了 Manus 和 OpenAI 的 Deep Research Proxy 後,分享了她的測試結果。

Deep Research 僅用 15 分鐘就完成了任務,而 Manus 花了 50 分鐘卻未能完成。此外,Manus 也沒有像 Deep Research 那樣引用資料來源。

同樣,X 用戶 teortaxesTex 測試了 Manus 代理,並報告稱其在重現大型語言模型 (LLM) 等資訊方面優於執行代理任務。另一位 X 用戶 TheXeophon 在使用 Manus 代理商後也分享了他的發現,值得注意的是,他在研究遊戲機市場後並未提及 Nintendo Switch。

事實上,那段顯示Manus AI客戶端自動完成50項任務的病毒式傳播影片被證實是偽造的。 Manus首席科學家季一超(Peak)表示: “這段影片絕對不是馬努斯本人。” 配上一個笑臉表情。這段影片引發了關於人工智慧能力及其應用的廣泛討論,促使專家強調核實網路流傳資訊準確性的重要性。

儘管初期遭遇了一些挫折,但重要的是要記住,Manus 仍處於封閉測試階段,現在放棄它還為時過早。然而,在嘗試新的人工智慧產品時,謹慎和耐心同樣重要。 Manus 或許不會帶來顛覆性的變革,但它朝著正確的方向邁出了雄心勃勃的第一步。

隨著人工智慧模型在代理任務中不斷進步,基於這些模型開發的新產品也將隨之改進。 Manus AI 團隊已經表示,在正式向公眾發布之前,該智能體將進行重大增強。現在,它能否達到預期還有待觀察,但這無疑是一項值得關注的重大進展。

評論被關閉。