本週你錯過的 5 大 AI 新聞:ChatGPT 更新和谷歌的最新舉措
本週,一些原本不太受關注的人工智慧公司也帶來了一些驚喜。 Google的雙子座 在他成為粉絲最愛的道路上, 格羅克 它位居最佳聊天機器人榜首。一種新的醫療人工智慧模型可幫助醫生檢測包括癌症在內的1000多種疾病。

同時,ChatGPT 正在採取積極措施,為 18 歲以下用戶引入保護措施,以提高其最年輕用戶的安全性。以下是本週您需要了解的最重要的 AI 新聞。
在 27 種不同的 AI 模型中,Gemini 是大眾最喜歡的。

在一項同類規模最大的公眾調查中,來自美國和英國的 21000 多名參與者評估了 27 種不同的人工智慧模型,並且 雙子座2.5專業版 位居榜首。這項研究使用 Prolific 的 Humaine 系統進行,根據溝通風格、推理能力、信任度和整體使用者體驗等標準對模型進行了評估。
Gemini 在大多數子類別中的表現均優於 ChatGPT 和 Claude 等競爭對手,鞏固了其作為Google迄今為止最先進的推理模型的地位。 ChatGPT 總排名第八。
要點:
- Gemini 2.5 Pro 奪冠 在對美國和英國的27位模特兒進行的民意調查中。
- 21,352人分享 這些結果來自不同的人口群體。
- 評估標準:溝通、靈活性、推理、信任和整體使用者體驗。
- ChatGPT排名第八 總體而言,克勞德的作品排名第 11 位和第 12 位。
ChatGPT 專為青少年打造功能

OpenAI 終於發布了 青少年新安全規則更新內容包括年齡預測系統,用於檢測未滿18歲的用戶,並在年齡未知的情況下採取預防性控制措施。此外,更新還承諾對敏感話題(例如性內容、自殘等)進行更嚴格的過濾,並提供家長監護功能,例如封鎖使用時間和關聯帳戶。
這些變化只是一個開始,但它們提出了一些難題,例如年齡將如何定義,錯誤對信任的影響頻率,以及如果青少年擔心被監視或評判,他們是否願意敞開心扉。
您應該知道
- 年齡檢測新規則OpenAI 將認定為未滿 18 歲的用戶至具有更嚴格安全規則的 ChatGPT 版本。
- 未成年人默認若無法確認年齡,系統仍會採取預防措施,施加輕微限制。
- 提供家長監護工具父母可以連接到青少年的帳戶,停用或限制功能(例如記憶或歷史記錄),設定安全時間(封鎖時間),並在 AI 偵測到痛苦跡象時收到警報。
- 青少年聊天限制禁止露骨的性內容、調情聊天、自殘討論。在涉及即將發生傷害的極端情況下,如果無法聯繫到家長,可能會聯繫執法部門。
現在您可以分享您的自訂 Gemini 創作。

谷歌正在擴大 Gemini 的覆蓋範圍,現在用戶可以分享他們的個人化助理 Gems。對於那些更熟悉 ChatGPT 的人來說,這些本質上都是 自訂 GPT 模型在此之前, 雙子座寶石 它最初僅限於私人使用,現在可以像 Google Docs 一樣輕鬆共享,允許同事、學生和任何其他人與客製化設計的 AI 進行協作,而無需從頭開始建立。
此舉凸顯了Google致力於將 Gemini 打造為一個更靈活、更用戶友好的平台的決心。
您需要了解的資訊:
- 可客製化的寶石 它們是人工智慧助手,您可以設計它們來執行程式設計、編輯或腦力激盪等特定任務。
- 寶石是共享的 就像在 Google Drive 上分享任何其他內容一樣,當您協作時,其他人可以查看或編輯您的 Gem。
- 現已對訂閱者開放 超過 150 個國家的 Gemini Advanced、Business 和 Enterprise。
Grok 位居 ARC-AGI 榜首

伊隆馬斯克和 Grok 4 似乎正在引領這場人工智慧競賽,榮登 ARC-AGI 名單。 ARC-AGI 是衡量人工智慧能夠解決的問題數量和模型效率的基準。在最近的測試中,Grok 4 在這項極具挑戰性的指標上超越了 ChatGPT 和 Gemini 等競爭對手,凸顯了其卓越的解決現實問題的能力和速度。
儘管 Grok 速度快、使用即時網路搜索,並且能夠出色地處理複雜的工程索賠,但用戶仍然擔心它的準確性、內容審核和偏見。
您需要了解的資訊:
- ARC-AGI 榜首Grok 4 聲稱排名第一,這意味著它比競爭對手每單位資源解決了更多的標準 AI 挑戰。
- 優勢:幾乎即時的網路搜索,改進了對複雜幾何和邏輯任務的處理,並且與以前的 Grok 版本相比性能有所改進。
- 弱點和恐懼
:內容準確性問題(一些不正確的聲明)、偏見問題以及在大量使用的情況下保持適度和可靠性的挑戰。 - 結論:這顯示效率和品質在人工智慧基準測試中越來越受到重視。
一種新的人工智慧模型可以預測您患上包括癌症在內的 1000 多種疾病的風險。

一種名為 Delphi-2M 的全新 AI 模型代表了醫療 AI 領域的巨大飛躍。該模型基於來自英國和丹麥近 2.3 萬人的匿名健康數據進行訓練,可以預測您患上 1000 多種疾病的風險,並預估這些疾病的發病時間。
與其他人工智慧模型不同,Delphi-2M 為 1000 個病例提供風險評分,利用病史、生活方式、年齡和性別等因素模擬數十年來的健康軌跡。該模型不僅可以預測可能發生的疾病,還能預測何時發生。
在實驗中,該系統在英國數據集的數百種疾病中實現了0.76的平均曲線下面積(AUC),儘管在丹麥人群中的準確率有所下降。需要強調的是,該模型並非診斷工具,並不能取代人類醫生。
但該工具作為一種預測工具很有前景,可用於監測一般風險趨勢、制定預防計畫並突顯人工智慧在個人健康方面的潛力。
要點:
- 龐大的資料集:對來自英國生物銀行和丹麥登記處的近 2.3 萬人進行了培訓。
- 綜合和時間建模它使用詳細的輸入(年齡、性別、生活方式、先前的診斷)並預測下一種疾病和以下疾病: 同義詞 它將會發生。
- 預測,而非診斷:其目的是指導預防,而不是取代醫療建議。
結論
短短一周內,這些更新凸顯了人工智慧領域向現實世界融合和更大突破的明顯轉變。
評論被關閉。