奧特曼都點讚，Google Gemini 3 Pro到底強在哪？

Bitget App

交易「智」變

Bitget

資訊中心

深潮2025/11/19 10:21

顯示原文

作者:深潮TechFlow

Google裝睡8個月，突然推出一個重磅產品Gemini 3 Pro。

Google裝睡8個月，反手丟出一個王炸Gemini 3 Pro。

作者：苗正

Google裝睡8個月，反手丟出一個王炸Gemini 3 Pro。

Google終於發佈了Gemini 3 Pro，非常突然，而且非常「低調」。

雖然Google在Gemini 3 Pro之前發佈了圖片編輯模型Nano Banana，進而刷了一波存在感。但在基座模型方面，Google已經沉寂太久。

過去這大半年，大家都在熱議OpenAI的新動作，或者感嘆Claude在程式碼領域的統治力，唯獨沒有人提及8個月沒有版本號升級的Gemini。

即使Google的雲業務和財報再漂亮，可在AI開發者的核心圈子裡，Google的存在感仍然被一點點地稀釋。

好在的是，小榜在第一時間體驗過後發現，Gemini 3 Pro並沒有讓我們失望。

但現在還不能過早下結論。因為現在的AI賽道早就已經過了靠參數量嚇人的階段，大家都在卷應用、卷落地、卷成本。

Google能不能適應新版本和新環境，還是個未知數。

01

我讓Gemini 3 Pro用一句話來形容自己，它是這麼回答我的。

「不再急於向世界證明自己有多聰明，而是開始琢磨如何讓自己變得更有用。」——Gemini 3 Pro

在LMArena排行榜上，Gemini 3 Pro以1501的Elo分數登頂，這是AI模型在綜合能力評估中的新紀錄。這是一個相當優秀的成績，就連Altman也發推表示祝賀。

數學能力測試中，該模型在AIME2025（美國數學邀請賽）的程式碼執行模式下達到100%的準確率。在GPQADiamond科學知識測試中，Gemini 3 Pro的準確率為91.9%。

MathArenaApex數學競賽的測試結果顯示，Gemini 3 Pro獲得了23.4%的得分，而其他主流模型的得分普遍在2%以下。此外，在名為Humanity'sLastExam的測試中，該模型在不使用工具的情況下達到了37.5%的得分。

Google在此次更新中引入了名為「vibecoding」的程式碼生成功能。這項功能允許用戶通過自然語言描述需求，系統隨後生成相應的程式碼和應用程式。

在Canvas編程環境的測試中，用戶描述「製作一個可以調節轉速的電風扇」後，系統在約30秒內生成了包含旋轉動畫、速度控制滑塊和開關按鈕的完整程式碼。

官方展示的案例還包括核聚變過程的可視化模擬。

在互動方式上，Gemini 3 Pro增加了「生成式介面」（GenerativeUI）功能。與傳統AI助手只返回文字回答不同，該系統可以根據查詢內容自動生成客製化的介面佈局。

例如，當用戶詢問量子計算相關問題時，系統可能生成包含概念解釋、動態圖表和相關論文連結的互動式介面。

針對不同受眾的同一問題，系統會生成不同的介面設計，舉個簡單例子，向兒童和成人解釋同一概念時，會採用不同的呈現方式。兒童的就會偏可愛，成人則會偏簡潔明瞭。

Google Labs中提供的Visual Layout實驗功能展示了這種介面的應用，用戶可以獲得雜誌風格的視圖佈局，包含圖片、模組和可調節的UI元素。

此次發佈還包含了名為Gemini Agent的智能體系統，目前處於實驗階段。該系統可以執行多步驟任務，並連接到Gmail、Google Calendar和Reminders等Google服務。

在收件箱管理場景中，系統可以自動篩選郵件、標記優先級和起草回覆。旅遊規劃是另一個應用場景，用戶只需提供目的地和大致時間，系統會查詢日曆、搜尋航班和酒店選項，並添加行程安排。而這項功能目前僅向美國地區的Google AI Ultra訂閱用戶開放。

在多模態處理方面，Gemini 3 Pro基於稀疏混合專家架構構建，支援文字、圖片、音訊和影片輸入。模型的上下文視窗為100萬token，意味著可以處理較長的文件或影片內容。

加拿大勞瑞爾大學歷史學教授Mark Humphries的測試顯示，該模型在識別18世紀手寫文稿時的字元錯誤率為0.56%，相比前代版本降低了50%到70%。

Google表示，訓練資料包括公開網路文件、程式碼、圖片、音訊和影片內容，後訓練階段使用了強化學習技術。

Google還推出了名為Gemini 3 Deep Think的優化版本，專門用於複雜推理任務。該模式目前正在進行安全評估，計劃在未來幾週向Google AI Ultra訂閱者開放。

在Google Search的AI模式中，用戶可以點擊「thinking」選項卡查看該模式的推理過程。與標準模式相比，Deep Think模式會在生成回答前進行更多步驟的分析。

除了官方提供的資料外，我還將Gemini 3 Pro和ChatGPT-5.1進行了對比。

第一個對比就是生成圖片。

提示詞：給我生成一張iPhone17

ChatGPT-5.1

Gemini 3 Pro

主觀上來講，ChatGPT-5.1更符合我的需求，因此這回合是ChatGPT-5.1勝出。

第二個對比的就是兩者的智能體水準。

提示詞：去給我研究研究字母榜這個微信公眾號，然後評論一下這個號的水準

GPT-5.1

Gemini 3 Pro

雖然從主觀上來講，我更喜歡Gemini 3 Pro的解讀，但是太過於鼓吹，ChatGPT-5.1能發現小榜還有所不足，更客觀真實。

最後是程式碼能力，也是目前所有大模型最關注的一塊。

我選的專案是GitHub上最近星數非常高的專案，叫做LightRAG。這是通過整合圖結構來增強上下文感知和高效資訊檢索，從而改進檢索增強生成，實現了更高的準確性和更快的響應時間。專案地址

提示詞：跟我說說這個專案如何

GPT-5.1

Gemini 3 Pro

同時，Gemini 3 Pro也獲得了業內人士的高度評價。

02

雖然Gemini 3 Pro發佈得非常低調，但實際上Google已經為Gemini 3 Pro預熱了很久。

在Google第三季度財報電話會上，Google CEO皮查伊說了這麼一句話：「Gemini 3 Pro將在2025年內發佈。」沒有具體日期，沒有更多細節，卻拉開了科技行業一場行銷大戲的序幕。

Google不斷釋放信號，讓整個AI社群保持高度關注，卻始終拒絕給出任何確定的發佈時間表。

從10月開始，各種「意外洩露」接踵而至。10月23日開始流傳一份日曆，在其11月12日「Gemini 3 Pro Release」的內部日曆截圖瘋傳。

而且眼尖的開發者還在Vertex AI的API文件中發現了「gemini-3-pro-preview-11-2025」的字樣。

緊接著，Reddit 和 X上開始出現各種截圖。有用戶聲稱在 Gemini Canvas 工具中看到了新模型的身影，有人在移動應用的某些版本中發現了異常的模型標識。

然後就是，下面這張測試數據開始在社交媒體流傳。

這些「洩露」看似偶然，實則構成了一場精心編排的預熱。

每一次洩露都恰到好處地展示了Gemini 3 Pro 的某項核心能力，每一次討論都將期待值推向新的高度。而 Google官方帳號的態度則耐人尋味，他們會轉發社群的討論，會用「即將到來」這樣的措辭吊胃口，甚至Google AI實驗室的高層，還在關於發佈日期預測的推文下回覆了兩個「思考」表情符號，但就是不肯說出一個準確日期。

預熱了將近1個月，Google終於將新鮮的Gemini 3 Pro端了上來。然而Gemini 3 Pro性能雖然強勁，但是Google的更新頻率多少讓人有點著急。

早在今年3月份的時候，Google就發佈了Gemini 2.5 Pro的預覽版本，後續又陸續推出了Gemini 2.5 Flash預覽版等衍生預覽版本。直至Gemini 3 Pro問世，Gemini系列在此期間無任何版本號升級。

可Google的對手們並不會等待Gemini。

OpenAI在8月7日推出了GPT-5，並在11月12日進一步升級到 GPT-5.1。而且這段時間裡，OpenAI還推出了自己的AI瀏覽器Atlas，直指Google腹地。

Anthropic 的迭代速度更為密集:2月24日發佈 Claude 3.7 Sonnet(首個混合推理模型)，5月22日推出 Claude Opus 4 和 Sonnet 4，8月5日發佈 Claude Opus 4.1，9月29日推出 Claude Sonnet 4.5，10月15日又發佈了 Claude Haiku 4.5。

這一系列攻勢打得Google有些措手不及，不過目前來看，Google頂住了。

03

Google之所以耗時8個月才更新Gemini 3 Pro，最大的原因可能來自於人員上的變更。

2025年7月至8月前後，Microsoft對Google發起了一波猛烈的人才攻勢，成功招募了超過20名DeepMind的核心專家和高管。

這其中就包括DeepMind高級產品總監（Senior Director of Product）戴夫·希創（Dave Citron），負責其核心AI產品的落地。以及Gemini的工程副總裁 (VP of Engineering)阿瑪爾·蘇布拉馬尼亞（Amar Subramanya），他是 Google最重要模型Gemini的核心工程負責人之一。

另外一方面，Google Nano Banana團隊曾表示，Google在發佈Gemini 2.5 Pro後很長一段時間裡，都在糾結AI生圖領域，進而放緩了基座模型的更新。

Google認為，只有攻克了角色一致性 (Character Consistency)、語境編輯(In-context Editing)、文字亂碼(Text Rendering)這三個生成圖片領域的難關後，才能讓基座模型的表現更好。

Nano Banana團隊表示，模型不僅能「畫得好看」，更重要的是能「聽懂人話」並「受人控制」，從而讓 AI 生圖真正進入商業落地階段。

這時回頭來看Gemini 3 Pro，它是一份合格的答卷，但在這個只爭朝夕的 AI 戰場，及格早已不夠。

Google既然選擇了在此時此刻交卷，就必須準備好面對最苛刻的閱卷人，那些已經被競品「喂刁」了口味的用戶和開發者。接下來的幾個月，將不是模型參數的比拼，而是生態整合能力的肉搏。Google這頭大象不僅要學會跳舞，還得跳得比所有人都快。

免責聲明：文章中的所有內容僅代表作者的觀點，與本平台無關。用戶不應以本文作為投資決策的參考。

PoolX：鎖倉獲得新代幣空投

不要錯過熱門新幣，且APR 高達 10%+

立即參與