在谷歌巨大的商業化版圖面前,單純提前一天發布 GPT-4o,似乎并沒有給 OpenAI 帶來足夠的優勢。
在 2024 Google I/O 大會上,Google 展示了一系列 AI 技術突破,包括 AI 生成視頻、AI 驅動的 Workspace 自動化工具,以及產品效果直逼 GPT-4o 的語音助手。眾多 AI 產品的發布,形成了某種意義上的 " 狼群效應 ",正幫助 Google 扭轉被動追趕的局面。
另外,Gemini 的多模態能力、Android 15 的 AI 增強,不僅提升了用戶體驗,也顯著增強了谷歌生態系統的粘性。相比之下,OpenAI 可能技術上領先一步,但在應用廣度上顯得相對單一。
如今,Google 帶著 " 巨頭范兒 " 的反擊越來越犀利,而對于 GPT-5 的發布時間仍持謹慎態度的 Sam Altman 而言,壓力變得越來越大。
巨頭反擊教材第一章:放大優勢
巨型企業的戰略布局,往往建立在持續加強優勢業務的前提下。而 Google 起家于搜索,長于 Workspace 等一系列辦公套件服務,而這也成了 2024 年 Google I/O 大會發布的重點。

完善的 AI 搜索能力,是業內翹首以盼的。Google 本次發布的 AI Overview,在多模態的問題上做足了文章——
比如 "Ask with video",利用 Gemini 的多模態能力與 Google Lens 相結合,可以實現視頻搜索,只要錄制一段視頻,就能知道用戶使用唱片機,甚至維修照相機;Google Photos 中還推出了新的 AI 功能 "Ask Photos",可以通過簡單的提問在大量照片中找出 " 孩子多年來學習游泳的歷程 "。


OpenAI 還展示了一款名為 Project Astra 的多模式 AI 助手,可以觀看并理解通過設備攝像頭看到的內容,記住用戶的東西在哪里,幫用戶在現實世界 " 搜索 " 物品,或是完成其他任務。
Google 版 AI 搜索的輸出結果不再是網址的羅列,而是一個全新的整合頁面——它更像一份針對用戶提問而形成的報告,不僅包括對問題本身的回答,也包括對用戶可能忽略問題的猜測和補充,在產品形式上,也算做到了圖文并茂。
國內某大廠同樣推出了 AI 搜索功能,但只是在傳統搜索頁面上,利用占網頁五分之一左右的空間,植入生成式 AI 的輸出結果,且只能針對特定問題觸發。整體完成度較低,因而也沒有做太高調地發布和宣傳。
兩相比較之下,Google 此次對于 AI 搜索的革新可見一斑。在有限的搜索引擎市場里,這奠定了全新的標準。而對于模式已經固化多年的搜索廣告而言,也更有想象空間。
Google 不是在發布某一項大模型能力,而是在試圖重新占領用戶心智。當下,Google 的搜索里面是 "Ask,Not Search",多模態的交互方式,只是在用戶層面進一步完善圍繞 "Ask" 建立的產品概念。
搜索的改造僅僅是個開始,Google 希望搜索能成為激發用戶 AI 需求的超級入口,即使用戶不知道具體該問什么,Google 也可以給出推薦,幫用戶腦暴。這時,搜索界面會進一步變化,變成信息流的形式,每個卡片都可以進一步操作。
在搜索之外,Google 的另一個優勢領域是 Workspace。Google 為 Workspace 發布了一款與國內火爆的 " 數字員工 " 非常相似的產品—— AI Teammate。
首先,Gemini 1.5 Pro 即將被植入 Workspace 的文檔、表格、幻燈片、云端硬盤和 Gmail 的側邊欄中,涵蓋企業日常運營的各個方面。Gemini 可以幫用戶查找具體的業務信息而不是通用信息;直接從電子郵件中檢索相關的 PDF 文件;整理和管理電子郵件中的收據,并進行歸檔,或者從收據中提取信息并添加到表格中。
Gmail App 中加入 Gemini 后,還可以提供了更加詳細和上下文相關的回復建議,還能夠為用戶提供電子郵件的摘要。
同時,Google 還將 Gemini 與 Google 生態的日歷、任務、Keep 集成,使其 AI 產品成為一個全面的數字助理。Google 還在 Gemini 執行任務前設置了檢查機制,確保信息的準確性,而 Google 助力相比其他智能助手最大的優勢就在于 Gemini 與 Google 原生產品的無縫集成。

在企業中,數字員工最早的產品是利用 RPA(機器人流程自動化)來自動化執行重復性、高量化、基于規則的任務。過去一年中大語言模型爆發,使很多辦公軟件、辦公協作產品公司看到了機會,紛紛在會議、郵件、協同,以及文檔管理等領域推出了大模型加持的數字員工產品,其中不乏國內大廠。
Google 入局此類產品,無疑加劇了行業內的競爭,也給關注此領域的企業樹立了一個 " 巨頭 " 標桿。在 Google 全套工具的配合下,AI teammate 的 AI 不再是散點工具。它的功能不只是簡單的安排日程、訂會議、做會議紀要。
在 Google 全家桶的配合下,AI teammate 可以真正理解業務流,理解業務上下文,并給出結論,甚至幫助評估風險業務,回答項目能否按期完成,這甚至已經接近一個 " 董事長助理 " 的工作了
Gemini 支持的 Workspace 將在 2024 年 6 月,以 " 通用助手 " 的形式向付費訂閱者推出。
AI 搜索和 AI Workspace 共同組成了 Google 版 AI Agents 的初貌:更強的多模態能力,全面深入多個場景的信息處理,真實理解企業的工作流。相比之下,OpenAI 的 GPT-4o 雖在生成式 AI 技術上有優勢,但在辦公應用場景中尚未形成全面、高效的解決方案。
巨頭反擊教材第二章:多打組合拳
除了核心優勢業務,Google 也在 2024 Google I/O 大會上對整個生態系統進行了全面升級。
首先是圍繞 YouTube 的視頻領域。Google 推出了對標 Sora 的 Veo,Veo 同樣可以輸出時長 1 分鐘左右的穩定 1080p 視頻。Google 稱已經向一些創作者提供 Veo,用于 YouTube 視頻制作,同時也向好萊塢推銷其用于電影制作,且 Veo 的部分功能將很快落到 YouTube Shorts 中。
Google 還推出了對標 GPT-4o 的 " 可打斷的 " 語音助手 Gemini Live,可以在 Android 上實現雙向流暢的 AI 對話體驗;還有角色聊天機器人 Gems ,與 OpenAI 的 GPT Store,以及 Character.AI 類似,Gems 可制作定制的 ChatGPT 聊天機器人,完成某些任務并保留特定的特征,例如與愛因斯坦或馬斯克對話,甚至可以為自己制作一個 " 假的 " 心理醫生。
此外,Google 和 OpenAI 一樣,都關注教育場景。
Google 推出了 Android 的 Circle to Search,可以應用到家庭教育場景中。通過多模態模型提供個性化的互動式教育體驗。這款產品不僅能理解和回應學生的問題,還能根據學習進度調整教學內容,提升了教育過程的互動性和效果。
疫情放大了在線教育的價值,家長也開始不斷提高對家庭教育的重視。調研機構 MarketsandMarkets 的分析指出,全球數字教育市場規模預計從 2023 年的 194 億美元增長到 2028 年的 667 億美元,年復合增長率達 28.0%。
Gems、Circle to Search 與 Gemini Live 等產品,無疑可以大幅提高在線教育的互動體驗,并基于 AI 為不同孩子提供個性化的教育方案,彌補了傳統教育模式難以滿足所有學生的需求的問題。
除了商業生態和場景,在 AI 基礎設施方面,Google 也進行了升級,這一點主要針對大模型 ToB 業務的成本問題。
本次 Google I/O 大會上,Google 將自研 AI 芯片升級到第六代 TPU(張量處理單元)Trillium,與第五代相比,每個 TPU 的計算性能提高了 4.7 倍。谷歌還宣布將成為首批提供 Nvidia 下一代 Blackwell 處理器訪問權限的云提供商之一。
Google CEO Sundar Pichai 表示:" 我們將繼續投資基礎設施,以推動人工智能的進步。"
相比于 OpenAI 和微軟的合作模式,Google 通過自身業務生態系統的緊密協作,提升了 Google Cloud 以及 AI 相關服務的兼容性和互操作性,也為開發者提供了更強大的工具和支持,整體的技術和商業化競爭優勢更加明顯。
在本次 Google I/O 大會上,Google 總共 124 次提及 AI。從商業生態到應用場景,再到基礎設施,Google 幾乎對所有產品、能力進行了一次圍繞 AI 的升級。
相對于 OpenAI,Google 業務的戰線更長,這既是劣勢,也是優勢。一套組合拳下來,OpenAI 前一日的全部發布,成為了 Google 發布的章節內容。這使得 Google 從單純的產品性能對比層面一躍而出,居高臨下的俯視 2024 年初的生成式 AI 市場競爭。
巨頭反擊教材第三章:整點新公司玩不起的
對于 Google 來說,所有的軟件能力,最終都會在硬件上有所體現——為什么不呢?Google 既有產品線,也有相關市場經驗。相對于軟件服務,硬件業務的重資產屬性更明顯,新銳公司很難玩得起,但 Google 如魚得水。
Google 在本次大會中不僅明確了 Pixel 手機將具備原生 Gemini 能力,使設備的多任務處理能力大幅提升,還宣布了很多 Android 15 中將推出的 AI 功能。
事實上,Gemini 早已作為獨立 App 在 Android 端上線。此次,更新中 Gemini 對話過程中,用可以直接將生成的圖像拖拽到其他應用中使用。在 Android 15 中,Gemini 則支持了 YouTube 視頻內容識別功能。Gemini 可以在視頻播放界面直接提取相關信息,回答用戶關于視頻的各種問題,甚至生成視頻內容摘要。
此外,用戶可以同時運行多個應用程序而不影響性能,這在以往手機中是難以實現的。此外,Gemini AI 根據用戶習慣提供個性化推薦,使手機使用更加貼心便捷。這種智能化服務提高了用戶滿意度,增強了 Google 在智能手機市場的競爭力。
實時語音助手功能,在 Pixel 以及安卓系統中的落地,也必將使生態更加閉環。

在 Gemini 發布時提到的輕量化 Nano 版本已確認將用于 Chrome 的改進,在輕量化模型方面,Google 又推出了全新的 Gemini Flash。這兩款 Gemini 模型以及開源的 Gemma 模型,都將在未來的端側 AI 設備方面,為 Google 積蓄模型力量。
相比于過去單純討論芯片性能和安全性,Google 的 AI 手機更加性感,也更符合實際。雖然 Pixel 手機的硬件水平在手機行業中一直處于落后地位,其唯一的競爭優勢就是原生 Android 系統。如今作為 Android+AI 的原生設備,Pixel 或將迎來新的春天。
Android 的 Gemini 更新將在 " 未來幾個月內推廣到數億臺設備 ",并且更多的上下文功能正在開發中。
Android 的生態能力優勢,第一次變得如此突出,Gemini 在其中加碼極大。對于蘋果而言,在 WWDC 到來前,一切都是未知。對于新生的華為鴻蒙而言,挑戰更加劇烈。
有趣的是,AI 不僅在 Google 的主力硬件產品中找到了豐富的應用場景,Google 還展示了 Google Glass 的最新應用,似乎想告訴外界:有了 AI 的加持,即使是過去被認為失敗的項目,如今也能為新的創新提供基礎和靈感。
由此向下繼續推演,在 Gemini 和硬件能力的加持下,即使 Google 要殺入最火熱的 AI PC 市場的也會 " 順滑 " 無比。
結語
如何評價谷歌本次發布?不妨先看一下谷歌對哪些公司造成了威脅。
首先,AI 搜索。除了已知的 AI 搜索公司 PerplexityAI,以及傳說中的 OpenAI 搜索,Google 最直接威脅的當然是傳統的搜索引擎。Google 不只是簡單的在搜索結果中增加一個 AI 總結,或是以自然語言對話方式進行搜索,Google 的多模態 AI 搜索,幾乎可以說是改變了搜索的范式,提升搜索智能化的同時,極大地提高了用戶的使用體驗。
基于 Google 這樣的升級不管是有 GPT-4 加持的 Bing,還是利用文心一言探索 AI 搜索的百度,都必須在 AI+ 搜索的產品力方面加快創新步伐,才有可能在這一領域保持競爭力。
在辦公軟件、協作辦公方面。Workspace 的升級,使 Google 有能提供 " 真正的 " 數字員工。Google 不只是要對標老牌競爭對手微軟,更是對所有研發數字員工、AI 辦公軟件以及 AI 協同辦公的供應商發出了挑戰。以釘釘、飛書、WPS 為代表的公司,在文檔處理,以及辦公、協作等方面的,可能都要重新評估自身的產品力。
在手機行業中,受到 AI 沖擊最大的廠商必然是蘋果,作為 AI 大模型時代唯一落后的巨頭,如果不在 iOS 生態中引入更多創新,蘋果恐怕很難應對來自 Android 陣營的 AI 攻勢。而其他手機廠商,不管如何高唱 AI 手機概念,在 Android+Gemini 的裹挾下,基于系統的 AI 升級空間將會越來越小,要保持競爭力,就只能在硬件、生產成本,以及供應鏈等方面 " 摳 " 些小錢了。
而對于整個 AI 行業來說,首當其沖的是 OpenAI。過去一年中,OpenAI 憑借大數據、大算力、強算法、強工程的優勢,在 AI 行業內保持了一個身位的領先優勢。而隨著技術的普及和其他科技行業的發展 OpenAI 所謂的技術優勢,支撐正在變低。OpenAI 的領先技術正在從過去的被模仿,變成同期發布。
AI 公司的技術競爭正在悄然向商業競爭和產品競爭過度。Google 通過整合其廣泛的產品生態系統,將 AI 技術落地到更多實際場景,如手機、辦公軟件、智能家居和在線教育等。一步步構建了龐大的商業生態和穩固的市場領先地位。
未來的競爭,或將更多地體現應用在場景中的多樣性和市場主導地位的爭奪上。在 GPT-5 或是其它更強大的 AI 大模型到來之前,OpenAI 等 AI 公司在應用場景上的劣勢將會被 Google 持續放大。
如今,Google 正在以教科書般的方式展示如何在激烈的市場競爭中,通過技術和商業戰略的雙管齊下實現反擊。這不僅僅是技術上的博弈,更是商業模式和生態系統構建上的較量。
