2023年是AI大模型元年,也是爆發之年,國內外科技巨頭、創業者紛紛入局?!邦嵏病焙汀熬怼背蔀锳I界的高頻熱詞。這一年,小而美的小模型開始嘗試從垂直領域超越大模型,對標主流Transformer架構的新框架正在探索模型訓練的捷徑。多模態、行業強應用頻頻顛覆業界學界和投資界的想象。
這一年,大語言模型升級迭代標的日趨龐大,各廠商從卷參數到卷擴展輸入的上下文長度,再到卷從業人員的薪資待遇。這一年,部分先入局者積攢了數據和壁壘,從開源轉為閉源,業界透明度下降。年末,美國《紐約時報》以侵犯版權為由,起訴OpenAI和微軟公司,法律和道德爭議浮出水面。
總體來看,業界離AGI(通用人工智能)還有相當距離,但后起之秀加速追趕,行業黑馬頻頻破圈,造富狂潮洶涌,行業氛圍如臨決賽圈。2024已來,回望2023年,《財經》新媒體盤點七大AI探索,用研報和數據告訴你過去這一年AI的圈內事。
ChatGPT
ChatGPT是由OpenAI開發的一種語言生成模型。它是GPT(Generative Pre-trained Transformer)系列模型的一部分,使用了基于Transformer架構的深度神經網絡。ChatGPT旨在進行自然語言對話生成,使其適用于聊天和問答任務。
2023年1月,微軟向OpenAI加注100億美元;4月,OpenAI拿下超3億美元融資;8月底,據創始人奧特曼透露,OpenAI每月營收已破1億美元;11月,GPT-4 Turbo發布,OpenAI 正成為硅谷最炙手可熱的初創公司。
GPT-4 Turbo發布后,《財經》新媒體采訪了行行AI董事長、順福資本創始人李明順。談及最新的GPT Store時,李明順表示“驚艷四方”和“窒息”。但他相信只要投入足夠的資金和算力,本土大模型的底座能力足夠支撐中國AI生態領域豐富的應用創新。
天風證券首席分析師孔蓉認為,大模型的發展趨勢是加速多模態能力迭代,對于國家、行業和公司來講,這是一場競賽,當按鈕被按下,有能力入局的參與者都會加速賽跑,因為OpenAI的先發優勢并不是不可追趕的。
2023年12月,《自然》2023年度十大人物揭曉,ChatGPT首次以非人類身份位列年度科學人物,“我們將其破例納入榜單,以承認生成式人工智能給科學發展和進步帶來的巨大改變?!?/p>
制約ChatGPT的是可能是芯片算力的物理限制、訓練數據的枯竭和服務器產能不足中的任意一環,他所需的算力正在以每100天翻一番的速度增長,“但是,生成式 AI 革命已經開始,且已經無法回頭。”《自然》評委說。
行業小模型
大模型的訓練、維護成本會因參數量提高而水漲船高,使企業盈利難上加難。據澎湃新聞估算,訓練一個千億規模大型模型的總費用 = GPU成本 + 其他硬件成本 + 數據中心成本 + 人力成本,共計約1.43億美元。經濟學人雜志根據研究機構統計推算,到2026年訓練一個頂尖模型的成本要超過10億美元。2023年下半年,小模型進入眾多公司視野。
小模型相比大模型參數量少得多,訓練成本也更小。理論來看,只要給小模型提供更充足的數據訓練,小模型的能力也可以優于大模型。
另外,“知識蒸餾”也是知識壓縮的常用做法。如百度等企業,使用針對不同行業的特別算法,先用大模型訓練,再將訓練結果傳授給到輕量化的行業小模型中,用以處理該領域的內容。此舉也可降低資源占用,節省運算成本。目前文心大模型和國內多家大模型已在各個領域落地了良好精調的小模型。
端側小模型(AI+手機)
端側小模型指的是可以在手機端運行的AI模型。通過搭載更大內存、更高帶寬的新款芯片,手機也可具備在本地運行AI計算的能力。據聯發科,最新發布的第七代APU790具備支持終端運行33億參數大模型的能力。而對于更高的算力要求,手機則會預處理用戶請求、調用大模型算力、接收云端的計算結果。
針對手機用戶日常使用特點,手機廠商亦可給大模型知識蒸餾側重用戶日常需求。例如華為讓其語音助手小藝重點學習了購物、生活常識、對話等日常場景,有讓手機“智能語音助手”變得“真智能”。
除了華為,vivo的藍心大模型、三星的Gauss大模型、OPPO的AndesGPT、榮耀魔方大模型,谷歌的Gemini均已在其最新設備中搭載運行。
AI+智駕
2023年發布了不少具備AI智駕功能的新車,主要發展方向在自動駕駛和智能座艙兩方面。想要在2023年的汽車市場占據一席之地,需要卷配置。早在2021年底,一家傳統車企就曾宣言“四顆以下,請別說話”,其新車搭載了四個固態激光雷達,11個高清攝像頭,12個超聲波雷達,5個毫米波雷達,38個智能化感知元件。另外,高速路段自適應巡航、L2及以上級別自動駕駛、城區復雜路況行駛、自動泊車等功能逐漸成為新車標配。根據中國汽車工業協會數據,傳統燃油車一般需要600顆左右芯片,為滿足智駕需求,更高級的智能汽車的芯片需求量接近3000顆。
在接受《財經》新媒體采訪時,麥肯錫全球副董事合伙人周冠嵩先生表示,目前,攻克環境感知及決策算法是一個艱難卓絕的過程。造價高昂的激光雷達,暫時充當了車企發展自動駕駛的“拐杖”,加速了城市NOA(即領航輔助駕駛)“開城”,并給予感知算法升級完善的時間。但未來,包含激光雷達點云數據在內的多傳感器數據融合方案,乃至純視覺感知方案將會成為自動駕駛廣泛普及(包含經濟型車輛)的理想方案。
根據周冠嵩先生觀察預測,在高階智駕的幫助下,駕駛員相當比例的時間、精力有望從繁瑣的駕駛工作中被釋放出來,這部分時間將可能被投入到更高附加值的工作及娛樂中去。目前操作系統本身雖尚無立竿見影的經濟效益,但智駕產品刺激了消費需求、改變了用戶場景,正在重塑中國高端電動車消費人群的偏好。
另根據ICV的報告,L2級乘用車方面,中國市場在2021年占到全球銷量的43%,達841.9萬輛,2026年預計增長至2713.2萬輛,未來五年,中國市場將是全球智能駕駛技術發展的主要推進器。
AI+機器人
2023年機器人圈里最重大的新聞當屬12月特斯拉發布的人形機器人Optimus。馬斯克曾多次強調,特斯拉是一家結合AI和機器人的公司。這位世界首富的理想是:后人工智能時代,機器人取代人類進行重復性勞動。
2023年年末,國外學術界的專家就“關于生成式人工智能(AI)與機器人”主題展開了討論。得出結論:2023是徹底改變機器人學的一年,生成式AI對機器人技術的各個領域,從模擬到設計,都產生革命性的影響。但通用人工智能和通用機器人短期內不會出現。
AI+醫療
根據易觀分析2023年最新的《中國醫療健康人工智能行業應用發展圖譜》,AI醫療應用前景廣泛,可替代醫生閱片進行病理診斷,緩解專業醫師短缺,釋放醫療資源,提高醫院運轉效率。
在健康管理方面,AI亦可對專人的體檢和健康報告進行分析,長期監測服務。此外,準確率極高的大模型線上問診,用藥監測等功能也正逐步惠及大眾,AI醫療的出現相當于為病患提供了專家陪護,但落地情況暫不明朗。
此外,荷蘭研究人員的最新研究《利用生命事件序列預測人類壽命》在健康領域值得關注。一個根據600萬丹麥人的健康數據和勞動力市場依附情況訓練出的AI模型,能以較高的準確率預測人的性格,甚至是死亡時間。
AI+氣象預測
天氣預報是科學領域中最古老且充滿挑戰的工作之一,然而要做到準確有效卻非常困難。以往預測臺風路徑需要5小時,而現在AI只需要10秒。2023年5月,中央氣象臺表示,華為云盤古大模型在“瑪娃”的路徑預報中表現優異,提前五天預報出其將在臺灣島東部海域轉向路徑。
盤古氣象大模型采用了一種名為Pangu-Weather的高分辨率模型,該模型基于全球43年的全球天氣數據,訓練深度神經網絡,使得該模型在精度和速度方面超越傳統數值預測方法。
