十年1000億,百度在深度學習、NLP、語音、大數據等技術研發上已經應用到搜索、金融、電動汽車等業務,但關于AI的商業價值還沒有哪個產品能直觀顯示。
編者按:本文來自微信公眾號 新摘商業評論 (ID:xinzhainews),作者:何必,創業邦經授權轉載,頭圖來源攝圖網
在“ChatGPT熱”已經全球風靡兩個月之后,百度決定入局。
近日有多家媒體都報道,百度將在3月份推出類似OpenAI旗下ChatGPT的人工智能聊天機器人服務。
但事實上,早在去年12月,李彥宏在一場面向全體員工的內部直播中就提到過ChatGPT這項技術及其前景。
“我很高興我們每天都在琢磨的技術能夠吸引這么多人的關注,這并不容易,”同時他也表示,“技術能做到這一步了,但是它會變成什么樣的產品,產品能滿足什么樣的需求,這個鏈條上還有很多不確定性。這個事情很難,但百度必須要做?!?/p>
也無怪乎百度會如此激動,ChatGPT已經成為歷史上增長最快的消費應用,在推出兩個月之后,月活用戶達1億。就算是TikTok達到這一數據也用了大約9個月。
百度作為國內AI領域的代表企業,一度以“十年累計投入超過1000億,其中核心研發的投入占比遠超其他互聯網大廠”宣稱,自然不會錯過這次由ChatGPT引爆的AIGC概念相關布局。
但ChatGPT式的產品,能給百度帶來怎樣新的故事?是否能成為百度對外標榜技術基因、并引以為傲的證詞?百度曾經定下的“all in ai”路線又是否到了收獲的季節?
ChatGPT本質上還是自然語言生成式AI,能提供高度智能的對話式問答結果,這顯然很適用于搜索場景。
比如你問它如何看待百度進軍ChatGPT,它也能有模有樣的回答。
作為一款聊天機器人,ChatGPT使用了Transformer神經網絡架構,訓練數據來自包括維基百科,以及真實對話在內的龐大語料庫。
這使得它可以輕松與人類進行各個領域的對話,回答各種問題,無論是寫代碼改bug、回答科學問題,還是寫論文、寫文章都不在話下,甚至可以做到與真正人類幾乎無異的聊天場景進行交流(如果不去計較它很多時候會一本正經地胡說八道的話)。
圖源:知乎張俊林
而百度作為國內最大的搜索引擎,還在人工智能領域摸爬滾打整10年,在ChatGPT剛火的時候,業內人士就猜測百度會跟進。
正如李彥宏所說:“這很宏偉,很激動人心。但我們認為它是可實現的,因為技術已經到了臨界點。類似ChatGPT這樣的技術很火,如何用在搜索場景上,這是比技術本身更難探索的。怎么能把這件事情做出來,讓每天有幾億人從中受益,讓他們的效率有明顯的提升?未來一年,在這方面我們非常有機會?!?/p>
有接近百度的人士跟媒體反應,去年12月后,百度就“快馬加鞭”投入相關研發,由搜索(MEG)和技術中臺(TPG)團隊牽頭,呈現形式將會是生成式搜索,也就是將搜索和ChatGPT結合。
據悉,這一應用還并未命名,一開始還是會嵌入在搜索服務中,但有別于傳統的網頁鏈接顯示搜索結果,它將會提供的更對話化、情境化的回復。
事實上,今年1月初的百度Create AI開發者大會上,百度搜索就宣布將基于百度自研的生成式模型,升級“生成式搜索”能力。還表示,搜索與生成式AI之間的關系更像是互補而非替代,百度從2021年就開始嘗試把AIGC與搜索兩者結合起來。
如今在百度將推出“國產ChatGPT”消息出來后,2月1日,百度美股早盤漲逾15%,同時帶動相關概念股上揚。
盡管百度官方沒透露太多消息,但市場還是用腳投票,在不同資本市場信息平臺上,已有投資者紛紛提問百度相關公司,是否有參與百度ChatGPT相關項目的合作,足見對其的期待。
理由也很簡單:放眼國內,不管是說對AI的技術積累,還是說在自然語言領域的經驗優勢,百度都首屈一指。
百度在人工智能技術領域深耕多年,有芯片、框架、模型、應用四層技術棧。其中,文心系列大模型參數規模達到2600億,表現超越谷歌的T5和OpenAI的GPT-3,是全球最大的中文單體模型,在行業產業已經獲得普遍應用。
并且ChatGPT最顯性的價值與落地場景,目前來看還是搜索。對百度來說,“中國ChatGPT”一旦做成,借用生成式搜索的能力,由此或將引發一連串的蝴蝶效應。
這也是為何李彥宏把該項目稱為是“引領搜索體驗的代際變革”。
對于自身搜索領域的技術趨勢,百度其實是有一定預期的。
在1月初的媒體溝通會上,百度搜索架構師辜斯繆就提出三點:第一是搜索從信息檢索到檢索+生成的混合系統。第二是搜索變成跨模態的理解和交互,搜索將以圖片、視頻、音頻等各種媒介形式理解用戶輸入的信息。第三是在知識的理解和組織基礎上完成搜索。
辜斯繆舉例道,生成一個像“高智商”或知識儲備豐富的人的人工智能,將百度搜索中的信息理解處理后提供給用戶,“我們認為它最終提供的服務質量會遠高于現在待機下的搜索服務質量”。
這正是ChatGPT在做的事。
事實上,我們現在使用的搜索產品只是當時互聯網技術的一種妥協。
在搜索框里輸入關鍵詞,當找不到合適的答案時,再換幾個關鍵詞,這一行為習慣的背后是,機器并不能很好地理解自然語言,只能退而求其次,通過信息的重合度來展現不同的網頁和答案。
而現如今ChatGPT已經讓人們見到機器理解自然語言的能力有多強大,讓人工智能直接查詢問題并理解和組織答案的可能性已經有了。
自然搜索引擎的服務能力提升也到了一個臨界點,搜索引擎的未來,不僅僅是索引網頁與鏈接,而是為每一個查詢生成相應的摘要、回答。這就是從搜索到生成。
而ChatGPT的價值,從微軟和谷歌的反應中也能略窺一二。
微軟一邊說要把ChatGPT整合到必應里,一邊又表示在Office三件套里也將添加ChatGPT功能,以實現每個人的“PPT自由”,甚至于還放出消息說要追加OpenAI100億美元的投資,大有把其當作三十年來最有回報項目之勢。
谷歌則是緊急發布“紅色警報”,多次舉行圍繞谷歌人工智能戰略的會議,讓高管反思為什么自家AI產品進展緩慢,并指示公司的許多團隊重新集中精力解決 ChatGPT對其搜索引擎業務構成的威脅。
連已經處于半退休狀態的兩個創始人都被召回,牽頭舉行關于AI和搜索兩個領域如何整合的的閉門研討會。
所以,作為同樣處境的全球最大的中文搜索引擎百度,布局ChatGPT也是一種必然。百度必須參與這場前沿競賽,否則時代就會跨過它,繼續前進。
盡管業界現在對于ChatGPT能否取代搜索引擎還是眾說紛紜,在成本側和內容質量側,ChatGPT還有難以跨過的技術鴻溝。但不少業界人士都認為,生成式AI未來大有可為。
而首先就會影響搜索引擎。摩根士丹利在2022年12月發布的報告中提到,ChatGPT可能會破壞谷歌作為互聯網用戶入口的地位。
一旦未來ChatGPT的內容質量和訓練成本得到進一步改善,像谷歌、百度、搜狗、360這種有搜索業務的企業將成為第一個被沖擊的對象。
百度不可能坐視危機發生而無動于衷,最好的防守就是進攻,搶先布局才能讓局面可控。
作為一直都想抓住前沿風口的百度來說,已經在芯片、自動駕駛、大模型、AIGC、深度學習等領域投入太多,財務上卻還是靠著搜索業務支撐,新業務大多還沒看到商業化落地的例子。
如果百度能在搜索到生成上取得足夠大的先發優勢,這無異于又是一張互聯網新時代的船票。
另外,對于百度而言,ChatGPT的另一個價值在于推動AIGC發展。相比PGC、UGC,AIGC(AI生產內容)具有效率和成本上的優勢。
在去年的AI熱營銷峰會上,百度就重點介紹了自家的AIGC內容工具,并表示“未來,AIGC 將顛覆現有內容生產模式,可以實現以十分之一的成本,以百倍千倍的生產速度,創造出有獨特價值和獨立視角的內容”。
而更進一步,AIGC的發展又能讓web3的世界更清晰,甚至于AIGC 會成為 web3 基礎的技術架構。因為web3所強調的“人人都是互聯網的中心,互聯網數據的所有權歸于每個人”,正是需要工具讓每個人都能產生個性化的內容。
同樣,在云業務上,百度作為一直強調具有AI差異優勢的云廠商,如果把ChatGPT的大模型與云計算結合,這又會給云市場帶來更多新變量。
微軟已經在這樣做了。開發者可以在微軟云上直接訪問OpenAI的大模型,然后根據特定業務進行調整,高效低成本地開發AI應用。
當然,技術能夠提供怎樣的價值,往往在于如何將其封裝進產品,對生成式 AI 也是如此。
十年1000億,百度在深度學習、NLP、語音、大數據等技術研發上已經應用到搜索、金融、電動汽車等業務,但關于AI的商業價值還沒有哪個產品能直觀顯示。
早前李彥宏提出的“框計算”概念,想把百度打造成一切信息和服務的入口,現在看來就是小程序加上ChatGPT。
當技術已經進步,老船長是否還能再次揚帆起航,答案寫在不久的將來。