王海峰做客極客公園《鵬友說》,揭曉百度AI的過去與未來

羅超頻道 發佈 2020-08-22T06:04:26+00:00

突如其來的疫情,讓AI產業化進程提前了至少三年,各行各業均認識到在線化、數字化與智能化不是選修課、而是必修課,而在線化與數字化的結果與目的,均是智能化。

這一次,AI的黃金時代真的來臨了。

突如其來的疫情,讓AI產業化進程提前了至少三年,各行各業均認識到在線化、數字化與智能化不是選修課、而是必修課,而在線化與數字化的結果與目的,均是智能化。

同時,國家加速新基建,AI成為核心領域之一,5G、數據中心等相關新基建同樣會促進AI發展。在「國內大循環為主體、國內國際雙循環相互促進的新發展格局」的「新循環」趨勢下,科技將會成為壓艙石,AI等核心科技的自主替換變得日益重要。

AI產業化占據天時、地利、人和諸多條件,在生活中隨處可見的AI將變得無處不在,AI正在從新技術變為新經濟。

2010年就已在布局AI的百度是中國AI產業的引領者,入局最早、技術最強、布局最全,深耕多年將AI生態做得越來越厚,既是AI的推動者也是AI的獲利者。2020年二季度財報顯示,百度AI新業務實現了兩位數的同比增長,主要為小度助手、百度Apollo智能交通和智能雲等相關業務增收顯著,李彥宏表示:AI新業務有望在未來幾年成為營收增長的重要動力。

談到百度AI戰略,就不得不提王海峰,他經歷了百度AI從0到1再到成為公司戰略的關鍵十年,是百度AI技術團隊的牽頭人,如今以百度CTO的身份統管技術線同時直管智能雲業務,成為百度AI產業化戰略的執行領導者。

百度將如何迎接AI的黃金時代,如何避免「起個大早、趕個晚集」?8月21日,王海峰做客《鵬友說》,給出了答案。前十年,百度AI敢為人先,卻「拔劍四顧心茫然」,因為AI技術應用場景不多。接下來百度AI將落地到各行各業。百度如何做到?

參加《鵬友說》,王海峰是具有產業思維的科學家

《鵬友說》是極客公園創始人張鵬做的一檔視頻訪談節目。張鵬是中國最早的IT記者之一,從普通記者一路做到《IT經理世界》執行主編,以聯合創始人身份創辦了《商業價值》雜誌並擔任主編。

2010年張鵬創辦科技媒體極客公園,在產品經理中影響力頗大。張鵬的編輯部人才輩出:知乎創始人周源、摩拜創始人胡瑋煒、小米生態鏈副總裁夏勇峰,他本人在科技圈影響力甚大:一年一度的GeekPark曾邀請到的嘉賓就有谷歌前CEO施密特、蘋果聯合創始人沃茲、李彥宏、李書福、雷軍、阿北、周鴻禕、王興、王小川、李學凌諸多大佬,且不難發現,其中大部分是技術或產品狂人。

有意思的是,GeekPark也是李彥宏唯一參加的科技媒體舉辦的活動,且不止一次參加,百度成立第一年,李彥宏就與張鵬結緣於一次媒體溝通會,後來百度做到非常大的時候,李彥宏依然會現身GeekPark活動。

了解了張鵬,就不難理解身為百度CTO的王海峰為什麼要參加《鵬友說》了。

近期,王海峰的母校哈爾濱工業大學建校百年,出版了校友系列叢書,其中《AI已來:讓中國AI走向世界的王海峰》,就記錄了王海峰求學、成長,以及推動百度AI發展、引領中國AI落地產業間、走上世界舞台的歷程。

王海峰第一標籤是技術,他是哈工大培養的博士,學生階段研究課題就是機器翻譯方向,接觸了當時很冷門的NLP等技術,與AI結緣,在AI領域紮根三十餘年,經歷AI從過去高牆深院的研究,走向產業化成為推動人類經濟、社會發展的新技術引擎的整個過程。

2010年加入百度歷任高級科學家、基礎技術首席科學家、副總裁、高級副總裁,先後為百度創建了自然語言處理部、網際網路數據研發部、推薦引擎和個性化部、多媒體部、圖片搜索部、語音技術部等,這些部門研發的技術都是AI強相關,特別是自然語言處理技術,更是被視作是人工智慧皇冠上的明珠。2013年,作為執行負責人協助創建了百度深度學習研究院(IDL),說他是百度AI的奠基人絲毫不誇張。

王海峰本人是技術大牛,在自然語言處理領域,他是世界上影響力最大的國際學術組織 ACL(計算語言學協會)50多年歷史上首位出任過主席(President)的華人, ACL會士,並於2018年7月出任ACL亞太分會AACL創始主席,曾獲國家科技進步獎二等獎等獎項,享受國務院政府特殊津貼。

王海峰不只是具有科學家身份的技術狂人。在《鵬友說》王海峰迴憶,當年因為《鐵臂阿童木》對機器人感興趣去做機器翻譯的研究,畢業後準備去科研院所,時任微軟研究院的李開復去學校演講,結束了和王海峰聊,王海峰表示希望做的研究真正能被很多人所使用,於是擁有Windows、Office等產品的微軟成為他的第一個「東家」,用張鵬的話說「可以把一個技術真正讓更多的人用起來,這是一個讓你心中更有火焰的東西。」

兜兜轉轉,2009年李彥宏提出「框計算」,當時很多人無法理解,但王海峰看到自己擅長的NLP技術有了用武之地,心中有火、眼裡有光,2010年王海峰加入了百度,一步一個腳印構建AI基礎技術體系,同時致力於推動AI技術與業務融合,推動AI技術工程化。

在百度,不論是用AI重構搜尋引擎,還是依託智能雲推動AI產業化,王海峰在科學家思維外,都在不斷強化產業思維:關注用戶與市場需求,這是技術落地的前提。工程師容易犯的錯是拿著錘子什麼都是釘子,而產業家則是先有釘子再去找錘子。王海峰一邊替百度儲備夯實AI基礎技術,另一邊真正讓技術被更多人用起來,而不是在實驗室被雪藏,我認為底層是離不開這兩種思維的,我想正是因為此,王海峰才會出現在具有產品文化的極客公園的《鵬友說》且跟張鵬聊得很好,釋放出了不少關於他本人與百度AI的新信息,讓我們可以更加深刻地理解百度的「簡單」文化。

基於AI,百度履行「讓複雜的世界更簡單」的使命

2010年百度從一行行代碼開始,從0到1研發AI技術、聚集當時十分稀缺的AI人才。2014年百度就開始將AI應用到業務,第一步是用AI全面重構搜尋引擎,2014年王海峰任搜索業務群組副總經理,先後負責搜索、信息流、手機百度、度秘等用戶產品,以及自然語言處理、知識圖譜等基礎技術。

現在看來AI驅動的搜尋引擎事實上已讓「框計算」變為現實,用王海峰的話說:「用戶在框裡做任何輸入,你都要能滿足。」二季度,百度搜索的首條結果滿足率已達到60%,去年才51%。同時,搜索不再只是用戶主動鍵入,張鵬說「信息流也是跟機器學習有關的,它成為了搜索的另一面」,這一點正是百度做的「搜索+信息流」雙引擎模式,在王海峰看來,不論是語音、推薦背後都是一套技術。

好的科技產品都是解放人類,給人類自由,搜尋引擎正是其中典範。張鵬說:「搜索意味著人們探索這個世界自由的能力。」王海峰進一步解釋稱,人們在遠古時代查找檔案信息、在圖書館查找資料、出現圖書館情報信息等相關學科,均表明搜索是貫穿人類歷史的剛需,計算機與網際網路技術催生了搜尋引擎技術,讓人們可以自由獲取信息以及探索世界。王海峰認為,框計算本質是降低搜索門檻,如今「人工智慧技術改造搜尋引擎讓它變成智能搜尋引擎的時候,用起來會更加方便,能找到的東西會更加精準。」

優秀的科技產品將複雜留給自己,簡單留給用戶,賈伯斯一直將「簡潔」作為蘋果產品的核心追求,大道至簡、少即是多,將複雜的工程師邏輯留給自己,將簡單的操作體驗留給用戶。基於AI的智能搜索或者說大道至簡的框計算,也做到了這一點。

「框計算」與「智能搜尋引擎」,均是百度將複雜的技術留給自己,將簡單的體驗留給用戶,王海峰在百度期間推動AI平台化、百度積極推進的AI產業化,同樣體現出這一思維。

2013年百度提出平台化,王海峰成為平台化委員會的第一任主席,平台化簡單地說就是將百度越來越龐雜的AI技術封裝起來,給百度內部各個業務線的工程師提供簡單的API接口,讓他們高效、快速地將AI技術應用到百度業務中,如問答、百科、翻譯、地圖等等。「平台化」本身就是「封裝複雜」,正是基於此,百度在2016年快速上線了行業一流的信息流平台。

2016年,百度發現所積累的AI技術日益豐富和成熟,社會各界對AI的價值有了認知,對AI技術的需求開始冒頭,百度做出一個新的決定:開源開放AI,一方面百度不可能將所有事情給做了,大家一起應用AI就可以加速AI落地到產業。另一方面,在全社會場景千錘百鍊,百度AI技術就可以日益精進,強化壁壘。這一階段王海峰組建AIG,總體負責百度的算法、算力、數據、安全等人工智慧技術及基礎技術,給百度AI底層平台添磚加瓦。

不只是搜索,AI技術的魅力是可以應用到各行各業,用複雜的技術卻讓人們的生活與工作變得更加簡單,刷臉讓身份認證變得簡單,智能音箱讓人機互動變得簡單,智能金融讓風控變得簡單,智能交通讓出行變得簡單……基於此,應該更能理解百度2017年升級的使命「用科技讓複雜的世界更簡單」,以及百度推動AI產業化,用AI賦能各行各業的決心。

AI的開源開放,本質上依然是將複雜留給百度,將簡單留給行業。王海峰在《鵬友說》對這一理念進行了闡述,他明確百度是一個「人工智慧的平台型公司」:「用科技讓複雜的世界更簡單,百度致力於做的事情都是這樣的事情,比如說讓你獲取信息更簡單,讓你跟這些AI系統交互更簡單,讓你交通出行更簡單,讓你的產業智能化升級更簡單。」

百度成立初期就秉持「簡單可依賴」的文化,百度對外提供的AI能力都在做到儘量簡單化,比如深度學習平台飛槳,讓複雜的深度學習技術變得十分簡單易用,開發者調用API就可以便捷地實現AI。再比如百度大腦提供了260多項能力,僅僅是機器視覺的文字識別就有票據識別、表格識別等等細分模塊,同時提供開放模型庫、開發套件、工具組件等等配套設施,百度自己做了大量的複雜的事情,將簡單留給了各行各業。

看完《鵬友說》張鵬與王海峰的對談,「簡單」一詞給我留下深刻印象,百度基於AI實現智能搜索將簡單給到用戶,百度AI的平台化思維將簡單留給工程師,百度AI開源開放將簡單留給產業……這是百度的理念,也是AI的魅力,AI讓世界更簡單,本質上也是在解放人類,消滅繁瑣重複的工作,減少人類犯錯的機會,給人類時間與身心的自由。

百度AI一切都已Ready,在智能時代開花結果將成必然

張鵬說「AI越來越走到更商業,更多的產業裡面,一定要從當年技術人員開源的概念到商業世界開放的概念,要完成這麼一個跨越。」AI越普惠,商用範圍越廣,就越要降低使用門檻,變得簡單,基於「將複雜留給自己、將簡單留給產業」的理念,百度領先的AI技術,開源開放時無疑會具有極大的競爭力。

在《鵬友說》,王海峰迴顧了百度AI十年的四個階段。2010-2013年,幫助百度AI在各方面打下基礎,完成包括自然語言處理、機器翻譯、語音、視覺、機器學習、深度學習,以及數據挖掘、知識圖譜、對話式推薦等核心技術布局,並將核心技術平台化;2014-2017年,運用AI將搜索這一百度核心業務全面智能化升級;2017-2019年,將原有的AI平台升級為軟硬一體的工業大生產平台,適應更廣泛的AI工業大生產應用;2019年下半年至今,接手智能雲,推動更廣泛的AI落地和產業智能化發展。

在世界人工智慧大會上,李彥宏演講曾指出AI發展一共分為技術智能化、經濟智能化與社會智能化三個階段,經濟智能化分為兩部分,上半場是AI平台化蓄能,在搜索、信息流等少數領域落地;下半場是AI產業化,AI滲透到各行各業大規模商業化,李彥宏認為「我們正處於從經濟智能化的前半段向後半段過渡的時期」,這一結論得到行業廣泛認同,也不難發現,百度AI十年的發展與AI產業的發展步調是完全一致的。

或許百度最初做AI沒有想過要開放到各行各業,但現在回頭看,每一步都是在給今天的AI產業化做準備。就像賈伯斯在斯坦福演講時指出的那樣:「你不能預先把點點滴滴串在一起;唯有未來回顧時,你才會明白那些點點滴滴是如何串在一起的。所以你得相信,你現在所體會的東西,將來多少會連接在一塊。你得信任某個東西,直覺也好,命運也好,生命也好,或者業力。這種作法從來沒讓我失望,也讓我的人生整個不同起來。」他的例子是當年大學時上的書法課,後來幫助蘋果設計出的麥金塔成為第一台能印刷出漂亮東西的計算機,蘋果的審美一直秒殺微軟等平台。

而百度信任的,不只是簡單可依賴的文化,還有技術。在《鵬友說》王海峰坦言,百度技術團隊「堅持技術信仰,務實自驅,負責到底」。讓複雜的世界更簡單不一定都要靠技術,但是王海峰認為歷史上每一次大的改變都是科技帶來的,「每一次工業革命背後是科技帶來的改變,帶來生產力的變化,進而帶來生產關係,帶來整個人們生活,世界變成完全不同的樣子。」百度做搜索,做AI,做自動駕駛……無不是基於對技術的信仰。

在AI領域深耕30年,王海峰感觸頗深,前三十年AI從個實驗室走向工業大生產,AI成為第四次工業革命的核心驅動力,不過目前AI工業化依然處在早期,還有非常廣闊的空間可以進入得更深、更廣。此時此刻,百度已經做好準備,依託領先的「全科生」AI技術、深耕五年的AI產業化生態,百度事實上已成為AI產業化基礎設施,與CV(機器視覺)四獸、科大訊飛等垂直型AI平台相比,擁有巨大的差異化競爭力。

王海峰認為:「當AI真正成為工業化大生產,往往不止需要其中的某一項應用,而更多是各種技術的綜合應用。若干技術組合起來,才能幫助更多的應用場景。」基於此百度選擇做AI技術的「全科生」,而不是「專科生」,再通過開源開放讓各行各業可以簡單地獲取AI能力。

今年百度智能雲多次調整架構給AI產業化排兵布陣,王海峰明確了百度智能雲「以雲計算為基礎,以AI為抓手,聚焦重要賽道」的戰略,基於飛槳、百度大腦、NLP和知識圖譜等全棧AI底層技術平台,小度OS、百度地圖、如流等數字化組件,以及ACE交通引擎等行業解決方案,百度智能雲在一眾雲服務商中形成差異化競爭力,一直在AI Cloud中國排名第一。二季度,百度智能雲相繼與國家電網、南方電網、央視網、中國建材集團等達成合作。目前,百度AI開放平台依託百度智能雲,已經開放260多種AI能力,服務210多萬開發者。

前段時間網上熱傳的百度AI新基建版圖則顯示,依託包括百度大腦、飛槳、智能雲、晶片、數據中心等在內的新型AI技術基礎設施,百度正在推動智能交通、智慧城市、智慧金融、智慧能源、智慧醫療、工業網際網路和智能製造等領域實現產業智能化升級,展現出成為中國新基建AI服務最大提供商的野心。

王海峰說:「AI是一個堪比一次工業革命的大浪潮,需要非常多的人一起去努力,推動整個人類科技社會的進步,這個不是任何一個人,一家公司能做到的,所以我很高興看到有這麼多企業一起在做事情。而且只要是我能幫到的,我也會盡我所能去幫助他們。」AI的黃金時代已然來臨,百度對自己的資源、能力與邊界非常清楚,它清晰地知道自己應該做什麼、怎麼做。

關鍵字: