百度集團副總裁吳甜:AI新基建將加速產業智能化發展

中國青年網 發佈 2020-04-13T21:01:03+00:00

「新基建」持續升溫,人工智慧作為其中的重要一環,正在高速發展。吳甜還在直播中「劇透」,WAVE Summit深度學習開發者峰會將在五月舉辦,屆時會有一系列的核心能力發布。

「新基建」持續升溫,人工智慧作為其中的重要一環,正在高速發展。4月7日,36氪「超級沙龍」直播欄目舉辦「新基建」專場,百度集團副總裁、深度學習技術及應用國家工程實驗室副主任吳甜以「智能時代的AI基礎設施建設與應用」為題,結合百度在人工智慧領域的技術成果和落地案例,對「AI新基建」進行了解讀。吳甜還在直播中「劇透」, WAVE Summit深度學習開發者峰會將在五月舉辦,屆時會有一系列的核心能力發布。

吳甜在直播中表示,AI新基建是一項全方位工作,AI基礎設施則是其中的一個大型技術系統和工程系統。基於AI基礎設施的持續應用和創新,將反哺AI基礎平台,促進整個AI系統進一步進化。目前百度大腦已經成為軟硬一體AI大生產平台,在語音識別、視覺理解、語義理解、深度學習平台等領域取得了重大突破進展,並在工業製造、能源電力等領域落地應用,疫情期間,百度AI測溫、智能外呼、AI算法、CT影像分析模型等技術和產品,也在疫情防控過程中發揮了巨大的應用價值。 AI產業化需要社會全方位多方整合力量創新,共生共贏的生態系統應運而生,同時還要重視人才培養,加大力度培養既懂應用場景,又懂AI技術的複合型新型人才,促成應用更加繁榮。

吳甜直播分享包含AI基礎設施、AI應用價值、AI生態系統、AI人才培養四個方面,全文整理內容如下:

大家晚上好!最近這段時間隨著加快新基建的要求提出,新基建的建設已經成為非常重要的話題,我今天帶來的是關於人工智慧新型基礎設施建的理解,後面我會簡稱為AI新基建。新型基礎設施建設簡稱新基建,是以5G、人工智慧、工業網際網路、物聯網為代表的新型基礎設施,本質上來說,它是信息數字化的基礎設施。AI新基建是非常新的概念,今天我分四個部分來介紹我對AI新基建的理解。

一、AI基礎設施

首先介紹的是AI新基建中最基礎、最重要的硬核部分——技術平台。以百度為例,我們以AI技術平台為核心構建了一套AI基礎設施。

AI技術涵蓋的子領域非常廣,整個AI技術系統本身開放性很強,它和應用場景也有非常多的結合,和應用緊密相關,而且會隨著應用持續進化,所以它也並不是一成不變的,而是一個不斷演進、演化的系統。

百度大腦是百度AI技術的集大成,簡單的回溯一下百度大腦發展歷程。

在百度成立之初就已經在大量使用AI技術了,比如在搜尋引擎中使用自然語言處理、知識圖譜等技術。2010年開始,百度開始進行基礎能力的積累,AI布局也自此開始初具雛形。2016年,百度大腦完成基礎能力積累,AI能力開始逐步開放。2017年,百度大腦構建了完整的技術體系,AI能力進入了全面開放的階段。2018年,百度大腦的核心技術進入到「多模態與深度語義理解」階段,「多模態」就是綜合語音、視覺、文本理解能力,並且是深度、多層次的語義理解,AI在這個時候開始多維度、多層次的開放。2019年,百度大腦進一步升級為軟硬一體AI大生產平台,進入到AI能力和應用場景的融合創新階段,廣泛的和各行各業場景結合,成為了AI時代的生產平台。

先看一看AI大生產平台是一個什麼樣的平台。這個名字大家可能會覺得有些黑盒,打開黑盒看,它的組成部分中,最基礎的是算力和數據平台。在整個生產平台上,深度學習平台是底座基礎,開發者可以在這個平台進行自己AI應用的開發;這裡也會有通用的AI能力,像語音、視覺、自然語言處理、知識圖譜一系列AI能力的調用;再結合到場景當中,有大量應場景需要進行定製訓練的需求,所以開放了定製訓練平台;最終整個平台上積累的能力需要和業務系統進行部署和集成,所以也提供了部署與集成的工具與平台,在此基礎上形成技術解決方案。整個大生產平台有AI安全保駕護航,AI應用中安全也是重要的話題。

從平台底層向上,我們逐層看看各部分的含義以及現在的進展。最底層是AI基礎架構,這是整個AI大生產平台的計算底層。隨著AI算法能力的提升,對於算力的要求是越來越高的,有這些算力的基礎資源,才有可能對大數據進行計算,最後產生AI算法模型。AI+5G的時代即將到來,未來計算將會無處不在,它會從雲擴展到端、邊緣,在我們身邊就能夠時刻進行各種各樣的計算。在百度大腦上全新的AI計算架構通過晶片層、互聯層、系統層、調度層,能夠進行協同設計和技術創新,最終可以提供百萬TOPS量級強大的計算力。與此同時晶片、系統、設備都能夠進行互相連接,將不同場景中的計算連接在一起,產生更大的計算能力。

百度在使用經典的晶片基礎上,也有自研晶片,一個是雲端通用AI處理器「百度崑崙」,針對語音、自然語言處理還有圖像進行專項優化,性能可以更加提升,同時百度崑崙和飛槳深度學習平台進行了深度適配,使編程靈活度更高,能夠靈活支持訓練和預測。同等性能下使用「百度崑崙」,成本上可以降低10倍。這是雲上的處理器,還有一款在端上的「百度鴻鵠」,是專用於遠場語音交互的晶片,這款晶片採用新的設計理念,遵循軟體定義晶片全新設計思路,這裡面也有相應的核心參數,能夠在100毫瓦功耗情況下,支持遠場語音交互核心的陣列信號處理和語音喚醒能力。這些會用於車載語音交互和智能家居產品場景,帶來低功耗、高性能的產品,也帶來更大的想像空間。鴻鵠晶片已經實現了量產,現在已經在百度相應產品當中使用了。

向下連接晶片,向上連接了應用場景的就是深度學習框架及平台,在AI時代幫助開發者快速便捷完成深度學習技術研發,這是深度學習平台的使命。深度學習平台是智能時代的作業系統。

飛槳深度學習開源開放平台上已經構建起了全方位、全功能的一套平台,從飛槳的全景圖可以看出,飛槳在核心框架層能夠支持開發者進行開發、訓練、預測,整個全流程的研發工作。百度在飛槳上還發布了自己以及百度行業夥伴一起打磨驗證的一系列工業級模型,建立了覆蓋自然語言處理、視覺、推薦、語音等主流AI算法的官方模型庫。

真實在場景當中應用的時候,往往還需要端到端配套的開發套件,讓整個開發過程更加便捷、便利,並且能夠復用以前做好的各種各樣的積累。飛槳在語義理解、目標檢測、圖像分割、點擊率預估四大場景都有配套的套件,可以非常便捷的使用。

在深度學習各個方向上,飛槳平台上也提供了相應的工具組件,從平台層使用的時候提供了服務平台。這樣一個全方位的、全功能的平台,其實是針對在眾多應用過程當中不斷發現的應用難題和挑戰建設起來的。飛槳平台在開發的過程中,提供了便捷的框架,在訓練過程當中提供了超大規模深度學習模型訓練技術,在部署上也是針對多端、多平台全面部署的高性能的推理引擎,還有開源模型庫,綜合提供出來供產業使用。

介紹了算力、開發框架和平台,再看幾大AI算法方向上目前為止最新的進展。

首先看一看語音識別方向,語音識別在AI算法當中是發展歷史比較悠久,目前也是可用性非常高的技術,當然它也還持續有技術上的突破。百度上線了首個基於流式注意力的語音識別線上服務,這也是在國際上首次實現在線語音識別中大規模使用注意力模型。這個技術使用以後,在語音輸入法場景下相對準確率有50%的提升,在音箱這類產品準確率提升到20%。隨著端側智能設備不斷廣泛使用,離線語音識別在無網、弱網狀態有越來越多的需求,百度語音技術團隊通過系統性優化,解決了語言模型裁減性能損失問題,使離線模型有非常高的識別率。

語音合成方面,如果合成出來的聲音偏重於機械感,缺少情感,聽者在長時間聽的情況下會產生疲憊,所以音色模擬、情感模擬等,都會是語音合成技術需要突破的挑戰。百度推出的語音合成技術,可以用20句話製作專屬的定製語音,將聲音當中的音色、風格、情感等要素映射到不同的子空間,使用的時候不同要素進行任意的組合。在百度地圖上已經推出了全球首個地圖語音定製功能,只需要錄製20句話就可以做成一個個人專屬的語音包。

視覺理解方面,這些年在OCR物體檢測、視頻理解、目標跟蹤等業界領先的圖像視頻技術,百度多次在國內外頂級賽事中取得佳績,並且在機械製造、金融、醫療、教育等領域得到非常廣泛的使用。

虛擬形象合成方面,在對大量語音、視覺以及文本的理解能力達到了非常好的水平之後,AI算法也在推進做虛擬形象合成,儘可能形成更加自然、更像真人、更加具有豐富情感的虛擬形象。百度虛擬形象合成技術其實結合了多模態識別和理解,語音識別、視頻理解等等,再加上面部、肢體、嘴形的生成能力,還有語音合成TTS的技術,實現了業界首個可以進行量產視頻的真人形象的虛擬主播,在多個場景當中應用,央視和百度合作打造過AI虛擬主持人小靈,在央視去年的五四晚會亮相;澎湃新聞和百度打造了第一個虛擬真人形象的主播,用在早晚新聞欄目上;浦發銀行和百度合作打造了業界首個金融數字人,有情感有專業的銀行知識,能夠提升銀行的客服體驗。

語音、視覺等技術在人工智慧技術中屬於感知層技術,類比於人的感知能力。人還有非常強的認知能力,對人工智慧而言,認知能力主要體現在自然語言處理、知識圖譜等語言和知識類技術上。百度構建了超大規模多元異構知識圖譜,包括實體圖譜、事件圖譜、行業圖譜、關注點圖譜、POI圖譜,這些圖譜都會根據需求場景需要,不斷擴充和延展。

舉一個例子,基於知識圖譜視頻語義理解,從視覺視角上提取特徵,通過語音識別對視頻當中人物的對話、言論等等進行語音的識別和提取特徵,還可以對視頻標題以及周邊文本進行文本理解。這些基礎理解之後,再結合知識圖譜中的視頻理解子圖,在知識圖譜中進行計算和推理,對剛剛產生的理解的標籤、理解的特徵進行補全、關聯等等一系列操作,最終用在產品上,將會對整個視頻內容有更深度的理解。這是用感知技術和認知技術進行多模態融合的典型例子。

AI技術如果能夠完全、充分理解人的語言,將會是邁向通用人工智慧技術非常重要的突破。這方面百度也持續有新的突破。百度推出的ERNIE是持續學習的語義理解框架,可以進行增強的語義理解。比如我們想讓AI算法理解實體,我們會用百科的內容、網頁內容進行實體識別任務的構造,然後由預訓練模型進行學習,再對場景上進行針對性的fine-tuning,這樣可以得到實體學習更強的語義理解模型。再複雜一點的任務,比如構建因果關係的識別任務,也是通過技術方式,構造大量因果的知識,然後由大的預訓練模型進行學習,再進行任務上的調優學習。百度ERNIE模型已經學習了13億以上的知識,在NLP任務上全面刷新了任務效果,目前在共計16個中英文效果上超過了BERT、XLNet,取得了SOTA效果。這張圖展示出來的就是不斷加以新的知識,讓ERNIE在持續學習過程中,推動自然語言推斷、自動問答、文本相似度、情感分析任務上等等有持續不斷的效果提升。

以上是AI技術方向最新的進展概覽,百度大腦也打造了完整的AI安全體系,從基礎開源技術矩陣到開放行業解決方案,到與學術界、企業、政府、機構等開放協作,整個技術產品已經覆蓋到了雲管端,以及大數據、雲計算一系列風險問題,這樣的安全體系也是為AI技術產業應用有一個保駕護航的作用,可以推動AI時代安全生態的建設,讓大家在使用AI技術開展各種各樣應用創新的時候,沒有安全的後顧之憂。

剛剛以百度工作為例,詳細說明了AI新基建當中最基礎的技術平台現在的狀態,新基建不僅僅是技術平台,所以接下來進入今天要分享的第二部分,AI應用價值的創造。

二、AI應用價值

百度AI技術應用在網際網路產品當中,也已經有大量的實踐,比如說AI賦能的智能搜索、信息流推薦、新一代人工智慧地圖等等,以及AI為核心能力的智能家居小度系列產品,還有自動駕駛阿波羅等等,這些百度已有的產品上, AI已經帶來了非常多的價值。另一方面,AI技術其實也已經體現在面向各行各業的應用價值了,我今天還想重點分享一下AI+雲賦能產業變革與創新。

先看看這樣一個過程。首先我們需要先面對大量數據的生產和數據的應用,所以我們在百度智能雲上有推出數據工廠,在數據工廠當中通過數據眾包、加工、標註等一系列工作進行數據處理,也結合百度提供的數據集,以及整理的第三方行業數據資源,形成基本的數據集,在應用當中通過數據管理、數據評測的平台等等,使得整個數據能夠形成一個閉環效應。完整的閉環數據會充分幫助算法達到最佳效果。數據生產之後會進入到模型工廠,在AI技術平台支撐下,可以融合算力、數據、算法,結合場景產生模型,最終應用到業務系統當中。

我分享一些應用場景的案例。

智能工業巡檢。AI應用於智能工業巡檢,在針對場景定義的問題上,主要是應用圖像的分類、分割、檢測的方法,實現快速準確的識別。比如安全帽佩戴的檢測,尤其是礦井裡的安全帽佩戴檢測,煙火的警報,儀器表的讀數識別等等,這其中應用了AI的算法,相當於訓練除了有經驗的巡檢員,可以大幅減少人工投入,也降低了人工學習的成本。

智能質檢。一線質檢裡面工人要進行很長時間工作進行零件質檢,尤其是精密零件質檢,零件非常小,這些質檢工作需要在強光下進行,長時間在強光下看微小的瑕疵,容易造成工人眼睛的疲勞。案例里的工廠需要每天對出廠的2000多萬的產品進行檢測工作,質檢員每天要檢測多達1萬多個零件,每分鐘每個工人需要檢測19個,還需要對零件從多個不同的角度的多個缺陷進行分類。用AI賦能的表面缺陷視覺檢測識別設備,它通過百度AI技術和雲技術,自動對物體表面缺陷進行大小、位置、形狀的檢測,並按照品質分門別類分好,它總體上可以幫助節省90%的人員成本,整個設備相比起原來的工作桌,占地面積減少80%,漏檢率也大幅度降低。

這兩個都是感知層,視覺技術為主的應用案例。感知層技術加上認知層技術,就可以在智能媒體上發揮作用,通過熱點發現、智能寫作、智能勘誤,以及智能發布整個全流程,可以助力新聞的生產全流程。

今天還帶來了幾個在最近的抗疫過程當中,給疫情的篩查、管理帶來幫助的解決方案。首先是AI測溫,AI測溫是一套可以非接觸進行遠距離多人測溫的設備,現在也已經在數百個場所部署,幫助全國各地完成了700萬人次的初篩工作。AI測溫的過程分為幾個方面,首先在行人路過的時候,通過紅外熱像儀能夠捕獲溫度,通過光學相機,攝像頭能夠不間斷地對戴口罩的多人進行遠距離的人臉檢測。這套方案也在企業內部署,形成企業入場方案,測溫之後還可以進行人臉識別、智能監控,並且如果同企業報備系統打通之後,可以自動識別員工是否符合復工入廠的要求。這裡面採用的AI技術就是人臉檢測、跟蹤算法等,可以精準實現人臉定位,即使戴上口罩,現在也可以進行人臉識別。

在過去的兩個月大家已經感受到了,社區工作者在整個抗疫管理中做了非常多的一線工作,百度推出的基於智能對話技術的外呼系統幫助進行人員的隨訪,能夠進行批量的外呼,人工智慧語音隨訪通過自動的外呼系統,觸達到人群,並和他們交流,進行防疫信息採集和疫情防控相關的提醒。這些信息也可以立即形成結構化數據分析報告,支撐後續一系列的決策或者管理。整個外呼系統應用了語音、自然語言處理、知識圖譜等等技術。

在醫護人員最忙碌的時候,護理信息數據採集、登記、錄入等等也是他們每天非常重要的工作,百度和相關的夥伴一起打造了語音臨床護理數據採集系統,讓護理人員通過這樣的設備進行語音錄入。醫護人員不用摘掉手套、口罩,不用脫下防護服,可以非常輕鬆的手持設備進行語音錄入,很快就可以輸入大量護理信息,並將信息自動上傳至醫院的電子病歷系統。新冠肺炎相對應的臨床數據中,有非常多的醫療專用詞彙、專業醫療符號等,我們語音系統也快速進行了定製訓練,在醫護語音錄入場景中語音錄入準確率可以達到92%以上,這套系統已經在煙臺市傳染病醫院多個科室部署使用。

病毒分析和疫苗研發也是抗疫工作當中非常重要的一個工作,在2019年百度曾提出了Linearfold算法,這個算法可以將病毒全基因組RNA二級結構分析的時間從55分鐘縮短到27秒,大幅度提升RNA二級結構分析的速度。我們知道RNA結構分析在病毒分析和疫苗研發當中是非常重要的,這項工作發表了之後,受到了諸多業內專家高度的評價,目前也是在和很多機構進行合作,希望AI算法能夠助力醫學科技。

最後我還想分享的一個是飛槳和連心醫療開源肺炎CT影像分析模型,能夠提升在肺炎CT影像篩查當中醫護人員的工作效率,這個模型本身病灶檢測精度可以達到92%,召回率97%,湘南學院附屬醫院在應用當中了。

這些都是AI技術和場景結合之後所帶來一系列的價值,這也是我今天分享的第二部分,就是技術不斷的在產生應用價值,而這些應用價值恰恰是作為新基建非常重要的。

三、AI生態系統

在我們與廣大的行業夥伴進行合作過程當中,我們也看到,對於大量企業來說,業務創新和應用落地過程中存在著一系列的挑戰。比如說研發方面,AI技術的應用門檻挺高的,開發周期往往不太可控,有經驗的技術人員可以開發周期比較短,但是經驗比較缺乏的研發團隊可能經過較長的時間才能驗證、得到最佳的效果。很多企業在進行了AI加持的產品和解決方案研發之後,也需要有市場營銷以及相應的整個過程需要大量的資金投入。我們希望AI技術能夠更便利的、方便的被廣大企業所使用。

所以百度大腦開放平台構建了多層次開放能力的結構,最基礎的有飛槳深度學習平台,面向場景還有定製開發平台以及開放的能力,以及最後的部署集成的一套過程。現在在百度大腦開放平台上已經開放了248項能力,整個百度大腦的日調用量超過萬億,在百度大腦開放平台和飛槳平台上進行開發的開發者超過180萬,發布模型10多萬以上,這些模型都在大量場景中使用。AI產業化落地整個鏈條比較長、比較複雜、角色很多,整個生態系統中從硬體供應商到技術平台、到軟體供應、到應用開發、到最後的終端場景,也是多層、完整的生態系統,這樣一套AI生態系統也已經形成了,並在基礎設施上不斷發揮作用。

剛才我介紹的應用場景落地的方案,很多都是在百度大腦生態系統中研發落地的。

四、AI人才培養

有了技術平台、終端場景以及生態角色,其實貫穿始終的還有非常重要的人工智慧產業智能化相應所需要的人才。AI人才中需要基礎的理論人才、算法人才,在應用落地當中既懂應用場景,又懂AI技術的複合型人才,這類人才更加重要。大的技術平台型公司中有這類人才,但是想讓AI技術和產業廣泛結合時,我們會發現這類複合型人才更需要各個終端場景以及我們生態中的各個生態企業不斷培養和積累。技術邊界和業務理解本身是存在鴻溝的,怎麼彌補鴻溝?就需要複合型人才來做。

所以百度推出了一系列對AI人才、應用型人才的培養計劃,我今天介紹其中一個項目,「首席AI架構師培養計劃」。怎麼定義首席AI架構師?我們認為在企業當中,懂自己的業務場景、懂應用當中的挑戰與難題,又懂AI技術和算法,又同時能夠落地實施的綜合性人才,是企業當中的首席AI架構師。對希望應用AI技術進行智能化轉型的企業,這類架構師非常重要。所以我們推出了「黃埔學院」項目,在這個項目當中有深度學習技術專家進行面對面深度交流,會有深度學習技術落地的關鍵認知傳承,會和學員們一起剖析場景需求和AI技術學習的典型案例,最後總結AI思維、學習、工作方案解決實際場景問題,在實際場景當中產生應用價值。

今天分享的主要是四個部分內容,最後用一頁進行一個小結。

1. AI基礎設施是構建於雲平台基礎上,以算力平台和數據平台支撐形成的AI技術開發平台、能力平台、場景技術方案綜合的、具備AI安全保障能力的大型技術系統和工程系統。2.在基礎設施之上,要不斷在應用場景當中發揮應用價值,以此形成正向的循環,能夠促進基礎平台進一步發展,促進整個AI系統進一步進化。

3.在AI產業化過程當中,因為其過程鏈條長、決策複雜,需要社會全方位多方整合力量進行積木式創新,因此共生共贏的生態系統就應運而生了。

4.還要重視人才培養,加大力度培養既懂應用場景,又懂AI技術的複合型新型人才,通過構建相應的教育、培訓體系以及職業體系保障,多方位培養AI技術及應用人才。

綜合四方面,是基於AI新型基礎設施加速產業智能化需發展的幾個重要方向。

來源:北國網

關鍵字: