徐匡迪院士之問:揭開當下中國人工智慧虛偽的面紗

陳思進 發佈 2020-01-12T03:10:52+00:00

作者 | 秦隴紀內容來源 | 科學Sciences五一前上海召開的院士沙龍活動中「徐匡迪之問」引發共鳴:「中國有多少數學家投入到人工智慧的基礎算法研究中?」核心算法缺位,人工智慧發展面臨「卡脖子」窘境。中國製造正從「硬體組裝廠」向「軟體組裝廠」蔓延,政產學研浮躁如故、積習難改。

作者 | 秦隴紀

內容來源 | 科學Sciences

五一前上海召開的院士沙龍活動中「徐匡迪之問」引發共鳴:「中國有多少數學家投入到人工智慧的基礎算法研究中?」核心算法缺位,人工智慧發展面臨「卡脖子」窘境。中國製造正從「硬體組裝廠」向「軟體組裝廠」蔓延,政產學研浮躁如故、積習難改。

中國有多少數學家投入到人工智慧的基礎算法研究中?」五一前上海召開院士沙龍活動,中國工程院院士徐匡迪等多位院士的發問引發業界共鳴,被稱為「徐匡迪之問」。這一對當下中國人工智慧直擊核心的提問,不但表明了當下中國人工智慧發展的短板,同時也揭去了披在當下所謂「人工智慧」算法外表華麗的面紗。

我國人工智慧領域真正搞算法的科學家鳳毛麟角。」4月28日超聲大數據與人工智慧應用與推廣大會,東南大學生物科學與醫學工程學院教授萬遂人表示,「徐匡迪之問」直擊我國人工智慧發展的核心關鍵問題,「如果這種情況不改變,我國人工智慧應用很難走向深入、也很難獲得重大成果」。

人工智慧是計算機技術發展到高級階段,融合了數學、統計學、機率、邏輯、倫理等多學科於一身的複雜系統。是當下所有信息技術所不能達到的高級應用。其最為核心的技術便是人工智慧算法。如何讓計算機能像人類一樣進行思考,如同人一樣利用現有的知識進行學習並實現合乎邏輯的推理,是人工智慧算法試圖實現的目標。其技術絕不是一般公司能夠輕輕鬆鬆實現的。當下國際社會公認的人工智慧研發頂尖公司,如Google和IBM等投入了海量資源,動用了頂尖的數學科學家、計算機專家,能實現了電腦程式的一定程度智能化,但距離真正的AI仍然相差很遠。

進入2018年,中國人工智慧產業「忽如一夜春風來,千樹萬樹梨花開」,一下子出現了無數人工智慧研發公司,並都號稱到得了顯著技術進步。比如基於人工智慧的醫學圖像識別系統,對於某個疾病的識別率高達95%以上,遠遠高於人工判讀。中國人工智慧真實如此繁榮嗎

中國人工智慧產業界研發現狀

某業內人士有幸了解過國內某大型網際網路企業製作的人工智慧應用。其定位於利用AI程序判讀CT圖像,利用算法實現對病灶的判讀,提高醫生的效率並降低負擔。

當問到其核心的人工智慧算法的時候,企業倒也是直言不諱,其核心技術是使用了國際上開源的人工智慧算法。在被引入後進行針對特定目的進行了二次開發,並最後整體打包成為一套完整的人工智慧應用。正是因為使用了開源的人工智慧算法,才出現了許多應用明顯能力不足的情況。

比如其無法提供一套大一統的應用。公司一共向我們介紹了大約六種疾病的診斷應用。不同的疾病需要使用對應的AI程序才可以得出相對準確的結果。如果將A疾病的算法使用到B疾病上,完全無法正常工作。就我淺薄的理解,真正人工智慧的算法並不應當如此。它應當是一套通用的算法,既可以用於A疾病的診斷,同樣也可以用於B疾病。我們需要做的是提供大量疾病案例供AI學習訓練,隨著訓練樣本數量的增加,會使人工智慧模型被訓練的越來越準確。但是這種一個疾病一個AI的方式還是頭一次聽說。好比一個醫生只能看男性長鬍子的感冒患者,如果是個不沒長鬍子的男患者,只能去隔壁就醫了。

浙江大學應用數學研究所所長孔德興教授清清楚楚說明白了這個問題。因為公司使用的都是開源算法。開源人工智慧算法能力是不足的,根本無法實現預期的能力。人工智慧算法堪稱信息行業的核武器。如此威力龐大的算法怎麼樣可會在網上被開源出來?可以認為開源的人工智慧算法相當於玩具水平的東西。想藉助這種低水平的算法,來實現真正的人工智慧應用怎麼可能實現呢?

開源算法唯一好處在於人人都可獲得,門檻非常低。所以大量公司從網上下載了開源算法,然後以其為核心研發出一套AI應用,再披上華麗的面紗,唬的普通用戶奉若神明。這也在突然間中國出現了如此多的人工智慧公司的原因之一吧。

真正人工智慧的到來還需要很長時間,絕不是藉助網上共享了的代碼就能夠實現的,必須要腳踏實地,一步一個腳印地開發出來,不付出努力想投機取巧是萬萬不能的。我國依靠開原始碼和算法是否足夠支撐人工智慧產業發展?為什麼要有自己的底層框架和核心算法?

缺少核心算法,會被「卡脖子」

如果缺少核心算法,當碰到關鍵性問題時,還是會被人『卡脖子』。」浙江大學應用數學研究所所長孔德興教授對科技日報記者表示,我國人工智慧產業的創新能力並沒有傳說中的那樣強,事實是,產業發展過度依賴開原始碼和現有數學模型,真正屬於中國自己的東西並不多。

4個月零基礎學會人工智慧、16講入門人工智慧、算法線下大課……類似培訓在網絡上非常火爆,通過對於現有算法、模型的學習和訓練,成長為人工智慧工程師的「短平快」可見一斑

既然代碼是開源的,拿來用就好,為什麼還有可能被「卡脖子」

孔德興解釋,開原始碼是可以拿過來使用,但專業性、針對性不夠,效果往往不能滿足具體任務的實際要求。以圖像識別為例,用開原始碼開發出的AI即使可以準確識別人臉,但在對醫學影像的識別上卻難以達到臨床要求。「例如對肝臟病灶的識別,由於邊界模糊、對比度低、器官黏連甚至重疊等困難,用開原始碼很難做到精準識別。在三維重構、可視化等方面難以做到精準反應真實的解剖信息,甚至會出現誤導等問題,這在醫學應用上是『致命』的。」

碰到專業性高的研究任務,一旦被『卡脖子』將會是非常被動的,所以一定要有自己的算法。」孔德興說。換句話說,是否掌握核心代碼將決定未來的AI「智力大比拼」中是否擁有勝算。用開原始碼「調教」出的AI頂多是個「常人」,而要幫助AI成長為「細分領域專家」,需以數學為基礎的原始核心模型、代碼和框架創新。秦隴紀總結,中國製造正從「硬體組裝廠」向「軟體組裝廠」蔓延,浮躁如故。

有算法之「根」才能撐起產業「繁茂」

所謂「樹大根深」,人工智慧的發展也是同樣道理,越在底層深深紮下根基,越能夠發展出強大的產業。那麼,藉助開原始碼,「半路出家」的AI產業為什麼會難以為繼?

孔德興解釋說,在獲得同樣數據的前提下,以開原始碼運行,AI深度學習之後或許能輸出結果,但由於訓練框架固定、算法限制,當用戶進行具體的實際應用時,將很難達到所期望的結果,而且難以修改、完善、優化算法。

如果從底層算法做起,那麼整個數學模型、整個算法設計、整個模擬訓練『一脈相承』,不僅可以協同優化,而且可以根據需求隨時修改,從而真正解決實際問題。」孔德興說,基礎算法往往是指研究共性問題的算法,它涉及到基礎數學理論、高性能數值計算等學科,可以應用到多種實際問題中;而針對性強的應用算法往往會應用到具體問題所涉及的「具體知識、先驗信息」,從而更好地解決實際應用問題。

「基礎算法和應用算法都很重要,擁有基礎算法將更有助於應用算法的豐富與深入。」孔德興說,AI要應對的現實生活是複雜、多變的,當能夠「應對自如」時,才能夠促成產業的「繁茂」。

呼籲三方協力讓數學不再置身事外

一方面是政策引導,其實國家已經在加大這方面的扶持,例如科研基金上的設置等。」針對如何解決「徐匡迪之問」反映出來的問題,孔德興認為,第二方面是行業企業在進行科技創新時,應有意識將數學學者納入進來。「如果通過算法的開發,最終產品落地了,企業應該將算法開發時的數學學者納入到成果分享中來。」孔德興說,社會目前對於數學科學等「軟實力」的認可程度不足,行業或法規層面應該做好數學研究成果的產權保護工作。

「第三方面,數學家本身應該積極參與到人工智慧發展的浪潮里。」孔德興呼籲,AI的未來發展需要數學家深度參與。由於目前仍處於「弱人工智慧」時代(可以說是數據智能時代),AI的實現主要是依賴計算機的巨大算力和巨大的存儲能力,底層算法的問題或許並不突出,但在未來的發展,AI將可能融入邏輯、思維等智慧的內容,這些都需要數學科學的原始創新,有大量的基礎問題亟待數學家攻克。

算法的進階一定是來源於「原創者」,而不是「跟隨者」。孔德興說:「實際上深度學習的應用已遇到了天花板,我們需要新的數學技術(如部分依賴邏輯、部分依賴數據的『聰明算法』),讓計算機變得聰明起來。這些工作都需要數學家的參與。」

人工智慧發展陷入了拿來主義怪圈

歷史已經證明,通過購買現成的產品與技術來實現技術的跨越,在科學技術領域是行不通的。中國科技行業的哪一樣,不都是經歷了艱苦奮鬥,無數科學家默默無聞為之奉獻後,方才得以傲視世界群雄?比如中國的量子技術,比如中國的國防科技,中國的天宮空間站,中國的嫦娥月球車。

作為技術高度密集的人工智慧技術,其商業領域竟然是陷入了拿來主義,著實讓人意外。中國AI產業大約從2018年開始一夜爆紅,稍微有些規模的IT廠家無不宣稱,已經推出人工智慧產品到市場上。當時認為這也是中國科學人多年來的厚積薄發,技術積累到一定程度後實現了產業的繁榮。可惜的當徐匡迪院士發出直擊靈魂的提問後,才發現原來中國的AI產業不過是看上去很美麗。

人工智慧技術本質上是以數學算法為核心,輔以計算機技術的產品。與其說是一個IT產品,倒不如說是一套數學理論,如隨機森林算法,貝葉斯算法等都是複雜的數學、統計學、機率領域的內容。這些算法試圖通過數字機率來描述人類思考的過程。計算機技術不過是通過程式語言在信息系統中實現算法過程。可見推動人工智慧前進的必定是數學領域的專家,而不是IT部門的人才。

基礎學科,比如數學一直是我們非常薄弱的環節。當華羅庚將中國數學推向一個高峰後,之後眾人還只是在努力追趕國際同行,一直沒有能在國際上獨領風騷。可想而知在人工智慧商業、民用領域,我們的進展同國際同行相經差距明顯。所以2018年的AI產業大爆發就讓人心生懷疑

沒有安心研發,那麼就拿現成的好了。正巧大家可以從網上下載到開源人工智慧算法。於是大家都將其下載下來,加上漂亮的外殼,讓我們的AI產品炫酷奪目。如果有機會能探究當下較火的商業人工智慧產品,最終會發現所有算法都指向了同一個來源。不是說開源不好,正如浙江大學孔德興教授所言,開源的產品是由其它國家人開發出來的,無論其功能好與壞,你並不知道它的開發思路是怎麼樣的。算法高效之處不知為何,而其能力不足之處也茫然不知。儘管其是開放原始碼的,不知道有多少IT公司認認真真地研讀一遍將其吃透研究明白了

還有一點想跟大家討論的是,開源的人工智慧算法絕不會是高效的,或者說是真正的算法程度。開原始碼是IT高手們將自己想法實現並放到網上供大家討論的東西,往往是初級的,探索性的東西。據說當現開源AI代碼是從印度工程師放出來的(這點也是聽聞,不確定)。現在大家應當有所體會,人工智慧絕不會是一兩個工程師就可以搞出來的東西,要不為什麼谷歌公司投入了那麼多人力物力才實現了將西洋棋冠軍打敗的程度。而這套算法卻無法應對英國高中數學問題。還有一點,真正尖端的人工智慧算法,永遠不會出現在網際網路上供人們共享的。

資本的力量是可怕的。為了賺取利潤占領市場,商家秉持著唯快不破的想法,極速將產品推出來,哪有功夫去管它是好是壞呢。可是人工智慧是一門科學,是最為嚴謹的數學課題,不可能容得下這般不負責任的炒作。

這個世界是公平的,你怎樣對待科學,這就會怎樣對待你。玩弄科學,炒作概念,不腳踏實地的鑽研反而投機取巧,必定會被其反噬。如果大家一直在追蹤AI發展情況,其實已經可以感受到,似乎AI的熱度較去年有所下降。而到現在為止尚未有一個真正能拿出手的商業人工智慧產品在市場上出現。這已經說明許多。

愛之深恨之切。我們都期盼著中國IT有朝一日能夠站在世界巔峰。這個過程是需要腳踏實地的,一個台階一個台階攀登上去,沒有任何取巧的辦法。亡羊補牢未為晚也,希望徐匡迪之問能驚醒中國IT公司,扎紮實實的一步一個腳印的走下去,讓國人早日用上真正的人工智慧應用

(提示:本文僅代表該作者觀點,投資有風險,入市須謹慎,不構成任何具體投資建議)

關鍵字: