CDA數據分析師

訂閱

發行量:73 

盤點AI人工智慧的炒作周期——究竟是危言聳聽,還是大局已定?

作者 | Alok Aggarwal編譯 | CDA數據科學研究院-詹惠兒原文 | The Current Hype Cycle in Artificial Intelligence - KDnuggets1、前言在過去的十年中,人工智慧(AI)領域取得了驚人的發展。

2020-01-06 08:36 / 6人閱讀過此篇文章  


作者 | Alok Aggarwal

編譯 | CDA數據科學研究院-詹惠兒

原文 | The Current Hype Cycle in Artificial Intelligence - KDnuggets

1、前言

在過去的十年中,人工智慧(AI)領域取得了驚人的發展。據不完全統計,現在存在20多個領域,其中AI程序的性能至少與人類(甚至好於人類)相同。這些進步導致了AI的大量爆發,這讓人回想起第一個AI炒作周期的1956-1973繁榮階段。投資者正在為基於AI的研究和創業公司提供數十億美元的資金,而未來主義者再次開始對強大AI的興起做出令人震驚的預測。許多人對人類在就業市場中的未來提出了質疑,聲稱到2033年,多達47%的美國工作屬於高風險類別,這些行業將被自動化所取代。

在本文中,我們認為AI的短期影響不太可能像這些主張所表明的那樣明顯。導致40年前AI繁榮的第一個階段消亡的幾個障礙,今天仍未解決,看來克服這些障礙需要認真的理論進展。此外,當前的基礎設施不適合大規模地整合AI程序,這意味著AI系統不可能很快就能大規模取代人類。因此,上述預測在未來十五年內不太可能實現,金融家可能不會從他們最近在人工智慧方面的投資中獲得預期的回報。

2、大膽的期望

人工智慧最近的炒作以兩種形式表現出來:驚人的預測和大量的投資,下面將對這兩種方法進行討論。

2.1 到2035年人工智慧的力量預測

在過去的幾年中,人們越來越相信AI是一種無限的神秘力量,它能夠(或將很快)取代人類並解決任何問題。例如,雷·庫茲韋爾(Ray Kurzweil)預測:「到2029年,人工智慧將達到人類的水平」,格雷·斯科特(Gray Scott)表示:「到2035年,人類沒有理由也沒有辦法跟上人工智慧機器的發展。 」。埃隆·馬斯克(Elon Musk)表達了類似但不祥的情緒,他寫道:「人工智慧的發展速度……非常快…………發生嚴重危險的風險發生在五年時間範圍內。後來又說:「藉助人工智慧,我們可以召喚惡魔」 。

人工智慧將在2029年左右達到人類的水平——Ray Kurzweil,2014年

儘管有人認為馬斯克的願景是極端的,但研究人員仍然擔心強大的AI很快將對人類在就業市場上的未來產生重大影響。例如,2013年,牛津大學的兩位教授弗雷(Frey)和奧斯本(Osborne)發表了一篇文章,標題為「就業的未來:計算機化工作的敏感性如何?」,他們試圖分析就業市場中可以在接下來的二十年內實現計算機化。他們估計,「美國總就業人數的47%屬於高風險類別,這意味著相關的職業可能會在未指定的幾年內(可能在一到兩年內)實現自動化。」 完成這項工作後,各種諮詢公司和智囊團撰寫的幾篇論文預測,由於自動化,未來20年內將失去20%至40%的工作機會。

這些預言在許多企業和各國理事機構的董事會席捲了漣漪。由於在美國,人工智慧系統有望將勞動力成本降低十倍,因此這種預測表明,通過採用人工智慧程序而非人工,企業可以變得更加有利可圖。但是,這可能迫使失業率達到驚人的水平,從而在全球範圍內造成巨大的經濟破壞。

2.2 初創企業和大規模投資的爆炸式增長

麥肯錫公司(McKinsey and Company)的數據顯示,2016年,非技術公司在AI方面的支出在260億至390億美元之間,技術公司在AI方面的支出在200億至300億美元之間。同樣,基於AI的初創公司在2012年左右開始爆炸式增長,並一直持續到今天。2017年12月,AngelList(一個連接初創企業與天使投資者和求職者的網站)列出了3,792個AI初創企業; 2,592名關聯天使投資者;和2,521個相關的職位空缺。根據Pitchbook的數據,風險資本家在2007年投資了2.85億美元用於AI初創公司,2015年投資了40億美元,2016年投資了54億美元,2017年1月至2017年10月投資了76億美元; 2007年至2017年間,風險投資對AI的投資總額超過250億美元。根據CBInsights,僅在2016年,就有658家AI初創公司獲得了資金,並正在積極推行其商業計劃。實際上,今天要獲得風險投資,大多數新業務計劃都至少需要提及AI。

圖1:人工智慧初創企業的風險投資(來源:Pitchbook)

3、第一個AI炒作周期-快速回顧

當前對AI的炒作極大地讓人聯想到1956年至1973年之間的第一個AI炒作周期的繁榮階段所發生的情況(本系列的第一篇文章)。的確,在人工智慧方面取得了幾項顯著進步之後(例如,第一個進行了跳棋的自學程序,以及引入了神經網絡),政府機構和研究機構很快就在人工智慧研究中投入了大量資金。在這種受歡迎程度的推動下,人工智慧研究人員也迅速做出了關於強大人工智慧的開始的大膽預測。例如,在1961年,馬文·明斯基(Marvin Minsky)寫道:「在我們一生中,機器可能會超越我們的一般智慧」 。

但是,這種欣喜是短暫的。到1970年代初,當人們對AI的期望沒有實現時,幻滅了的投資者撤回了他們的資金。當AI的研究進展緩慢,甚至「人工智慧」一詞被拒絕時,這導致了AI破產階段。回顧過去,人工智慧繁榮階段的消亡可以歸因於以下幾個主要障礙:

3.1 有限且昂貴的計算能力

1970年代的計算能力非常昂貴,而且還不足以模仿人類的大腦。例如,創建一個人腦大小的人工神經網絡(ANN)會在1974年消耗掉整個美國的GDP。

3.2 人類思想背後的奧秘

科學家不了解人腦如何運作,尤其是不了解創造力,推理和幽默背後的神經機制。缺乏對機器學習程序應該嘗試模仿的精確範圍的認識,在推動人工智慧理論發展中產生了重要問題。正如麻省理工學院教授休伯特·德雷福斯(Hubert Dreyfus)簡要解釋的那樣,「這些程序缺乏四歲兒童的直觀常識」,而且沒人知道如何進行。

上面提到的第一個難題可以歸為機械難題,而第二個難題可以歸結為概念難題。兩者都是40年前AI繁榮第一階段的結束。到1982年,明斯基本人已經推翻了他以前的樂觀觀點,他說:「我認為鋁的問題是有史以來最困難的科學之一」。

圖2:尚未完全了解其功能的人腦

3.3 沒有概念上的突破

顯然,在「危險遊戲」中擊敗人類,IBM Watson在2011年所做的事絕非易事;但是,它僅提供類事實作為對《危險》中各種問題的答案!隨後有關IBM Watson的聲明和廣告暗示,它可以幫助解決一些與人類有關的難題(例如,幫助癌症研究和尋找替代療法);然而,與MD安德森癌症中心和其他醫院的後續工作表明,它遠沒有達到這樣的預期。實際上,如今沒有任何AI系統甚至接近HAL 9000,這是一台人工智慧計算機,在電影《 2001:太空漫遊》中被描繪為對手 。

在過去的40年中,基本上發生的事情是在上述第一個(機械)問題上取得了重大進展。此處的促進原理是摩爾定律,該定律預測電子電路中的電晶體數量應每兩年大約增加一倍。結果,自1970年代以來,計算的成本和速度提高了110萬倍。這導致了無處不在且廉價的硬體和連接性,允許數十年前在第一個炒作周期中發明的一些理論進展(例如,反向傳播算法)和一些新技術在實踐中表現明顯更好,主要是通過啟發式和工程學的繁瑣應用技能。

但是,仍然缺乏在概念上的突破,它可以提供對上述第二個問題的深刻見解:我們仍然不確定如何創建真正模仿智能生活的機器以及如何賦予其「直覺」或「常識」或能夠很好地執行多項任務的能力(例如人類)。即使在最現代的AI程序中,這也導致了幾個明顯的缺陷(在下面詳細說明),這使得它們在大規模使用中不切實際。

任何足夠先進的技術都無法與魔術區分開——亞瑟·克拉克(Arthur C. Clarke),1973年

4、現代的AI中明顯的缺陷

4.1 當前的深度學習網絡並不強大

2015年,Nguyen,Yosinki和Clune檢查了領先的圖像識別深層神經網絡是否易受假陽性的影響。他們通過擾動模式生成隨機圖像,並向這些神經網絡顯示原始模式及其變異副本(這些網絡使用ImageNet的標記數據進行了訓練)。儘管擾動模式(下面的圖3中描述了其中的八個)基本上沒有任何意義,但是它們被這些網絡錯誤地識別為國王企鵝,海星等,占99%以上的置信度。

另一個研究小組表明,通過佩戴某些迷幻眼鏡,普通人可能會愚弄面部識別系統,以為自己是名人。這樣一來,人們就可以相互模仿,而不會被這種系統檢測到。同樣,2017年的研究人員在路標上添加了貼紙,這導致ANN將其分類錯誤,這可能對自動駕駛汽車造成嚴重後果。在這些AI系統變得足夠健壯到不會被此類干擾所欺騙之前,行業廣泛採用它們是不可行的。

4.2 機器學習系統仍然效率低下

機器學習算法需要成千上萬的貓(和非貓)圖片,然後才能開始準確區分它們。如果AI系統在與過去大不相同的情況下運行(例如,由於股票市場崩潰),這可能會給AI系統帶來嚴重的問題;由於AI系統可能沒有足夠大的數據集來進行充分訓練,因此它可能會失敗。

4.3 深度學習網絡難以改進

儘管深度學習算法有時會產生優異的結果,但它們通常是「黑匣子」,甚至研究人員目前也無法建立理論框架來理解它們如何或為什麼給出答案。例如,達德利(Dudley)和他的同事在山峰(Mt. 西奈醫院可以在很大程度上預見精神分裂症的發作,但達德利遺憾地指出:「我們可以建立這些模型,但我們不知道它們如何發揮作用」 。

由於我們不了解AI程序處理的數據與其最終答案之間的直接因果關係,因此系統地改進AI程序仍然是一個嚴重的問題,通常是通過反覆試驗來完成的。出於同樣的原因,如果出現問題,很難解決這些問題。鑒於這些問題以及人們被教導要「處理」原因(而不是症狀)的事實,至少在任何時候,許多行業不太可能能夠依靠深度學習程序。例如,醫生不太可能僅根據程序的預測即患者很快會成為精神分裂症而向患者給藥。的確,如果程序的預測不準確,並且患者由於使用不當藥物引起的副作用而患病。

4.4 摩爾定律將在十年內結束

如前所述,根據摩爾定律預測電路中電晶體數量的指數增長速度,是影響我們AI進步的最重要原因。在達到一個矽原子的理論極限之前,當今的電晶體尺寸最多可以減少4900倍。2015年,摩爾本人說:「我認為摩爾定律將在未來十年左右消失」 [117]。因此,尚不清楚在摩爾定律消亡之前是否會開發出強大的通用人工智慧系統。

5、人工智慧系統對人類社會的短期影響

5.1 適應不良的基礎設施

即使解決了前面提到的AI系統問題,以下原因也表明,仍必須付出大量努力才能使公司,組織和政府的基礎架構適應廣泛採用AI程序的情況:

  • 現代AI算法通常需要強大的(數千個內核)處理能力。但是,很少有組織在單個群集中安裝具有100個以上內核的並行計算基礎架構,並且安裝較大規模的系統既費時又昂貴。原則上,組織可以將其數據發送到技術公司(例如Amazon Web Services或Google Cloud),後者可以大規模提供並行和分布式計算。但是,由於風險(例如,數據泄露)和合規性原因,許多組織無法使用此類服務。
  • 大型公司中的數據通常駐留在數千個不同的資料庫和位置中。這些數據大多數都是「嘈雜的」,如果AI系統以當前形式使用此數據,則它們很可能會失敗。清理和協調數據是一項艱巨而耗時的任務,數據工程目前是部署AI系統的最大瓶頸,占其時間和成本的60%以上。大多數組織尚未開始大規模清理其數據,而少數已經開始這樣做的組織則預計將花費兩到五年的時間。
  • 上游或下游的變化(例如,不斷變化的法規或商業環境)可能會迫使AI系統進行重新配置,重新培訓,重新驗證和重新測試;如前所述,這可能會導致嚴重問題,因為AI程序可能缺少新的培訓數據。

圖5:協調大數據就像弄清了許多拼圖一樣

5.2 人類工作的短期未來

儘管弗雷和奧斯本(Frey and Osborne)預測:「美國總就業人數的47%屬於高風險類別,……大概在一兩年之內。」 大型技術公司,戰略公司和智囊團的研究部門長期以來一直低估(至少兩倍)的歷史,具體的技術進步影響人類社會需要多長時間。原因是這些分析通常無法解決關鍵問題:全球經濟並非一帆風順-變化需要時間。如果人類能夠幫助他們,他們很快就會適應現代技術,但是如果它傷害了他們,他們就會非常有抵抗力,這種現象很難量化。

例如,在過去的四十年中,通過使用外包,在高薪國家中已經有很大的機會可以將勞動力成本降低四分之一。從1979年左右開始,美國將製造業工作外包給低薪國家,但由於到2016年,美國由於外包而累計損失了不到800萬個製造業工作。同樣,美國的服務工作外包始於1990年代,但美國已累計損失了約500萬個此類工作。因此,外包造成的工作損失總計約1300萬,約占美國1.61億工作人口的8%。如果全球經濟發展順利,弗雷和奧斯本預測的大部分(如果不是全部)47%的工作將流失給外包。

此外,除非在概念上有重大突破,否則先前提到的AI程序的不足也將導致在未來的15年內不太可能因自動化而大量失去工作。的確,人工智慧系統在學到的知識上做得很好,但是如果它們的規則被細微地干擾,就會很快失敗。如果工作受到威脅,人們可以輕鬆利用這一事實,例如,如果使用自動駕駛軟體,計程車司機可能與其他人合謀引入導致事故的惡意軟體(或在停車標誌上貼上標籤,如上所述)。同樣,可以通過不斷變異惡意軟體攻擊其防禦來擊敗ANN ;錯誤的人可以使用此方法將錯誤數據走私到ANN訓練集中,從而破壞了AI系統的學習過程。

最後值得一提的一點是,在接下來的15年中將創造更多的工作,這在Frey和Osborne的分析或隨後的任何分析中都沒有考慮。

5.3 投資收益

由於上述原因,人工智慧系統的採用和實施可能會慢於投資者的設想。因此,目前尚不清楚金融家是否會從他們的AI投資中獲得收益。在過去十年中,AI投資的總價值超過250億美元,特別是因為只有11家受資助的私人公司的市值達到或超過10億美元。實際上,自2012年以來,在AI的70項併購交易中,有75%的交易價格低於5,000萬美元,是「收購雇員」(為人才而非業務績效而收購的公司);大多數由投資者資助的公司籌集的資金不足1000萬美元。至少到目前為止,在人工智慧上投入少量資金可能會產生不錯的回報,但效果卻不佳。

6、結論

過去幾年標誌著AI新的炒作周期的開始。該領域的最新進展引起了研究人員和公眾的興趣,他們開始對強大的AI的產生做出令人震驚的預測,而金融家也開始對AI研究投入大量資金。和初創公司。這讓人聯想起四十五年前的第一個AI繁榮階段。人工智慧領域也看到了許多驚人的進步,大膽的預測和大量的投資。最終,這一繁榮階段崩潰了,主要是由於兩個原因。首先是機械的,由於1970年代有限且昂貴的計算能力。第二個是概念性的,因為缺乏對「直覺」和「人類思想」的理解,很大程度上由於摩爾定律,第一個問題已得到實質解決。在過去的40年中,硬體的成本和功能提高了超過一百萬倍,從而可以使用無處不在且價格合理的硬體來製作更好的AI程序。但是,第二個問題仍未解決。此外,即使是最現代的AI程序,也存在重大缺陷,這些方案對擾動仍然很敏感,學習者的效率低下,難以改進。即使解決了這些問題,當前企業和政府的基礎設施似乎也無法快速大規模地整合AI程序。因此,研究人員,投資者和公眾(關於AI)的大膽期望不太可能在未來十五年內實現。

儘管AI的許多舉動都導致了驚人的發展,但其中很多似乎也基於「非理性繁榮」 ,而不是事實。在AI系統真正模仿智能生活之前,我們似乎仍需要重大突破。正如約翰·麥卡錫(John McCarthy)在1977年所指出的那樣,創建類似人類的AI計算機將需要「概念上的突破」,因為「您想要的是愛因斯坦的1.7和曼哈頓計劃的0.3,而您首先要的是愛因斯坦。我相信它將需要5到500年」 。四十年後,他的發言現在似乎同樣適用。

圖6:映射齧齒動物大腦的神經元

但是,研究人員正在繼續開拓可能導致此類突破的道路。例如,由於人工神經網絡和強化學習系統的靈感來自於神經科學,因此一些學者認為,新的概念性見解可能需要將生物學,數學和計算機科學相結合來進行多學科研究。實際上,MICRoNS(來自皮質網絡的機器智能)項目是首次嘗試繪製齧齒動物大腦的圖,該大腦具有大約100,000個神經元和大約10億個突觸。美國政府(通過IARPA)已資助了這一億美元的研究計劃,哈佛大學,普林斯頓大學,貝勒醫學院和艾倫人工智慧研究所的神經科學家和計算機科學家正在合作以使其成功。MICrONS的計算目標包括學習執行複雜信息處理任務的能力,例如單次學習,無監督聚類和場景解析,最終目標是獲得類似於人的熟練程度。如果成功,該項目可能會為下一代AI系統創建基礎塊。

MICRoNS(來自皮質網絡的機器智能)項目是首次嘗試繪製齧齒動物大腦的圖,該大腦具有大約100,000個神經元和大約十億個突觸。如果成功,該項目可能會為下一代AI系統創建基礎塊。

更多精彩資訊和優質內容,可前往:大數據時代,所有的數據人都在高薪奔跑,您還在等什麼?

也可進入我們的CDA小程序,解鎖更多內容,還有免費試聽課程,千萬不能錯過喲!





文章標籤: