達摩院 2020 預測:感知智能的「天花板」和認知智能的「野望」

csdn 發佈 2020-01-06T05:43:23+00:00

作者 | Just出品 | AI科技大本營(ID:rgznai100)「感知智能與認知智能是相輔相成的關係。認知智能需要感知系統來進行信號處理和概念識別,而感知系統也需要認知系統的反饋來決定如何進行更有效的提取和識別。

作者 | Just出品 | AI科技大本營(ID:rgznai100)

「感知智能與認知智能是相輔相成的關係。認知智能需要感知系統來進行信號處理和概念識別,而感知系統也需要認知系統的反饋來決定如何進行更有效的提取和識別。」

1月2日,阿里巴巴達摩院發布2020十大科技趨勢(https://damo.alibaba.com/events/57),其中趨勢預測的第一彈即為「人工智慧從感知智能向認知智能演進」。AI發展為什麼會有這種演進?從技術層面,AI科技大本營(ID:Rgznai100)採訪了達摩院資深算法專家楊紅霞,就感知智能向認知智能的演進和變革進行更深入解讀。

感知智能的「天花板」

如你所知,目前人工智慧在圖像、音頻、文本的識別等感知操作方面取得了巨大成功,太多企業的新聞稿中傳遞著AI在諸多特定任務上已經達到或超越了人類水準的消息。很大程度上,感知智能技術的諸多成果歸因於強大的算力和大量的標註數據。

楊紅霞指出,AI目前對於單一任務上取得的成績,如圖像識別、機器翻譯等均是通過海量樣本的堆砌與合適深度學習模型架構得到,這與人類學習的過程非常不一樣:目前感知智能技術的方式是learn from scratch(從無到有),而人類學習是有體系的、多模態、多任務的continuous learning(連續學習)。

她認為,感知智能目前還只是任務驅動,做到從底層信號到最終結果的條件反射,而不是經過顯式的、高維的、概念的識別和組合。但這種概念識別和組合的能力才是人類能處理各種不同任務或者新任務的基礎。

而單一任務模型的訓練消耗已經非常龐大,「BERT模型需要30億詞量的訓練數據,訓練一次產生相當於1400磅的二氧化碳,這與一個人來回坐飛機穿越美洲的排放量相當。」

這樣的技術路線難以為繼。她稱,想要再通過更大數據量和更大模型來繼續這樣的模型線路可能已經很難取得真正意義上的突破。

更重要的是,感知智能本身存在的技術問題並沒有真正得到解決。「我們可以輕易攻擊一個模型從而產生極大的安全隱患,換到另一個沒有樣本覆蓋的場景模型就像傻瓜一樣,這都對人工智慧模型和機制層面的改進都提出了迫切的要求。」

楊紅霞總結了三點感知智能技術存在的缺陷,包括但不限於:

  • 模型魯棒性差。對於樣本分布敏感,遷移到少樣本新任務上的能力差,模型極易受到攻擊;

  • 模型可解釋性差,對於可靠性要求高的任務很難勝任;

  • 缺乏積累知識的能力,也沒能和人類已有的知識體系進行很好的關聯,缺乏可靠的推理方法。

總之,無論是在具備智能理解能力還是安全性方面,以感知智能技術為主的AI與人類智能相去甚遠

為了突破這些感知智能局限性,AI需要向認知智能演進。她給出了研究方向,「更多的去研究如何綁定、發現、積累可理解的可分解性的概念以及概念間的關係,融合基於高緯度概念的可靠的推理方法,從而提高模型的穩定性與可靠性,完成可靠的邏輯推理。」

達摩院指出,相較於感知智能這一人工智慧1.0,人工智慧2.0將更多基於數據,能夠自動將數據變成知識,從非結構化的數據直接變成有結構化的知識,做到真正意義上的認知智能。在探索如何在保持大數據智能優勢的同時下,賦予機器常識和因果邏輯推理能力,實現認知智能成為了當下人工智慧研究的核心。

認知智能的「野望」

去年開始,認知智能開始被AI界擺在下一步AI技術變革的檯面上進行廣泛討論。

認知智能可以幫助機器跨越模態理解數據,學習到最接近人腦認知的「一般表達」,獲得類似於人腦的多模感知能力,有望帶來顛覆性創新的產業價值。達摩院稱,認知智能的出現使得AI系統主動了解事物發展的背後規律和因果關係、而不再只是簡單的統計擬合,進一步推動下一代具有自主意識的AI系統。

一些學界的研究者已經率先出發,圖靈獎得主Yoshua Bengio頻繁強調可解釋因果關係對深度學習的重要性。楊紅霞也特意提及Bengio在近期的 NeurIPS 2019 上題為《From System 1 Deep Learning To System 2 Deep Learning》的報告,後者也指出認知智能是接下來人工智慧的重點突破方向。

Bengio報告的核心內容提到,人的認知系統包含兩個子系統(這是認知理論中的共識觀點):System1直覺系統,主要負責快速、無意識、非語言的認知,這是目前深度學習主要做的事情;System2是邏輯分析系統,是有意識的、帶邏輯、規劃、推理以及可以語言表達的系統,這是未來深度學習需要著重考慮的。當然Bengio也提到計算機作為Agent實現AI,需要從計算機角度考慮,比如更好的模型和知識搜索等。

Bengio認為,對於計算機來說,最關鍵的是處理數據分布中的變化。對於System 2來說,基本的要素包括:注意力和意識。注意力(attention)實際在目前的深度學習模型中已經有大量的實現和探討,比如GAT(圖注意力機制)等;意識這部分則比較難,其實意識最關鍵的是定義到怎樣的邊界。在他看來,意識先驗可以使用稀疏因子圖模型來實現,這是一個思路,實現了因果關係。從整體的理論框架方面可以考慮元學習(Meta-learning)、局部修正假設(localized change hypothesis)、因果發現(causal discovery),最後架構方面可以考慮如何學習不同對象的操作。

這是認知智能技術的其中一條技術研究路徑,楊紅霞則概括了四大類將有所突破的關鍵方向。

a. 推理系統的建設

  • 基於(神經)符號系統的關係推理

  • 感知系統和認知系統協同推理 System 1&2

b. 與人類知識融合

  • 融合結構化知識圖譜的推理模型

c. 從人類學習方式入手

  • Continuous Learning(連續學習)

d. 從認知發展的根源入手

  • Emergent language/communication/tool use

她稱,目前比較親民的應用主要來自於b(與人類知識融合),在各類問答系統中,都會融合外部知識圖譜來完善。

當然,既然阿里將認知智能放在第一大趨勢預測的位置,那麼他們在其研究和應用上有何探索或進展?楊紅霞提到,基於認知學Dual Process Theory(雙重加工理論)將認知推理任務轉化為System 1&2之間的疊代式交互,System 1利用感知系統進行語義解析形成一張概念圖並作為類似人腦中的Working Memory,而System 2可以充分考慮Working Memory中的關係網絡從而進行精細推理。多跳閱讀理解任務中,他們利用這個系統取得了世界第一的成績。

他們也在考慮如何發現Compositional的高級概念,這與人類的binding problem(捆綁問題)息息相關。他們首次在電商場景下研究怎樣對用戶和商品進行解離化表征,從而能夠顯式化的表示宏觀的興趣意圖和微觀的電商認知概念,從而利用這些顯式的概念進行可控的搜索和推薦。

另外,阿里研究人員也結合電商知識圖譜做了大量的工作,如結合圖譜進行更好的主題標題、推薦理由生成,提升了用戶的購物體驗。

達摩院在趨勢預測中還指出,認知智能將結合人腦的推理過程,進一步解決複雜的閱讀理解問題和少樣本的知識圖譜推理問題,協同結構化的推理過程和非結構化的語義理解。認知智能也需要解決多模態預訓練問題,幫助機器獲得多模感知能力,賦能海量任務。其中,大規模圖神經網絡也被認為是認知智能計算的強有力的推理方法。

儘管未來人工智慧熱潮能否進一步打開天花板,形成更大的產業規模,認知智能被寄予厚望,不過在需要外部知識、邏輯推理或者領域遷移的認知智能領域,顯然還處於初級探索階段。

達摩院預計,認知智能將從認知心理學、腦科學及人類社會歷史中汲取靈感,並結合擴領域知識圖譜、因果推理、持續學習等技術,建立穩定獲取和表達知識的有效機制,讓知識能夠被機器理解和運用,實現從感知智能到認知智能的關鍵突破。

關鍵字: