張鈸院士談第三代人工智慧發展趨勢

光明網 發佈 2020-01-19T11:57:14+00:00

近日,AI2000人工智慧全球2000位最具影響力學者榜單在清華大學發布,中國學者規模位列世界第二,但高水平學者集中的研究機構匱乏,人工智慧領域的人才隊伍亟待加強。AI2000榜單由清華-中國工程院知識智能聯合研究中心和清華大學人工智慧研究院發布。

近日,AI2000人工智慧全球2000位最具影響力學者榜單在清華大學發布,中國學者規模位列世界第二,但高水平學者集中的研究機構匱乏,人工智慧領域的人才隊伍亟待加強。

AI2000榜單由清華-中國工程院知識智能聯合研究中心和清華大學人工智慧研究院發布。AI2000人工智慧全球最具影響力學者(200名)和提名學者(1800名)分布於全球不同高校和學術機構,美國有1128人次,中國171人次,歐盟有307人次上榜。

發布會上,清華大學人工智慧研究院院長、中國科學院張鈸院士做了熱情洋溢的報告和精彩點評發言。

人工智慧研究必須國際化

基礎研究,尤其是人工智慧領域的基礎研究必須國際化,因為只有把全世界的研究人員共同團結起來、利用起來,才能夠引領基礎研究的發展。為什麼目前人工智慧領域大多由美國來引領,就是因為美國把全世界最優秀的人才利用了起來。

中國要想在基礎研究上引領世界,必須走國際化道路。今天有很多外國留學生來華求學,這是一個好事兒,但我們還可以做一定平衡調整,吸引更廣泛國家地區的優秀學生來華學習。

把數據驅動和知識驅動結合起來

人工智慧的四大基礎是:知識、數據、算法和算力,回顧歷史,這四個因素都在不斷地發揮作用。第一代人工智慧也叫符號人工智慧,比較強調知識對智能的作用,因為那時算法和算力都還沒有跟上。

進入新世紀後,深度學習把大家的目標凝聚到了數據上,這時大數據的出現,再加上很好的算法,就形成了基於概念的深度學習,再加上雲計算等手段,使以數據為基礎的連接主義模型得到了極大推廣和應用。

數據主義喊了許多口號,導致了我們今天遇到一些困難,按照大數據建起來人工智慧系統似乎不可信、不可靠、不安全、不易推廣,這都是目前用深度學習進行人工智慧研究帶來的問題,也可以說是大數據遇到的挑戰。怎麼來解決這個挑戰呢?唯一的辦法,就是重新引入知識,把數據驅動和知識驅動結合起來,達成可信安全的第三代人工智慧。

常識往往不在數據里

自然語言理解是人工智慧領域最核心的問題。不管做機器翻譯也好,做自然語言應用也好,都試圖通過分析符號序列來理解相關內容,這是第一代人工智慧所謂符號主義的核心做法。到了第二代人工智慧,又走上深度學習的道路,這條路充滿希望,但又非常危險,因為解決不了可信安全的問題。

機器翻譯現在只能翻譯不重要的東西,因為翻錯了也沒有關係,真正重要的場合還需要人力同聲翻譯。機器最大的問題,就在於它缺乏常識,根本不知道自己不知道,這是一個很大的問題。知識包含兩方面,一是我知道什麼,二是我不知道什麼。一個有學問的人,不僅僅表現在他知道的多,更表現在他清楚自己不知道的更多。那些狂妄自大的人,都是沒有學問的人,不知道自己能吃幾碗乾飯,機器翻譯也是這個問題。給機器任何句子,它都能翻,根本不懂也能瞎翻。

所以常識是必要的,簡單翻譯幾句話也需要大量嘗試積澱,「說你行,不行也行」,機器沒有常識,就很難理解這句話,人反而覺得很簡單,這就是常識的重要性。但常識庫的建立非常之難,現在沒法從數據中去建立常識庫,因為常識往往不表示在數據之中。

建立常識,必須下功夫去做,只有這個問題解決了,自然語言的理解才能達到目標。而自然語言理解,則是第三代人工智慧的終極目標,這是一個艱巨的任務。如果這個問題解決了,人工智慧的其他問題將會迎刃而解。(李釗)

關鍵字: