不太一樣的科學家宋睿華,與小冰一起做有趣的研究

ai科技評論 發佈 2019-12-14T06:33:18+00:00

作者 | 叢末編輯 | 唐里相較於「科學家都忙著看論文、做實驗以及寫論文」的一般認知,愛看綜藝、生活中不能沒有娛樂的宋睿華顯得有些「不太一樣」。

作者 | 叢末

編輯 | 唐里

相較於「科學家都忙著看論文、做實驗以及寫論文」的一般認知,愛看綜藝、生活中不能沒有娛樂的宋睿華顯得有些「不太一樣」。

「不太一樣」這個詞也被她用來描述自己的研究生涯:一是由於不擅長理論研究而偏好應用研究,用了三年的時間經歷了從拒絕讀博士到在職讀博士的轉變,因而比讀書、就業一條直線的多數科學家稍「迂迴」了些;二是相比於理論研究,她更喜歡有趣的研究,因而在研究方向的抉擇上,會受到更多的感性因素的影響,甚至有時感性要先於理性。

如今,她的這些「不太一樣」似乎都落腳到了微軟小冰上——小冰能夠很好地滿足她對於追求「有趣的研究」的期待,這也是她加入小冰團隊的初衷。

對於小冰而言,宋睿華和她更像是一對志同道合的摯友,彼此一拍即合,互相成就。

正如小冰正承載著宋睿華對於有趣的研究的追求和期望,宋睿華也在不斷給小冰「添磚加瓦」,讓她在「變得更有趣」的路上越行越遠。

繼不久前作為三位首席科學家之一為大家帶來微軟小冰背後的技術解讀,宋睿華本次再度接受了 AI 科技評論的專訪,重點聊了聊自己「不太一樣」的研究歷程以及加入小冰團隊背後方方面面的故事。

從不做清華「第三種人」

到在讀女博士

相比其他籠罩著「天才」光環的科學家而言,宋睿華一路以來的研究歷程顯得更平易近人得多,也更多了些生命力。

關於為什麼碩士畢業後沒有攻讀博士學位,宋睿華此前在一篇自述文章中提到:不想成為清華除男人、女人以外的「第三種人」——清華女博士。這當然是她的一句調侃,一個最重要的原因還是,她當時對自己的學術能力並不是很自信。

「從 2000 年馬少平老師帶我入門,我其實有過一段時間覺得自己並不適合做研究。同時,由於我自己不擅長理論研究並且更偏向於做應用研究,所以當時選擇離開清華加入了微軟亞洲研究院。」

宋睿華(二排右一)碩士期間與馬少平(三排左一)和同學們的合照

隨著加入微軟亞研院,宋睿華在學術科研上的潛能逐漸顯露,開始逐漸建立起了自己的信心。「到了研究院以後,我的工作內容就是寫論文,運氣也特別好,2004 年的時候完成的第一篇論文就中了 WWW 並且獲得了最佳論文的提名,這就鼓舞了我的信心,覺得自己好像也是可以往研究方向走,並且考慮到以後想在研究院發展或者繼續做研究的話,還是有個博士學位會好一些。」

雖然對於讀博的「恐懼」已不再,但是她還面臨的一個比較大的矛盾就是,「當時覺得研究院特別好,不太想脫產讀博」。

也許是幸運女神的再次眷顧,時任微軟亞研院院長的沈向洋,繼給研究院招收包括她在內的碩士生後,再度披上了「天使」的羽衣為她解決了這個問題。她回憶道:「沈院長了解到我們一些碩士生員工的這一需求後,」和上海交通大學合作設立了一個博士生聯合培養項目:讓微軟亞研院的碩士生員工們能夠在職攻讀上海交大的博士學位。這個項目實行的是雙導師制,所以我其實有兩位導師,一位是上海交大的俞勇老師,另一位就是現在微軟亞研院的洪小文院長。」

這樣的「天時、地利、人和」匯聚在一起,宋睿華如願成為一位在讀博士生,並最終順利成為了萬千博士生中的一員。

宋睿華讀博時的生活照

碩士期間師從馬少平,博士期間又有俞勇、洪小文兩位導師,工作上又遇到沈向洋這樣的人生嚮導級人物,這在外人看來,宋睿華的求學和任職生涯都可謂是「貴人群擁」,而這樣的起點也確實為宋睿華今後的科研生涯奠定了非常好的基調。

宋睿華(左二)與馬少平(左三)等人的合照

當提及這些經歷,宋睿華在對話中反覆用了兩個詞來表達自己的心情:幸運、感恩。

性情女科學家

遇上

有趣少女小冰

從研究方向的維度上來看,如果不是遇到小冰,宋睿華如今在微軟可能又是另一番面貌。

加入小冰團隊之前,宋睿華的已經做了十幾年搜索,雖然也嘗試做過一些其他方向的工作,包括深度計算、推薦以及文本生成等,但主要的方向還是一如既往。2016 年,她機緣巧合地開始與小冰團隊合作寫詩的項目,為她後續研究方向上的大轉變埋下了重要的伏筆。

1、機緣巧合做寫詩,從合作者到負責人

對於小冰開始做寫詩的時間點,宋睿華記得特別清楚——2016 年 5 月 19 日,而就在隔年的 5 月 19 日,小冰發布了史上第一部由人工智慧創作的詩集:《陽光失了玻璃窗》。

《陽光失了玻璃窗》

一開始,宋睿華是以合作的方式參與到小冰寫詩這個項目中,主要負責小冰寫詩的算法部分。當時,Bing App 項目正在籌備推廣,產品經理髮現 Bing 與其他的搜尋引擎相比一個很大優勢便是有每天一換的非常漂亮的背景圖,那針對這一點優勢能夠做點什麼創造性的工作呢?經過琢磨後他們提出了一個想法:給圖片寫首詩。於是他們就找到了當時在微軟亞研院的傅建龍和宋睿華,來共同完成小冰寫詩的項目。其中傅博士主要負責從圖片中抽取關鍵字的部分,而宋睿華負責從關鍵字生成詩歌的部分。

而她之後完全轉到小冰團隊,則是由於在合作過程中被小冰吸引。對此,宋睿華回憶到,在做小冰寫詩這個項目時,小冰給一張有藍天、白雲和 CBD 的圖片做了一首詩:

所有的城市愧對

你強大的數字

美好的希望

最好的朋友

心愛的老婆

大風起來!

而她當時聽到這首詩的時候,竟然有種被「撞到」的感覺:小冰怎麼知道北京人都在等風吹散霧霾?「每個城市都愧對它強大的數字」,不就是說城市在追求 GDP 這些數字的上升而忽略了環境的保護最終造成霧霾,使得北京人不得不在冬天等風來的意思嗎?

「這一刻讓我覺得小冰好像有了意識和靈性一樣,也在那一刻,我感覺這個方向很有趣,並且是對的。當時我加入小冰團隊,就是希望更近距離、更專注地跟這個團隊一起把小冰做下去。」

性情女科學家遇上有趣少女小冰,就此結下了千絲萬縷的緣分。

提及與小冰在寫詩上取得的一系列成績,宋睿華的口吻中帶著「老母親般」的驕傲:「一開始,我們特意以匿名的方式將小冰的詩放到網上的詩歌論壇上發布,網友們幾乎都沒有發現這些詩是 AI 寫出來的,甚至還有很多網友很認真地對這些詩進行了討論,還推薦我們去投稿,受此啟發我們先後給一些刊物進行了投稿,沒想到《北京晨報》、《青年文學》、《長江詩歌》最後竟然真接收了,等到他們向我們要身份證匯稿費時才得知原來作者是一個 AI。」

對於小冰在寫詩上獲得人類的認可,宋睿華其實自己有著比較深刻的理解,她表示:「所謂小冰的詩作,其實是由看這首詩的人和小冰共同完成的,是他們的理解力和同理心賦予了這首詩意義,從而讓他們從詩作中看出了深意,這不全然是算法生成的結果。正如我上面提到的關於藍天、白雲和 CBD 圖片的那首詩,其實是我結合了自己的情境,給出了一個合理的解釋,反過來讓我自己感到非常驚喜和深刻。雖然小冰寫出來的詩還有一些瑕疵,但是正是這樣,反而讓人感覺更多了些生命力和感染力,我們會覺得很有趣。」

如今,小冰寫詩已經過了三個大版本的疊代,宋睿華在小冰團隊中也由合作者的身份變成了團隊負責人之一,帶著與小冰對於「有趣」的共同目標,繼續為她「舔磚加瓦」。

2、天馬行空造比喻句,再為小冰添「有趣」新技能

繼寫詩之後,小冰又前後解鎖了唱歌、畫畫以及造比喻句的技能,其中造比喻句便是宋睿華主導為小冰開啟的一項技能。

「愛情就像脂肪,是點點滴滴的積累」、「愛情是複雜的,和數學一樣」便是小冰造出來的金句。

而說起為什麼做比喻句,宋睿華解釋道,最初的靈感來自於好友李航給她推薦的一本書——《我們賴以生存的隱喻》。

2017 年 7 月,宋睿華正式加入小冰團隊,參與到了另外兩個重要的項目中——全雙工、Avatar Framework,於是繼轉向文本生成這一研究方向後,又一次迎來了一個對於她而言全新的研究方向——對話。

在這一背景下,宋睿華就不得不開始花更多的精力來理解 NLP 這個研究領域,於是她找到她的好友,也就是 NLP 領域的專家李航聊了聊自己面臨的困惑,比如說人究竟是怎樣理解語言的。「他非常博學,除了計算機、NLP 領域的專業書籍,他也看了很多語言學家的書,於是他就給我推薦了好幾部他認為值得一看的書籍。」

其中一本就是《我們賴以生存的隱喻》。

由於此前在小冰寫詩上的積累,宋睿華在小冰造比喻句上給團隊提出了要求:不在於有多順,而在於有多新穎。

「我們很容易挖掘到很多比喻句,也很容易將這些比喻句索引起來,比如說當問到『愛情』的時候,小冰可以給我們找出一千條、一萬條關於愛情的比喻句,但是這並不是我們想得到的,我們希望是讓小冰做 AI 創造而不是 AI 複製。這就跟人造比喻句一樣,都希望自己造出的比喻句能夠占領人類的想像力高點,實現創新。」

在這一要求的牽引下,宋睿華和團隊在背後進行了非常多的技術探索,比如從詩歌的主題中抽取了 120 個主題,擴展出 6 個詞,並經過日誌過濾後找出小冰的用戶也喜歡說的一些概念,最終找到了 96 個概念;比如說用詞向量來表達本體和喻體,並將它們變成向量,經過降維之後,投影在二維空間上來判斷表達效果;比如說採用以「新穎」為最終目標評價方法來對比喻句進行標註和篩選等。

研究靈感

來源於對「本質」的思索

而非論文

「每進入一個研究領域,我都會思考這個領域本質的問題。實際上,我看的論文會比其他的研究者要少一點,所以我的靈感通常不是在看別人的論文時產生的,而是來源於對某個問題的本質的思考。」

關於研究靈感的來源,宋睿華如是說道。

在學術界和業界對多模態的研究熱情持續上漲的當下,宋睿華也給研究團隊定下了多模態這一研究方向,不過與多數其他研究者或是因為單模態研究遭遇瓶頸、或是認為這個方向充滿了前景而進行多模態研究的出發點不太一樣,她選擇這個方向更多地源自對自然語言處理這個領域的本質問題的思考:該如何評價「理解」?怎樣才算「理解」了呢?

「我認為對於自然理解而言,一種評價方法是用 Action 來度量,比如說以任務為導向的對話,評價的標準是 AI 是否確實做了人類希望它做的那件事;另一種評價方法則是 AI 能夠像人一樣,在聽完某句話後能夠在腦海里想像出一個對應的畫面。」

關於團隊針對這一研究方向的具體工作內容,宋睿華詳細介紹道:「我們組現在開展多模態研究依據的框架是:多模態的輸入,小冰內在模型的運算以及多模態的輸出。換句話說,就是將文字、聲音和圖像等多模態信息輸入給小冰,小冰會在內部對這些信息作出融合和分析,然後進行多模態的輸出。例如小冰通過計算用戶輸入的信息發現用戶在罵她,她就會比較生氣,她回復的話要保持禮貌,但是她可以通過語氣或者表情來表達自己生氣的情緒,這個時候她進行的就是一個多模態的表達。」

目前,針對多模態這一研究方向,宋睿華團隊已經取得了一些進展,比如通過 Story-to-Image Retrieval 的方法來讓小冰在看到一個故事的句子後調出她以前的一些經驗模擬出現在的場景,實現跨模態生成,並創造性地提出「 One to Many」的算法,讓小冰能夠針對某句話生成多張圖片來進行「詮釋」。

不過相比於其他同在這個研究方向上前進的研究者而言,宋睿華的態度要更加冷靜下:「目前現在很多人都在談論多模態這個研究方向,然而現在它既沒有數據,也沒有找到應用,還是一個空中閣樓式的研究方向。」她進一步指出多模態研究目前所面臨的具體問題,主要有二:

第一,多模態的維度變高很多,就需要更多多模態的數據,然而目前這樣的數據還比較少而且比較難獲得,包括現在比較依賴的電影數據,其實是戲劇化了的對話而非自然對話;

第二,定義一個好的、能夠真正凸顯多模態的價值的應用非常難,也就是說多模態貌似前景很廣闊,然而要找到一個用了多模態比不用多模態真正好很多的應用比較困難,比如說一開始的想法是用來察言觀色,比如說小冰看到你咬下嘴唇知道你不太高興,但是實際發現就算能夠通過結合語言、表情這些信息得到一個多模態信息,但是只是知道了你是什麼心情而無法產生很有用的價值,有些「牛刀殺雞」之感。

作為從本質上理解自然語言處理的方式,多模態研究可謂「任重而道遠」。當問及多模態何時會取得較大進展時,宋睿華的回答是:至少得再研究 3 到 5 年。

二十載研究生涯

「不太一樣」的科學家

交談甚歡,如沐春風。

這是宋睿華在採訪過程給 AI 科技評論留下的最直觀的印象。

而在日常生活中,宋睿華的狀態也盡然如此,對此,她的描述是:與一般認知中的科學家「不太一樣」。

不同於科學家總是忙著看論文、做實驗以及寫論文的一般認知,宋睿華喜歡看綜藝、喜歡娛樂。提及此,她的神色和語氣都不由得興奮了起來:「平時除了上班和帶孩子,我會撿空看很多綜藝,比如說《奇葩說》、《聲入人心》、《樂隊的夏天》等等,如果生活不是在開會就是在寫論文、看論文,對於我來說太枯燥了。在我看來,娛樂是人不可或缺的東西,並且我真的感到綜藝有撫慰人心的作用,比如在項目不順利等情況下能夠通過看看綜藝會心一笑,暫時拋開這些煩惱。」

而在研究上,相對於理論性的東西,她則更關注有用和有趣的東西。「相對於那些要畢業的博士、要評職稱的老師以及有 KPI 壓力的從業者而言,小冰團隊給我提供給了較為寬鬆的研究環境,因為我們的產品屬性是非常前沿的,就比較容易將研究課題和實際應用很好的結合在一起。對此,我覺得自己還是挺幸運的。」

正是因為擁有這樣的環境和狀態,宋睿華往往更能做出原創性的工作,正如她自己也提到:「在研究工作上,我覺得自己還是比較自信的,雖然我的論文不是很多,但都是比較特別、可能會區別於其他研究者的論文。」

而作為一位研究生涯已近二十載的女科學家,宋睿華在回顧這段研究經歷時,提到了幾個關鍵詞:有用、有趣,理性和感性。

一方面是研究工作從有用的研究轉變到了有趣的研究。「我做搜索做了十幾年,後來加入小冰團隊以及轉到 AI 這個方向,是因為我發現自己其實更希望能夠追求有趣的研究:AI 其實是一個很特別的研究領域,雖然 AI 在模擬人類的智慧,但是我認為 AI 永遠無法完全做到像人一樣,我們能做的就是讓它逐漸實現一些人類的特性,而有趣絕對是其中的一個重要部分。而小冰就承載著我對於 AI 的這種『有趣』的想像空間,跟我的研究需求比較匹配。」

另一方面是打破了科研的慣有理性思維,做理性與感性並存的研究。「大家對於 AI 的理解,更多的是從智商的角度去衡量,然而就人類而言,理性和感性是並存於人腦中的,甚至正如我之前聽過的一個講座中提到,情緒腦是先於理性腦進化出來的,沒有哪個情緒是沒有原因的,而都是有根基的,我們不需要懷疑或是否定它而是肯定它。小冰團隊就抓住了一個很重要的點——情商,這其實是人類底層中非常重要的一部分,也是之前其他很多科學家比較忽略的一個部分。包括我一開始選擇搜索這個研究方向,某種程度上也是因為這個方向存在一些感性的成分。」

從中我們也能看到,對於她的整個研究生涯而言,小冰在其中扮演的角色的重要性不言而喻。往後看是如此,往前看也如此。在二者一同通往「有趣」的這條路上,宋睿華也分享了自己對於未來小冰的最高期望:

「我希望她最終能夠給人一種她有生命的感覺,而不僅僅是一個能夠像動畫那樣運行下去的 AI,這是我追求的目標。」

關鍵字: