今日 Paper | 蚊子叫聲數據集;提高語音識別準確率;對偶注意力推薦系統等

ai科技評論 發佈 2020-01-17T08:47:57+00:00

為了幫助各位學術青年更好地學習前沿研究成果和技術,AI科技評論推出【今日Paper】欄目, 每天都為你精選關於人工智慧的前沿學術論文供你學習參考。

為了幫助各位學術青年更好地學習前沿研究成果和技術,AI科技評論推出【今日 Paper】欄目, 每天都為你精選關於人工智慧的前沿學術論文供你學習參考。以下是今日的精選內容——

目錄

  • 提高有噪聲情況下的語音識別準確率——而且用常見工具就可以

  • 基於對偶圖注意力網絡多方面社交影響的推薦系統
  • 想研究蚊子、阻止瘧疾,你需要一個蚊子叫聲數據集
  • 用於類遞增目標檢測的交叉數據集訓練
  • 卷積均值:一種簡單的用於照度估計的卷積神經網絡

提高有噪聲情況下的語音識別準確率——而且用常見工具就可以

論文名稱:Improved Robust ASR for Social Robots in Public Spaces

作者:Charles Jankowski /Vishwas Mruthyunjaya /Ruixi Lin

發表時間:2020/1/14

論文連結:https://paper.yanxishe.com/review/8973

推薦原因:

帶有社交功能的、仿人類外型的機器人如今越來越多出現在酒店、銀行、展廳等場合,大家也很喜歡和它們聊天。不過,這種公共、開放場景中的自動語音識別(ASR)仍然是有一定難度的,尤其是環境噪音。現有的ASR模型通常在噪音較小、說話人聲音信噪比較高的情況下有不錯的表現,但一旦噪音增大,模型的表現就會有顯著下降。

這篇論文重點針對的就是有噪聲的環境下的ASR。作者們在AiShell-1中文語音數據集上進行了實驗,不僅在噪聲較高的情況下獲得了新的最好成績,同時也表明了用很容易找到的開源的工具包+幾百個小時的訓練數據就可以獲得相對高的準確率。這個結果對其他的開發者、初學者也很有借鑑意義。

基於對偶圖注意力網絡多方面社交影響的推薦系統

論文名稱:Dual Graph Attention Networks for Deep Latent Representation of Multifaceted Social Effects in Recommender Systems

作者:Wu Qitian /Zhang Hengrui /Gao Xiaofeng /He Peng /Weng Paul /Gao Han /Chen Guihai

發表時間:2019/3/25

論文連結:https://paper.yanxishe.com/review/8984

推薦原因:

圖神經網絡已經取得了巨大的成功現在很多領域得到了應用。作為與圖最相關的推薦,很多工作也嘗試引入GNN來更好的學習節點表示。本文算是比較早的引入GNN來進行推薦的論文,發表在WWW2019上。作者探索了社交影響中在user-item二部圖上影響,總共定義了4種社交影響,在通過GNN學習到表示之後,作者利用了強化學習技術來實現動態融合。實驗結果驗證了本文算法的有效性。

想研究蚊子、阻止瘧疾,你需要一個蚊子叫聲數據集

論文名稱:HumBug Zooniverse: a crowd-sourced acoustic mosquito dataset

作者:Ivan Kiskin /Adam D. Cobb /Lawrence Wang /Stephen Roberts

發表時間:2020/1/14

論文連結:https://paper.yanxishe.com/review/8954

推薦原因:

深度學習的應用越來越廣,尤其是研究生物的人開始用上深度學習之後,我們就開始看到一些好笑的、出人意料的研究和數據集。

前不久四川瀕危野生動物保護國家重點實驗室 - 成都大熊貓繁育研究基地剛剛發布了一個大熊貓聲音的數據集,今天我們又看到了一個蚊子聲音的數據集。沒錯,就是那個會叮人、會傳播疾病的蚊子的數據集。

這些來自牛津大學的研究人員的收集了超過19萬段2秒長的蚊子錄音並進行了標註,其中大約有10%的數據樣本對應了蚊子的某種行為。他們希望這個數據集可以幫助更好地研究蚊子的分布和行為,他們也在論文中提供了用CNN進行分類的樣例。

這個論文還是 2019 NeurIPS ML4D workshop 的最佳論文獎得主。ML4D workshop 的主旨就是利用機器學習技術幫助發展中國家,這篇論文研究的蚊子正是發展中國家中尚未完全得到控制的瘧疾的重要傳染途徑,和workshop的目標非常吻合,也有開拓和啟發意義,得到這個最佳論文獎可謂恰如其分。

用於類遞增目標檢測的交叉數據集訓練

論文名稱:Cross-dataset Training for Class Increasing Object Detection

作者:Yao Yongqiang /Wang Yan /Guo Yu /Lin Jiaojiao /Qin Hongwei /Yan Junjie

發表時間:2020/1/14

論文連結:https://paper.yanxishe.com/review/8985

推薦原因:

這篇論文考慮的是跨數據集訓練的目標分類任務。

給定不同的數據集,跨數據集訓練的目標是檢測不同類別的並集,而不需要為所有數據集標記所有類別。通過這種方式,可以利用現有的數據集來訓練模型,然後應用於合併之後的數據集,並且避免了在新數據集上進行標記。這篇論文在PASCAL VOC、 COCO、 WIDER FACE和WIDER Pedestrian這些數據集上實驗了單數據集和跨數據集這兩種訓練模式。實驗結果表明與獨立訓練相比,這篇論文提出的跨數據集訓練框架可以同時在這些數據集上實現類似的性能表現。

卷積均值:一種簡單的用於照度估計的卷積神經網絡

論文名稱:Convolutional Mean: A Simple Convolutional Neural Network for Illuminant Estimation

作者:Gong Han

發表時間:2020/1/14

論文連結:https://paper.yanxishe.com/review/8986

推薦原因:

這篇論文提出了一種名為卷積均值的用於照度估計的卷積神經網絡。

這種卷積均值方法只要求一個包含大約1100參數量的小網絡模型,以及一個48x32的縮略輸入圖。該方法在沒有優化的Python實現中處理速度是1毫秒1張圖片,並且在保持相同準確率的前提下,遠遠快於當前的其他方案。在兩個公共數據集上的實驗也表明了這種方法在多個度量上的準確性可與當前的最優算法相媲美。

為了更好地服務廣大 AI 青年,AI 研習社正式推出全新「論文」版塊,希望以論文作為聚合 AI 學生青年的「興趣點」,通過論文整理推薦、點評解讀、代碼復現。致力成為國內外前沿研究成果學習討論和發表的聚集地,也讓優秀科研得到更為廣泛的傳播和認可。我們希望熱愛學術的你,可以加入我們的論文作者團隊。入論文作者團隊你可以獲得 1.署著你名字的文章,將你打造成最耀眼的學術明星 2.豐厚的稿酬 3.AI 名企內推、大會門票福利、獨家周邊紀念品等等等。加入論文作者團隊你需要: 1.將你喜歡的論文推薦給廣大的研習社社友 2.撰寫論文解讀如果你已經準備好加入 AI 研習社的論文兼職作者團隊,可以添加運營小姐姐的微,備註「論文兼職作者」

關鍵字: