報名即將截止!獎金豐厚,豐富的開原始碼,微軟這個比賽不得了

ai科技評論 發佈 2020-08-19T10:20:54+00:00

個性化新聞推薦可以根據用戶的個人興趣對線上新聞內容進行篩選、排序與展示,提升用戶的新聞閱讀體驗。如今,個性化新聞推薦已廣泛應用於Microsoft News等諸多在線新聞平台中。

作者 | 陳彩嫻

編輯 | 陳大鑫

如何用最短的時間鎖定自己最感興趣、最想第一時間掌握的信息?這是算法推薦對新時代新聞傳播的最大意義。

個性化新聞推薦可以根據用戶的個人興趣對線上新聞內容進行篩選、排序與展示,提升用戶的新聞閱讀體驗。如今,個性化新聞推薦已廣泛應用於Microsoft News等諸多在線新聞平台中。

隨著智能通訊技術的發展,通過線上平台傳播新聞、共享資訊已成為資訊時代的流行趨勢之一。新聞從業者在線撰寫、編輯、更新文章,用戶也習慣通過線上網上、社交媒體與各種資訊傳播APP等閱讀新聞。然而,與快速更新的海量資訊相比,每個人的時間是有限的。用戶每天一打開手機、電腦,立刻被大量紛繁複雜的新聞包圍,很難利用自己的閒暇時間快速找到自己所感興趣的內容。

因此,個性化新聞推薦成為解救用戶於信息深海中的關鍵技術,微軟「Mind新聞推薦比賽」也因此而誕生!

1 競賽簡介

「MIND新聞推薦比賽」由微軟亞洲研究院和微軟新聞產品團隊聯合舉辦,基於MIND新聞推薦數據集,目的在於進一步推動新聞推薦領域的研究,幫助開發更好的新聞推薦系統,以改善數百萬用戶未來的新聞閱讀體驗。

新聞推薦是一項極具挑戰的工作:

首先,新聞的時效性強。新聞平台每天都會發布大量新的新聞,已經發布的新聞會被最新發的內容迅速覆蓋、隨後在頁面上「消失」。這就導致有些新聞可能剛發布就被淹沒,沒有人發現,也沒有人閱讀。

其次,新聞文章的標題和正文往往都包含了豐富的內容。因此,新聞推薦技術的一大關鍵在於使用NLP技術從新聞的標題與正文中掌握並理解新聞內容在傳遞什麼信息。

此外,新聞平台上往往不會顯示用戶的文章閱讀排序。新聞推薦系統需要從用戶的瀏覽與點擊行為上掌握用戶的閱讀喜好,並對用戶的閱讀興趣進行建模。然而,對用戶的閱讀興趣進行建模是很難的,因為用戶的閱讀興趣通常比較廣泛,並隨著時間的推移而變化。

目前,許多關於新聞推薦的研究都是基於私有數據集,已有的公開數據集往往規模小或基於英語之外的其他語言。為此,微軟亞洲研究院聯合微軟新聞產品團隊在ACL 2020上發布了一個大規模英文新聞推薦數據集MIND,本次新聞推薦比賽也是基於MIND展開,參賽者可以使用高質量基準數據集自由發揮自己的奇思妙想,實現自己對新聞推薦的大膽想法!

2 賽事關注

1、獎金設置:

競賽總共設有20000美元的獎金。在結果提交結束後的7天內,組織方將從所有符合條件的參賽選手中評選1名一等獎,2名二等獎和4名三等獎。

一等獎:10,000美元

二等獎:3,000美元

三等獎:1,000美元

2、賽事進程:

報名截止時間:北京時間8月21日07:59

開發階段:7月20日至8月21日07:59

測試階段:8月21日至9月5日07:59

比賽結果公布:2020年9月11日

註:

1)報名成功後,選手可以在MIND數據集上訓練和評估新聞推薦模型。

2)開發階段:選手可以將開發集上的結果提交到Codalab平台,以獲得官方評測分數。

3)測試階段:主辦方將發布測試集,選手可以下載測試數據,並需要在截止日期之前將測試結果提交到Codalab平台。

3、參賽方式:

1、通過Codalab平台進行報名。

連結:https://competitions.codalab.org/competitions/24122

2、報名完成後,發送一封競賽註冊郵件至郵件mind@microsoft.com,郵件里寫明參賽選手的信息(包括CodaLab用戶名、真實姓名、聯繫郵箱和單位),以及對競賽官方規則的確認。

任務描述:

比賽中的任務描述如下。給定一個用戶u的新聞瀏覽歷史記錄[n1,n2,...,nP]和展示給該用戶的一組候選新聞[c1,c2,...,cM],任務目標是根據該用戶的新聞閱讀興趣,對候選新聞進行排序。排序結果將與真實的用戶點擊行為進行比較,來計算AUC,MRR和nDCG@K等多項指標來衡量新聞推薦的質量。

競賽主頁:

https://msnews.github.io/competition.html

關鍵字: