9年網際網路史:我抓取了 14000 多篇科技媒體文章後有這幾點發現

人人都是產品經理 發佈 2020-01-19T13:55:23+00:00

在這9 年裡,風口變了又變,我們從 LBS、SNS,聊到社會化、UGC,再到 O2O,到人工智慧等等。2011 年文章數最少,只有 161 篇,2012 年 759 篇,其他年份都在1500-2000 篇。

本文抓取了極客公園 2011-2019 的全部文章並統計了詞頻,來看看有哪些新奇的發現~

微信之父張小龍早年曾有一條「飯否」,說自己作為產品經理不知道當時的一個熱詞「SoLoMo」(由「Social」(社交的)、「Local」(本地的)、「Mobile」(移動的)三個單詞的開頭字母組成,即「社交本地移動」)。這類概念只火了一時,我本想著看看網際網路史上還有哪些類似的「尬詞」。

於是寫了一個 Python 爬蟲,抓取了極客公園 2011-2019 的全部文章並統計了詞頻。不過尬詞沒找到幾個,倒發現了一些有趣的結論,我們一起來看看吧!(這篇盤點文章原本想在元旦前發的,至於為什麼現在發,不說了,說多了都是淚,誰寫爬蟲誰知道……)

01 網際網路概念變了又變唯有兩件事聊了 9 年

隨著技術的發展、需求的變化,網際網路領域火了一個又一個概念。在這 9 年裡,風口變了又變,我們從 LBS、SNS,聊到社會化、UGC,再到 O2O,到人工智慧等等。

但是有兩件事,這 9 年來一直在聊,猜猜是哪兩個?

那就是「個性化」「共享」

(我首先每年都取了排序前 1000 的高頻詞彙。再從眾多詞彙中區分了概念技術、領域、產品公司人物、國家城市、需求人群 5 個類別。上圖是「概念技術」,包含了概念、新技術。從圖可見,「共享」每年都有,「個性化」除了 2018 年外,每年都有。)

「個性化」這個概念上承 「UGC」,下接「大數據」。早年我們說網際網路經歷了 Web1.0 門戶到 Web2.0 社區再到 Web3.0 的個性化。初期的「個性化」,在像微博、優酷這樣的產品崛起後,意味著用戶自製內容的豐富。到後期,是大數據技術起來後的個性化推薦等,以今日頭條為代表。

翻看歷年文章,發現「個性化」不斷深入各行業,從早期的信息個性化推薦,到個性化導購、個性化教育、個性化健康管理等等。個性化幾乎是新行業、領域創造產品的必經之路。

關於「共享」,早期聊的類似分享:和朋友共享內容。到後來是數據共享(網盤、雲筆記等),再到以 Airbnb、Uber 為代表的「共享經濟」。

所以你要問網際網路的本質是什麼,對用戶需求的「個性化」理解,和對信息、資源的「共享」大概算的上是。

02 社交少了,更多沉迷遊戲和買買買

(這塊是「領域」詞彙,我選擇了圖中這些。)

看上圖的「領域」詞彙,2014 年以前,「社交」一直是第一。14 年開始,「遊戲」穩居第一。就像這年年底一篇文章總結的一樣:

2014 年對於遊戲領域是不平凡的一年:次時代主機進入了爆發期,大量遊戲登上 PS 4 以及 Xbox One 平台;電子競技以及與之息息相關的遊戲直播也獲得了前所未有的關注和增長;更重要的是,移動遊戲變的越來越火熱。

——2014/12/15 《爐石傳說與紀念碑谷:移動遊戲兩種力量的碰撞》

這一年大火的遊戲,看看你玩了幾個:

紀念碑谷:

爐石傳說:

Flappy Bird:

2048:

再說「電商」,它從 2014 年起,排序上升。2014 這一年,阿里巴巴上市。2013-2014 年,O2O 是熱門,出了一批 O2O 的電商,如天天果園、泰笛洗滌(上門洗滌)等等。跨境電商也很火熱,不少文章寫了洋碼頭、蜜淘等等。

總結來說,這 9 年來,我們談社交少了,談遊戲和買買買更多了。

03 喬幫主遠去,馬斯克接缽

(產品公司人物)

這個模塊包含網際網路產品、公司和人物。數據沒有截全,人物部分是這樣的(每年按詞頻排序):

  • 2011:賈伯斯
  • 2012:賈伯斯
  • 2013:賈伯斯、小川
  • 2014:賈伯斯、雷軍、張小龍、馬斯克
  • 2015:賈伯斯
  • 2016:馬斯克、賈伯斯
  • 2017:馬斯克
  • 2018:馬斯克、李斌
  • 2019:馬斯克

史蒂夫•賈伯斯一直是網際網路人的信仰。我們總覺得他的影響無處不在。而單從這份詞頻來看,2017 年以後,喬幫主的影響減弱了,而馬斯克頻繁上榜。(數據中還出現張鵬,他是極客公園創始人,有不少他採訪別人的文章,對談形式,所以出現比較多。)

04 2013 年起,更關心孩子和女性

(這塊是「需求人群」。特地留了創業相關詞彙,原本想看看創業環境的變化,但沒有明顯體現。)

在這一分類中,2013 年起「小孩」、「兒童」上榜。「女性」在 2013 年和 2016 年上榜。

2013 年,發生了海南校長案。這一年 360 推出了兒童衛士手環。2014 年,有更多的兒童智能硬體相關的報導,例如講故事的兒童睡衣、增強現實玩具。還有針對新手爸媽的產品,例如智能配奶機。等等。

女性這邊,2013 年,美圖公司出了美拍。女性經期應用「大姨嗎」火了。2016 年,美圖上市了。婚禮紀宣布完成 B+ 輪千萬元融資。談性說愛的 Yummy 獲天使輪融資。

05 2014-2015 年起,熱鬧的上海、印度

(國家和城市)

關於國家和城市的高頻詞彙里,中國、美國、日本、北京幾乎一直都有。其他持續時間比較久的是 2014 年開始上榜的上海和 2015 年開始上榜的印度。

上海這個城市,成為高頻詞彙,其實不一定和網際網路相關。作為國際化大都市,會有重大事件發生在這裡,可能會被選為產品發布會的地點,或是作為分公司的城市被提及。

不過 2014 年,上海被提及,多數和網際網路相關。O2O 那一波,出了一批還不錯的。極客公園報導過泰笛洗滌、一人食、天天果園、洋碼頭等等。

2015 年的印度,發生了什麼呢?

這一年,全球網際網路出現了印度「淘金熱」,就像一篇文章說的:

近年來,印度網際網路市場正在成為全球很多科技公司選擇國際化時都會爭搶的熱土。……作為南亞網際網路市場的排頭兵,印度的發展也是有目共睹的。2014 年,印度與網際網路有關的創業公司共產生了 50億美元的相關投資,這一數字較 2013 年增長了近三倍;而在 2015 年,印度的創業公司總數預計將會達到 12,000。

此外,根據 eMarketer 的報告顯示,印度的網際網路人口即將超過 4 億,而這其中的大部分是移動網際網路用戶。

——2015/05/08 《奔赴印度淘金之前,你必須知道的幾個事實》

而這波淘金熱最主要是智慧型手機。國內外的手機廠商紛紛進軍印度市場。谷歌重啟針對印度的廉價智慧型手機計劃 — Android One。聯想開始在印度生產智慧型手機。華為獲得在印度的生產牌照。雷軍在印度發布小米新品,喊出了那句「Are you OK?」的名場面。

這就是我得到的幾點發現啦。最後,給大家拜個早年,祝大家新年少掉頭髮!!

一些說明:

  1. 數據是怎麼取的:先在首頁把所有連結取下來,根據年份寫入不同的文件夾;再挨個打開文件夾里的連結,抓取正文,寫入文件;最後用 jieba 統計詞頻。取每年前 1000 詞彙進 excel,選出特定領域詞彙標記顏色,分類比較。
  2. 2011 年文章數最少,只有 161 篇,2012 年 759 篇,其他年份都在1500-2000 篇。因此 2011-2012 詞頻數偏少。
  3. 這份數據只統計了極客公園歷年文章。如果看網際網路史,加上 36kr、虎嗅等會更好(它們的文章數也更多),但我 Python 能力有限,沒有取到後者的完整數據。
  4. 有些詞彙你覺得是熱詞但沒有,有可能極客公園沒有或不夠高頻,也有可能未被我選中和標記。

附部分代碼截圖:

本文由 @Tara 原創發布於人人都是產品經理,未經許可,禁止轉載。

題圖來自 Unsplash,基於CC0協議

關鍵字: