火了很久的GitHub項目,程式設計師代碼之外的世界

技術剛剛好 發佈 2020-01-19T16:08:16+00:00

古詩最全的中華古典文集資料庫,包含5.5 萬首唐詩、26 萬首宋詩、2.1 萬首宋詞和其他古典文集。詩人包括唐宋兩朝近 1.4 萬古詩人,和兩宋時期 1.5 千古詞人。

找古詩你有以下痛點嗎?


  1. 有時候想用一首詩來表達自己此刻心情,可是怎麼也找不到,可能不是找不到,而是沒有這麼一個平台去找。
  2. 你家小孩想背古詩,書本的古詩有不全,找到一些APP廣告有多,小孩本來小,還要看一些成年人的廣告。
  3. 喝酒了是不是想聽聽 古詩來疏通自己的心情?


身為技術開發,有著多年開發技術的本領,做技術人員是不是生活單調,每天除了吃飯上班寫代碼?還有別的嘛?想想就知道了,比如我就是一個愛古詩的人,而且還是一個愛喝啤酒的程式設計師,重慶山城程式設計師就是我。

今天我要為大家分享一份代碼,一個在GitHub上火的不行的項目,關注量一直在不停上升的項目,古詩學的好的程式設計師招人愛,古詩背的多的程式設計師可以寫出優美的句子,可以給你心愛的人寫情書了。

最全的中華古典文集資料庫,包含 5.5 萬首唐詩、26 萬首宋詩、2.1 萬首宋詞和其他古典文集。詩人包括唐宋兩朝近 1.4 萬古詩人,和兩宋時期 1.5 千古詞人。數據來源於網際網路。

為什麼要做這個倉庫? 古詩是中華民族乃至全世界的瑰寶,我們應該傳承下去,雖然有古典文集,但大多數人並沒有擁有這些書籍。從某種意義上來說,這些龐大的文集離我們是有一定距離的。而電子版方便拷貝,所以此開源資料庫誕生了。此資料庫通過 JSON 格式分發,可以讓你很方便的開始你的項目。

古詩採集沒有記錄過程,因為古詩數據龐大,目標網站有限制,採集過程經常中斷超過了一個星期。2017 年新加入全宋詞,全宋詞爬取過程及數據分析。

宋詞受歡迎的詞牌名

出現在你眼前的詩詞你還記得嗎?還能背誦幾首出來嗎?

十年生死兩茫茫,

不思量,自難忘。

千里孤墳,無處話淒涼。

縱使相逢應不識,

塵滿面,鬢如霜。

夜來幽夢忽還鄉,

小軒窗,正梳妝。

相顧無言,惟有淚千行。

料得年年腸斷處,

明月夜,短松岡。


程式設計師眼裡不光只有代碼,還有詩。

關鍵字: