找古詩你有以下痛點嗎?
- 有時候想用一首詩來表達自己此刻心情,可是怎麼也找不到,可能不是找不到,而是沒有這麼一個平台去找。
- 你家小孩想背古詩,書本的古詩有不全,找到一些APP廣告有多,小孩本來小,還要看一些成年人的廣告。
- 喝酒了是不是想聽聽 古詩來疏通自己的心情?
身為技術開發,有著多年開發技術的本領,做技術人員是不是生活單調,每天除了吃飯上班寫代碼?還有別的嘛?想想就知道了,比如我就是一個愛古詩的人,而且還是一個愛喝啤酒的程式設計師,重慶山城程式設計師就是我。
今天我要為大家分享一份代碼,一個在GitHub上火的不行的項目,關注量一直在不停上升的項目,古詩學的好的程式設計師招人愛,古詩背的多的程式設計師可以寫出優美的句子,可以給你心愛的人寫情書了。
最全的中華古典文集資料庫,包含 5.5 萬首唐詩、26 萬首宋詩、2.1 萬首宋詞和其他古典文集。詩人包括唐宋兩朝近 1.4 萬古詩人,和兩宋時期 1.5 千古詞人。數據來源於網際網路。
為什麼要做這個倉庫? 古詩是中華民族乃至全世界的瑰寶,我們應該傳承下去,雖然有古典文集,但大多數人並沒有擁有這些書籍。從某種意義上來說,這些龐大的文集離我們是有一定距離的。而電子版方便拷貝,所以此開源資料庫誕生了。此資料庫通過 JSON 格式分發,可以讓你很方便的開始你的項目。
古詩採集沒有記錄過程,因為古詩數據龐大,目標網站有限制,採集過程經常中斷超過了一個星期。2017 年新加入全宋詞,全宋詞爬取過程及數據分析。
宋詞受歡迎的詞牌名
出現在你眼前的詩詞你還記得嗎?還能背誦幾首出來嗎?
十年生死兩茫茫,
不思量,自難忘。
千里孤墳,無處話淒涼。
縱使相逢應不識,
塵滿面,鬢如霜。
夜來幽夢忽還鄉,
小軒窗,正梳妝。
相顧無言,惟有淚千行。
料得年年腸斷處,
明月夜,短松岡。
程式設計師眼裡不光只有代碼,還有詩。