還搶不到票回家?原來大家都用Python自動搶票了,附帶部分源碼

python花貓 發佈 2020-01-15T10:48:03+00:00

2020年鐵路春運自 1 月 10 日開始,2 月 18 日結束,共 40 天,節前 15 天,節後 25 天,今年的 12 月 12 日春運火車票正式發售。


盼望著,盼望著,春節的腳步近了,然而,每年到這個時候,最難的,莫過於一張回家的火車票。

據悉,今年春運期間,全國鐵路發送旅客人次同比將增長 8.0%。達到 4.4 億人次。

2020 年鐵路春運自 1 月 10 日開始,2 月 18 日結束,共 40 天,節前 15 天,節後 25 天,今年的 12 月 12 日春運火車票正式發售。

即使再難,家還是要回的,票還是要搶的,所以這一周,GitHub 上用 Python 搶票的項目又重回 Top 榜單。


這個搶票小助手誕生於 2017 年,作者是文賢平/文先森 (testerSunshine) ,目前這個項目標星已經將近 20000,可想而知程式設計師們回家的願望是多麼的迫切!

史上最強搶票助手,緊隨 12306 更新

從項目的更新日誌可以看到,這個項目的第一次更新是在 2017.5.13,之後一共進行了 32 次更新,其中大部分是作者本人,也有一些開發者提供了支持。

這個項目基本上是緊隨著 12306 網站的功能更新而更新的,比如去年春運增加的候補功能,在票賣完的情況下預先付款,等其他人退票之後自動補上。

該項目也在今年加入了這個功能:


目前這個搶票小助手基本支持 12306 的所有主要功能,包括郵件通知、智能候補等。


為了這個項目還是費了不少心血的,首先我們來看一下作者的思路:


思路並不複雜而且相當緊湊。首先需要下載一個機器學習模型完成對 12306 驗證碼的自動識別,該模型需放於項目根目錄中。

①模型下載連結:

https://pan.baidu.com/s/1rS155VjweWVWIJogakechA 密碼:bmlm

②Git 倉庫下載:

https://github.com/testerSunshine/12306model.git (1)cd 12306/ (2)git clone https://github.com/testerSunshine/12306model.git

模型的安裝需要一些依賴,具體如下:


滿足了依賴之後可以進行安裝。

root 用戶(避免多 Python 環境產生問題):

pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple -r requirements.txt 

非 root 用戶(避免安裝和運行時使用了不同環境):

pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple -r requirements.txt 

許多 Windows 的用戶裝不了 Tensorflow 的話,可以適當降低版本或者升高版本都是可以的。

注意,在過程中如果報錯為缺少上面列表中的依賴,只需單獨使用 pip3 安裝相應依賴包即可。


而後就可以啟動項目了。

第一步:修改配置文件

# 測試郵箱和server醬是否可用, server醬測試的前提是
server醬開關開啟 
 
# 可以配置server醬提醒(推薦)
[配置教程](https://www.jianshu.com/
p/8d10b5b9c4e3) 
 
# 用python3 還是python 完全取決於安裝的時候配置的環境變量是否
為python3,以下啟動默認環境變量為python3 
 
python3 run.py t 

配置文件說明(仔細閱讀說明):

# -*- coding=utf-8 -*- 
 
# 關於軟體使用配置說明,一定要看!!! 
 
# ps: 如果是候補車票,需要通過人證一致性核驗的用戶及激活的「鐵路暢行」
會員可以提交候補需求,請您按照操作說明在鐵路12306app.上完成人證核驗 
 
# 關於候補了之後是否還能繼續撿漏的問題在此說明:軟體為全自動候補加撿漏,
如果軟體候補成功則會停止搶票,發出郵件通知,但是不會影響你繼續撿漏, 
 
# 如果這個時候撿漏撿到的話,也是可以付款成功的,也就是說,撿漏+候補,
可以最大程度提升搶票成功率 
 
 
 
# 刷票模式:1=刷票 2=候補+刷票 
 
TICKET_TYPE = 1 
 
 
 
# 出發日期(list) "2018-01-06", "2018-01-07" 
 
STATION_DATES = [ 
 
    "2020-01-17" 
 
] 
 
# 填入需要購買的車次(list),"G1353" 
 
# 修改車次填入規則,註:(以前設置的車次邏輯不變),如果車次填入為空,
那麼就是當日乘車所有車次都納入篩選返回 
 
# 不填車次是整個list為空才算,如果不是為空,依然會判斷車次的,
這種是錯誤的寫法 [""], 正確的寫法 [] 
 
STATION_TRAINS = ["G1120"] 
 
# 出發城市,比如深圳北,就填深圳就搜得到 
 
FROM_STATION = "廣州" 
 
# 到達城市 比如深圳北,就填深圳就搜得到 
 
TO_STATION = "武漢" 
 
# 座位(list) 多個座位ex: 
 
# "商務座", 
 
# "一等座", 
 
# "二等座", 
 
# "特等座", 
 
# "軟臥", 
 
# "硬臥", 
 
# "硬座", 
 
# "無座", 
 
# "動臥", 
 
SET_TYPE = ["二等座"] 
 
 
# 當余票小於乘車人,如果選擇優先提交,則刪減聯繫人和
余票數一致在提交 
 
# bool 
 
IS_MORE_TICKET = True 
 
 
# 乘車人(list) 多個乘車人ex: 
 
# "張三", 
 
#"李四" 
 
TICKET_PEOPLES = [""] 
 
 
# 12306登錄帳號 
 
USER = "" 
 
PWD = "" 
 
 
# 加入小黑屋時間默認為5分鐘,此功能為了防止殭屍票導致一直下單
不成功錯過正常的票 
 
TICKET_BLACK_LIST_TIME = 5 
 
 
# 自動打碼 
 
IS_AUTO_CODE = True 
 
 
# 設置2本地自動打碼,需要配置tensorflow和keras庫,3為雲打碼,
由於雲打碼伺服器資源有限(為2h4C的cpu伺服器),請不要惡意請求,
不然只能關閉伺服器 
 
# ps: 請不要一直依賴雲伺服器資源,在此向所有提供伺服器同學表示感謝 
 
AUTO_CODE_TYPE = 3 
 
 
# 此處設置雲打碼伺服器地址,如果有自建的伺服器,可以自行更改 
 
HOST = "120.77.154.140:8000" 
 
REQ_URL = "/verify/base64/" 
 
HTTP_TYPE = "http" 
 
# HOST="12306.yinaoxiong.cn" #備用伺服器穩定性較差 
 
# REQ_URL="/verify/base64/" 
 
# HTTP_TYPE="https" 
 
 
#  郵箱配置,如果搶票成功,將通過郵件配置通知給您 
 
#  列舉163 
 
#  email: "xxx@163.com" 
 
#  notice_email_list: "123@qq.com" 
 
#  username: "xxxxx" 
 
#  password: "xxxxx 
 
#  host: "smtp.163.com" 
 
#  列舉qq ,qq設置比較複雜,需要在郵箱-->帳戶-->開啟smtp服務,
取得授權碼==郵箱登錄密碼 
 
#  email: "xxx@qq.com" 
 
#  notice_email_list: "123@qq.com" 
 
#  username: "xxxxx" 
 
#  password: "授權碼" 
 
#  host: "smtp.qq.com" 
 
EMAIL_CONF = { 
 
    "IS_MAIL": True, 
 
    "email": "", 
 
    "notice_email_list": "", 
 
    "username": "", 
 
    "password": "", 
 
    "host": "smtp.qq.com", 
 
} 
 
 
# 是否開啟 server醬 微信提醒, 使用前需要前往 http://sc.
ftqq.com/3.version 
掃碼綁定獲取 SECRET 並關注獲得搶票結果通知的公眾號 
 
SERVER_CHAN_CONF = { 
 
    "is_server_chan": False, 
 
    "secret": "" 
 
} 
 
# 是否開啟cdn查詢,可以更快的檢測票票 1為開啟,2為關閉 
 
IS_CDN = 1 
 
 
# 下單接口分為兩種,1 模擬網頁自動撿漏下單(不穩定),
2 模擬車次後面的購票按鈕下單(穩如老狗) 
 
ORDER_TYPE = 2 
 
# 下單模式 1 為預售,整點刷新,刷新間隔0.1-0.5S, 然後會校驗時間,
比如12點的預售,那腳本就會在12.00整檢票,刷新訂單 
 
#         2 是撿漏,撿漏的刷新間隔時間為0.5-3秒,時間間隔長,
不容易封ip 
 
ORDER_MODEL = 1 
 
 
# 是否開啟代理, 0代表關閉, 1表示開始 
 
# 開啟此功能的時候請確保代理ip是否可用,在測試放裡面
經過充分的測試,再開啟此功能,不然可能會耽誤你購票的寶貴時間 
 
# 使用方法: 
 
# 1、在agency/proxy_list列表下填入代理ip 
 
# 2、測試UnitTest/TestAll/testProxy 測試代理是否可以用 
 
# 3、開啟代理ip 
 
IS_PROXY = 0 
 
# 預售放票時間, 如果是撿漏模式,可以忽略此操作 
 
OPEN_TIME = "12:59:50" 
 
# 1=使用selenium獲取devicesID 
 
# 2=使用網頁端/otn/HttpZF/logdevice獲取devicesId,這個接口的算法目前
可能有點問題,如果登錄一直302的請改為配置1 
 
# 3=自己打開瀏覽器在headers-Cookies中抓取RAIL_DEVICEID和
RAIL_EXPIRATION,
這個就不用配置selenium 
 
COOKIE_TYPE = 3 
 
# 如果COOKIE_TYPE=1,則需配置chromeDriver路徑,下載地址http://
chromedriver.storage.googleapis.com/index.html 
 
# chromedriver配置版本只要和chrome的大版本匹配就行 
 
CHROME_PATH = "/usr/src/app/chromedriver" 
 
# 為了docker37 準備的環境變量,windows環境可以不用管這個參數 
 
CHROME_CHROME_PATH = "/opt/google/chrome/google-chrome" 
 
# 如果COOKIE_TYPE=3, 則需配置RAIL_EXPIRATION、RAIL_DEVICEID的值 
 
RAIL_EXPIRATION = "1577033439142" 
 
RAIL_DEVICEID = "PuV16sVaV-CTGsFZUuL8JLAk4OhuT1wgUYC_
W3L2JZfWx8Ygx8LOPkko3PSOrK5_xSKhXjgyTMS8dBmj1RZHL2CKB
TmVs6UG_yptlB4NJbGHldltrLMTUEgoDpSkpX2vzpGXgMQsTRzgOXfu
QkAWwS4GjCxSmV3C;BIGipServerpassport=820510986.50215.0000;
route=9036359bb8a8a461c164a04f8f50b252" 
 
 
# 1=>為一直隨機ua,2->只啟動的時候隨機一次ua 
 
RANDOM_AGENT = 2 
 
PASSENGER_TICKER_STR = { 
 
    '一等座': 'M', 
 
    '特等座': 'P', 
 
    '二等座': 'O', 
 
    '商務座': 9, 
 
    '硬座': 1, 
 
    '無座': 1, 
 
    '軟座': 2, 
 
    '軟臥': 4, 
 
    '硬臥': 3, 
 
} 
 
 
# 保護12306官網請求頻率,設置隨機請求時間,原則為5分鐘不大於80次 
 
# 最大間隔請求時間 
 
MAX_TIME = 3 
 
# 最小間隔請求時間 
 
MIN_TIME = 1 
 
 
# 軟體版本 
 
RE_VERSION = "1.2.003" 

第二步:啟動前篩選 CDN

python3 run.py c

第三步:啟動服務

python3 run.py r 

成功搶票後就會出現下面的結果啦:


項目地址:

https://github.com/testerSunshine/12306 

程式設計師為了搶火車票,都幹了什麼!

程式設計師為了搶票而寫代碼這件事可以追溯到 12306 網站剛出現的時候。

2010 年初,12306 網絡購票剛剛出現,一年後 GitHub 上就已經有程式設計師為了買票而寫腳本了,但是當時僅限於查詢余票。

隨後,越來越多的程式設計師開始了「面向回家編程」,出的最大的新聞是差點搞垮 GitHub。

2012 年,一位叫做 iFish 的大佬開發的插件,被很多瀏覽器的春節版本紛紛搭載,連 12306 官方也引用了裡面的一個資源。


這個插件引發了著名的「12306 訂票助手拖垮 GitHub」事件。

簡單來說,就是這款「訂票助手」使用的文件並不是普通的靜態文件(例如 gist),而是一個 repo 的 raw data。

這就意味著,每次有人請求這個文件,GitHub 都要去訪問這個 repo,查找要求的數據。

並且,如果一次數據請求失敗,那麼這個指令就會每五秒請求一次,直到成功。

於是在春節前十幾天的搶票高峰時,巨大的訪問量導致 Github 受到 DDOS 攻擊,不堪負載。

結尾

最後多說一句,小編是一名python開發工程師,這裡有我自己整理了一套最新的python系統學習教程,包括從基礎的python腳本到web開發、爬蟲、數據分析、數據可視化、機器學習等。想要這些資料的可以關注小編,並在後台私信小編:「01」即可領取。

關鍵字: