盼望著,盼望著,春節的腳步近了,然而,每年到這個時候,最難的,莫過於一張回家的火車票。
據悉,今年春運期間,全國鐵路發送旅客人次同比將增長 8.0%。達到 4.4 億人次。
2020 年鐵路春運自 1 月 10 日開始,2 月 18 日結束,共 40 天,節前 15 天,節後 25 天,今年的 12 月 12 日春運火車票正式發售。
即使再難,家還是要回的,票還是要搶的,所以這一周,GitHub 上用 Python 搶票的項目又重回 Top 榜單。
這個搶票小助手誕生於 2017 年,作者是文賢平/文先森 (testerSunshine) ,目前這個項目標星已經將近 20000,可想而知程式設計師們回家的願望是多麼的迫切!
史上最強搶票助手,緊隨 12306 更新
從項目的更新日誌可以看到,這個項目的第一次更新是在 2017.5.13,之後一共進行了 32 次更新,其中大部分是作者本人,也有一些開發者提供了支持。
這個項目基本上是緊隨著 12306 網站的功能更新而更新的,比如去年春運增加的候補功能,在票賣完的情況下預先付款,等其他人退票之後自動補上。
該項目也在今年加入了這個功能:
目前這個搶票小助手基本支持 12306 的所有主要功能,包括郵件通知、智能候補等。
為了這個項目還是費了不少心血的,首先我們來看一下作者的思路:
思路並不複雜而且相當緊湊。首先需要下載一個機器學習模型完成對 12306 驗證碼的自動識別,該模型需放於項目根目錄中。
①模型下載連結:
https://pan.baidu.com/s/1rS155VjweWVWIJogakechA 密碼:bmlm
②Git 倉庫下載:
https://github.com/testerSunshine/12306model.git (1)cd 12306/ (2)git clone https://github.com/testerSunshine/12306model.git
模型的安裝需要一些依賴,具體如下:
滿足了依賴之後可以進行安裝。
root 用戶(避免多 Python 環境產生問題):
pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple -r requirements.txt
非 root 用戶(避免安裝和運行時使用了不同環境):
pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple -r requirements.txt
許多 Windows 的用戶裝不了 Tensorflow 的話,可以適當降低版本或者升高版本都是可以的。
注意,在過程中如果報錯為缺少上面列表中的依賴,只需單獨使用 pip3 安裝相應依賴包即可。
而後就可以啟動項目了。
第一步:修改配置文件
# 測試郵箱和server醬是否可用, server醬測試的前提是
server醬開關開啟
# 可以配置server醬提醒(推薦)
[配置教程](https://www.jianshu.com/
p/8d10b5b9c4e3)
# 用python3 還是python 完全取決於安裝的時候配置的環境變量是否
為python3,以下啟動默認環境變量為python3
python3 run.py t
配置文件說明(仔細閱讀說明):
# -*- coding=utf-8 -*-
# 關於軟體使用配置說明,一定要看!!!
# ps: 如果是候補車票,需要通過人證一致性核驗的用戶及激活的「鐵路暢行」
會員可以提交候補需求,請您按照操作說明在鐵路12306app.上完成人證核驗
# 關於候補了之後是否還能繼續撿漏的問題在此說明:軟體為全自動候補加撿漏,
如果軟體候補成功則會停止搶票,發出郵件通知,但是不會影響你繼續撿漏,
# 如果這個時候撿漏撿到的話,也是可以付款成功的,也就是說,撿漏+候補,
可以最大程度提升搶票成功率
# 刷票模式:1=刷票 2=候補+刷票
TICKET_TYPE = 1
# 出發日期(list) "2018-01-06", "2018-01-07"
STATION_DATES = [
"2020-01-17"
]
# 填入需要購買的車次(list),"G1353"
# 修改車次填入規則,註:(以前設置的車次邏輯不變),如果車次填入為空,
那麼就是當日乘車所有車次都納入篩選返回
# 不填車次是整個list為空才算,如果不是為空,依然會判斷車次的,
這種是錯誤的寫法 [""], 正確的寫法 []
STATION_TRAINS = ["G1120"]
# 出發城市,比如深圳北,就填深圳就搜得到
FROM_STATION = "廣州"
# 到達城市 比如深圳北,就填深圳就搜得到
TO_STATION = "武漢"
# 座位(list) 多個座位ex:
# "商務座",
# "一等座",
# "二等座",
# "特等座",
# "軟臥",
# "硬臥",
# "硬座",
# "無座",
# "動臥",
SET_TYPE = ["二等座"]
# 當余票小於乘車人,如果選擇優先提交,則刪減聯繫人和
余票數一致在提交
# bool
IS_MORE_TICKET = True
# 乘車人(list) 多個乘車人ex:
# "張三",
#"李四"
TICKET_PEOPLES = [""]
# 12306登錄帳號
USER = ""
PWD = ""
# 加入小黑屋時間默認為5分鐘,此功能為了防止殭屍票導致一直下單
不成功錯過正常的票
TICKET_BLACK_LIST_TIME = 5
# 自動打碼
IS_AUTO_CODE = True
# 設置2本地自動打碼,需要配置tensorflow和keras庫,3為雲打碼,
由於雲打碼伺服器資源有限(為2h4C的cpu伺服器),請不要惡意請求,
不然只能關閉伺服器
# ps: 請不要一直依賴雲伺服器資源,在此向所有提供伺服器同學表示感謝
AUTO_CODE_TYPE = 3
# 此處設置雲打碼伺服器地址,如果有自建的伺服器,可以自行更改
HOST = "120.77.154.140:8000"
REQ_URL = "/verify/base64/"
HTTP_TYPE = "http"
# HOST="12306.yinaoxiong.cn" #備用伺服器穩定性較差
# REQ_URL="/verify/base64/"
# HTTP_TYPE="https"
# 郵箱配置,如果搶票成功,將通過郵件配置通知給您
# 列舉163
# email: "xxx@163.com"
# notice_email_list: "123@qq.com"
# username: "xxxxx"
# password: "xxxxx
# host: "smtp.163.com"
# 列舉qq ,qq設置比較複雜,需要在郵箱-->帳戶-->開啟smtp服務,
取得授權碼==郵箱登錄密碼
# email: "xxx@qq.com"
# notice_email_list: "123@qq.com"
# username: "xxxxx"
# password: "授權碼"
# host: "smtp.qq.com"
EMAIL_CONF = {
"IS_MAIL": True,
"email": "",
"notice_email_list": "",
"username": "",
"password": "",
"host": "smtp.qq.com",
}
# 是否開啟 server醬 微信提醒, 使用前需要前往 http://sc.
ftqq.com/3.version
掃碼綁定獲取 SECRET 並關注獲得搶票結果通知的公眾號
SERVER_CHAN_CONF = {
"is_server_chan": False,
"secret": ""
}
# 是否開啟cdn查詢,可以更快的檢測票票 1為開啟,2為關閉
IS_CDN = 1
# 下單接口分為兩種,1 模擬網頁自動撿漏下單(不穩定),
2 模擬車次後面的購票按鈕下單(穩如老狗)
ORDER_TYPE = 2
# 下單模式 1 為預售,整點刷新,刷新間隔0.1-0.5S, 然後會校驗時間,
比如12點的預售,那腳本就會在12.00整檢票,刷新訂單
# 2 是撿漏,撿漏的刷新間隔時間為0.5-3秒,時間間隔長,
不容易封ip
ORDER_MODEL = 1
# 是否開啟代理, 0代表關閉, 1表示開始
# 開啟此功能的時候請確保代理ip是否可用,在測試放裡面
經過充分的測試,再開啟此功能,不然可能會耽誤你購票的寶貴時間
# 使用方法:
# 1、在agency/proxy_list列表下填入代理ip
# 2、測試UnitTest/TestAll/testProxy 測試代理是否可以用
# 3、開啟代理ip
IS_PROXY = 0
# 預售放票時間, 如果是撿漏模式,可以忽略此操作
OPEN_TIME = "12:59:50"
# 1=使用selenium獲取devicesID
# 2=使用網頁端/otn/HttpZF/logdevice獲取devicesId,這個接口的算法目前
可能有點問題,如果登錄一直302的請改為配置1
# 3=自己打開瀏覽器在headers-Cookies中抓取RAIL_DEVICEID和
RAIL_EXPIRATION,
這個就不用配置selenium
COOKIE_TYPE = 3
# 如果COOKIE_TYPE=1,則需配置chromeDriver路徑,下載地址http://
chromedriver.storage.googleapis.com/index.html
# chromedriver配置版本只要和chrome的大版本匹配就行
CHROME_PATH = "/usr/src/app/chromedriver"
# 為了docker37 準備的環境變量,windows環境可以不用管這個參數
CHROME_CHROME_PATH = "/opt/google/chrome/google-chrome"
# 如果COOKIE_TYPE=3, 則需配置RAIL_EXPIRATION、RAIL_DEVICEID的值
RAIL_EXPIRATION = "1577033439142"
RAIL_DEVICEID = "PuV16sVaV-CTGsFZUuL8JLAk4OhuT1wgUYC_
W3L2JZfWx8Ygx8LOPkko3PSOrK5_xSKhXjgyTMS8dBmj1RZHL2CKB
TmVs6UG_yptlB4NJbGHldltrLMTUEgoDpSkpX2vzpGXgMQsTRzgOXfu
QkAWwS4GjCxSmV3C;BIGipServerpassport=820510986.50215.0000;
route=9036359bb8a8a461c164a04f8f50b252"
# 1=>為一直隨機ua,2->只啟動的時候隨機一次ua
RANDOM_AGENT = 2
PASSENGER_TICKER_STR = {
'一等座': 'M',
'特等座': 'P',
'二等座': 'O',
'商務座': 9,
'硬座': 1,
'無座': 1,
'軟座': 2,
'軟臥': 4,
'硬臥': 3,
}
# 保護12306官網請求頻率,設置隨機請求時間,原則為5分鐘不大於80次
# 最大間隔請求時間
MAX_TIME = 3
# 最小間隔請求時間
MIN_TIME = 1
# 軟體版本
RE_VERSION = "1.2.003"
第二步:啟動前篩選 CDN
python3 run.py c
第三步:啟動服務
python3 run.py r
成功搶票後就會出現下面的結果啦:
項目地址:
https://github.com/testerSunshine/12306
程式設計師為了搶火車票,都幹了什麼!
程式設計師為了搶票而寫代碼這件事可以追溯到 12306 網站剛出現的時候。
2010 年初,12306 網絡購票剛剛出現,一年後 GitHub 上就已經有程式設計師為了買票而寫腳本了,但是當時僅限於查詢余票。
隨後,越來越多的程式設計師開始了「面向回家編程」,出的最大的新聞是差點搞垮 GitHub。
2012 年,一位叫做 iFish 的大佬開發的插件,被很多瀏覽器的春節版本紛紛搭載,連 12306 官方也引用了裡面的一個資源。
這個插件引發了著名的「12306 訂票助手拖垮 GitHub」事件。
簡單來說,就是這款「訂票助手」使用的文件並不是普通的靜態文件(例如 gist),而是一個 repo 的 raw data。
這就意味著,每次有人請求這個文件,GitHub 都要去訪問這個 repo,查找要求的數據。
並且,如果一次數據請求失敗,那麼這個指令就會每五秒請求一次,直到成功。
於是在春節前十幾天的搶票高峰時,巨大的訪問量導致 Github 受到 DDOS 攻擊,不堪負載。
結尾
最後多說一句,小編是一名python開發工程師,這裡有我自己整理了一套最新的python系統學習教程,包括從基礎的python腳本到web開發、爬蟲、數據分析、數據可視化、機器學習等。想要這些資料的可以關注小編,並在後台私信小編:「01」即可領取。