一、背景信息
2021年7月25日,深圳舉行2021年第7期小汽車競價和搖号。本期粵B車牌成交價格有所下降,其中,個人平均成交價58260元,比上月降低7513元,降幅為11.4%。而單位車牌最低成交價下跌超過兩成。據了解,本期深圳普通小汽車增量指标共3367個,其中單位指标404個、個人指标2963個。競價結果顯示,本期個人車牌最低成交價為52000元、平均成交價58260元,最低成交價的報價人數為71人、成交41人。單位指标競價成交結果為,最低成交價68500元、平均成交價87311元,最低成交價的報價單位數為2個、成交1個。本人作為苦逼搖号5年不中的搖号黨,近期正好閑來無事,為以後競拍深圳号牌,就用jupyter python寫了個簡單的機器學習算法預測個人競價排名信息。
二、數據處理及算法預測過程
1、數據來源
本文所用數據來源于公開數據深圳市小汽車增量指标競價情況表,内容是從2015年1月至2021年7月之間所有個人競價相關信息,截止2021年8月20日,總計77條數據。
圖2.1.1 深圳市小汽車個人增量競價情況表
2、數據處理及分析
根據競拍規則,競價采用網上報價方式進行,報價不安排統一場所。競買人登錄深圳市小汽車增量調控管理信息系統,點擊“競價平台”按鈕登錄深圳市小汽車增量調控競價平台(以下簡稱“競價平台”),憑指标管理機構資格審核确認的有效編碼及報名時填寫的手機号碼進行資格激活後,即可進行報價,總計有3次報價機會。
競買人在規定的時間内可報價1次,對其報價有2次修正機會,報價等于或高于保留價的為有效報價,高于保留價的報價應為100元的整數倍且報價不得超過上一期增量指标平均成交價的兩倍(個人:116500元,單位174600元),以最後一次有效報價為準。
因此第二次競拍價格和最後平均的價格密切相關,第一次競拍價格和最後均價次相關。
圖2.2.1 計算數據平均一、二次比
最終成交價格和一次比在1-1.5之間,這個是重要的經驗參數。
圖2.2.2 成交報價編碼比和付款成交比
成交報價編碼比和付款成交比可以告訴整體競價放棄情況,從數據上來看的話成交率還是比較高的。
圖2.2.3 數據列描述信息
圖2.2.4 機器學習特征選擇
從上述十幾個字段中選擇了投放個數、有效個數、第一次競價和第二競價作為機器學習預測的4個特征,這4個特征數據在個人競價開始前也會公布,可以用來預測本期的最低和平均價格,其他的列如計算比例如果作為特征的話會導緻數據預測洩漏的問題。
圖2.2.5 訓練和預測集劃分
按照0.2的比例分别劃分為訓練集和預測集,最終有61個數據作為訓練集進行模型訓練。
3、算法選擇和處理
算法采用xgboost回歸算法實現,使用500個子樹以及early_stopping方式訓練。
圖2.3.1 xgboost算法代碼
三、結論及規劃
本次預測将個人競價平均值作為預測,通過訓練以後對16個預測集的結果進行預測,結果如下,總體上來看結果還算滿意,有一定的參考性。
圖3.1 個人競價平均值預測結果
訓練集和特征數偏少是導緻回歸拟合度偏差的重要因素,後期我也會針對這些做更多的工作,還有四天就是8月份的個人競價競拍,在第二次競價結果出來後,我會發布預測均價結果供大家做最後的競拍參考。
需要代碼的可以在留言區發布郵箱地址,有想法的也可以随時留言交流,歡迎關注和轉發[呲牙]。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!