一路陽光/轉帖
淺談高考志願填報院校錄取線和專業錄取線的預測
作者:肖愛民 高考志願填報赤峰工作室
一、寫在前面
如何精準定位高考志願填報方案?那就是用數學的方法預測院校的錄取線和專業的錄取線。實際就是對曆年的錄取數據和當年的招生計劃等信息進行整理分析,找出規律所在。
在上個世紀,我為考生參謀志願,都是靠碎片化的數據信息,這樣搞了幾年,開始意識到這樣進行填報指導完全是憑感覺,其精準性大打折扣。要想做到準确定位,就必須要有确切的數據做參考,并用數學的方法加以統計分析,這樣的參照系才會有更可靠的準确度。這個數學方法就是要建立數學模型。什麼是數學模型?這個數學模型不是簡單地一加一減的算術,而是建立找出院校和專業錄取規律的抽象的簡化的等式或對應關系,以及圖表圖象等描述考生成績分布規律和招生人數變化的數學結構表達式。這個表達式實際就是一個方程式。
從2003年我就全面地開始搜集有關數據,建立了數學模型,并加以整理分析。通過對這些基礎數據的研究,我總結了一套切實可行的數據處理的理念和方法,使我對高考志願填報更加得心應手,目标院校和目标專業填報的精準度盡在掌控之中。
大家知道,就高報這一行業來說,最原始的焦點是什麼?那就是保證考生不滑檔。現在的大平行志願填報模式成全了我們,滑檔已經是小概率的事件。以一個省的志願填報是以6所院校,每所院校可選6個專業為例,雖然說大平行的填報模式使各院校錄取的分數出現扁平化,但還是有20到30分的分數區間差。若我們把每所院校的錄取分數區間看成是一個小區間,把6所院校的并集看成是一個大區間,那麼,這個大區間會有多大的分數區間差?可能是40分、50分、60分甚至會更多。用這麼大的一個區間去套能否被錄取的一個點,這個點落在區間外部的概率太小了!所以,現在保證不滑檔已不是最突出的問題。
當前高報行業突出的問題應該在于:如何做到根據考生和家長的訴求實現目标院校和專業精準定位的問題。如果考生選擇專業已定,如何保證考生的專業方向不被調劑的錄取?如何做到對專業優先的考生實現“三個一”(即第一所院校的第一個專業錄取,被錄取的專業排名不是第一名,隻招一人的專業除外)的目标?讓我們百分之百的做到不可能,那是強人所難。那麼能否做到80%、70%或是60%的考生實現專業優先的定位,做到實現“三個一”呢?新高考,新在哪兒?我感覺很關鍵的一點就是由原來院校 專業的大平行錄取模式改為專業 院校的新高考錄取模式,這種錄取模式并不是一個簡單地調個,其實是誰優先的問題。
最近幾年,在給内蒙古、河南、河北、湖北的一些機構或獨立咨詢師講課時,講的重點議題就是對數據進行處理和分析。他們深刻體會到這樣處理的數據,使用起來優點就是十個字:“全面、直觀、快捷、準确、實用”。這樣處理的數據用于新高考的志願填報,将會使志願填報方案的設計更加簡單化,做到省時、省事、省力。
在設計高考志願填報方案時,必須要掌握完整的數據。不全的數據可能對指導多數人沒有太大的影響,隻會對少部分考生有影響,好像無關大局,但是對個别考生來說那就是100%,可能就會影響他的一生。例如:2015年内蒙古已将二、三本合并,一本的最低控制分數線是464分,合并後二本的最低控制分數線是336分。當年我指導一位高考總分是366分的理科考生,家長和考生就想學土木工程專業,最大的期望就是走公立并且不是高收費的院校。而在當年,内蒙古新增加了一所院校,叫鄂爾多斯應用技術學院,是2015年4月經教育部批準成立的公立二本院校。我經過測算後,确定考生重點關注該所院校的土木工程專業,最終被順利錄取。這個專業的錄取分數區間是[387,366],該專業共計招生66人,他專業排名為第66名。報考完後,他的家長問我,肖老師你怎麼知道有這所院校并且我的孩子能被保專業的錄取?我的回答就是:我靠的就是全面詳實的數據。
一份數據是否全面詳實完整,隻告訴大家一個最直觀,最簡單的檢驗辦法。一是在本省的招生計劃出來時,看他的數據裡有沒有當年各院校所有專業的招生計劃和當年新的備注說明。沒有當年各院校所有專業招生計劃的數據是一個不完整的數據,也是一個利用價值很低的數據;沒有當年新的備注說明,是一個極容易造成考生被退檔的數據。二是找一個當年在本省新招生的院校和專業,看他的數據能否提供有價值的參考,若沒有,那麼這個數據就不能提供全方位的指導。三是看是否有本省特殊的招生類型的數據。例如:河南省的數據看一下有沒有河南科技大學與三門峽市政府聯合辦的應用工程學院的數據。
每年都會有考生和家長看了我數據後說,我就想找這樣的數據,查了很多卡,都沒有老師您這樣的數據,老師你把它公開不是更好嗎!我說,這是我的心血!毫不誇張的說,若把我處理完的數據向考生和家長公開,考生能走那所院校的那個專業一眼就能看出來。2012年有一位考生和家長來找我咨詢,考生的成績是551分。她的父親為孩子的報考花費了半年的心血,打印的資料有半米高。家長讓我看他的資料,我簡單說了不用看的理由。我說:高考志願填報不是哪所大學好哪所大學不好我知道你不知道的問題,現在的信息手段這麼發達,這些在網上一查就能了解的信息,不用我說誰都會知道。而我們進行志願填報最最關鍵的問題就是如何找準自己的位置。形象的說,你高考考多少分,就相當于你值多少錢,應該賣到哪兒塊去的問題。應該在适合考生的院校和專業當中來選擇相對理想的院校和專業。我要求家長按我的咨詢流程進行,當進行到半個小時時,我中途準備出去交代一件事情,這位家長跟我說,肖老師,我看看你的數據可以嗎?我說可以,但是不能拍照,給你10分鐘時間浏覽。待我返回後,這位家長說,肖老師我服了,看來我搞的這些資料大多對我的孩子都是沒有用的,你的數據太全了,太有說服力了,一目了然。肖老師,你說吧,孩子的志願怎麼填報一切聽你的。
現實地說,我們在為考生填報志願服務時所面臨的最直接的問題就是:考生的分數已定,專業方向确定,在保證考生分數利益最大化的前提下如何來實現考生的專業意向、院校意向和地域意向。在近幾年高考志願填報時大家都有一種感覺,現在的家長和考生難伺候了,挑剔太大了。随着時間的推移,這種現象還會越來越嚴重。現在已不是“劃拉到筐子就是菜”“有書念就可以”的時期了。這是考生和家長的認知水平提高的具體表現。大家都明白了專業決定着職業,決定着今後就業的領域。很多單位在選人用人時都要看你是什麼專業畢業的,也就是我們常說的“科班”出身。所以,考生和家長越來越認可“專業優先”的填報方式。例如:考生要求非“臨床醫學”不學,非“自動化”不學等現象,緻使考生被錄取的範圍越來越窄,發生專業被調劑或滑檔的可能性會增加。
那麼,在志願填報服務時如何來實現考生的目标呢?“工欲善其事,必先利其器”,我們在為考生準确定位時不能靠感覺,一定要有數據支撐,一定要用數據說話。這就要求我們手中要有與之相适應的“利器”,——全面詳實準确的和可操作的數據。
二、數據處理的基本做法
(一)必備的基礎數據資料
1、曆史基礎數據資料應有:院校的招生計劃和分專業的招生計劃、一分一段表、各批次的最低控制分數線、院校的投檔分數線、各院校錄取的最高分最低分及錄取人數、院校各專業錄取的最高分平均分最低分及錄取人數等相關數據資料。
2、當年的數據資料應有:院校的招生計劃和分專業的招生計劃、一分一段表、各批次的最低控制分數線等資料。還應有明确的備注。具體應包括:院校的層次、性質、地域、專業報考對身體的要求、小分的要求、加試的要求、錄取規則、大類招生的專業說明、辦學模式、辦學地點、收費标準等等。實際就是“大厚本”的内容和我們整理的限制要求等内容。
上述所說的數據都是可加工分析處理的電子版數據。
(二)數據的處理與分析
這些數據都是各自獨立的,我們要将這些數據進行統計處理,将它們變成為我所用的綜合數據。那麼,這些具體的數據資料對我們進行統計分析都各自有何作用呢?
1、 一分一段表 曆年的一分一段表實際都是關于分數與位次的二元函數,其圖像都是近似一條曳物線。我們把這些相關聯的二元函數進行對比分析,實際就是解一個二元方程。這個二元方程從建立到解出是很麻煩的,我們實際運作時完全可以用直觀的圖像法進行對比分析。找出變化趨勢和特殊點(拐點或回歸點),就可以找出不同年份之間的變化規律,确定出變化區間和修正值。這是對等效分的一次修正。
為什麼要有這樣的分析呢?因為考生的分數不同所處的位次就會不同,還有就是每一分的分數區間分布的人數也會不相同。以河北省理科為例,2018年446分的考生有700人,累計位次是128152;而對應的2019年累計位次128172有904人,分數是458分。如果簡單的将2019年458分的等效分視為2018年的446分,這就會出現很大的偏差,因為在這個位次上考生人數出現的頻率是不一樣的,相差204人。這時就需要根據考生人數出現的頻率變化對等效分加以修正。
2、院校錄取的最高分最低分及錄取人數和當年對應院校的招生計劃 每個院校錄取的分數區間實際上都是一個置信區間,這個置信區間是由院校的冷熱程度、專業的冷熱程度、地域的冷熱程度及招生人數的多少來決定的。我們通過對這些區間分布的分析,特别是對各院校招生人數的分析即可找出修正值。這是對等效分的二次修正。
假如:清華大學在本省本科一批理科的招生計劃是100人,一位理科考生在全省的排名是95名,那麼這位考生想去清華大學能否走成?回答是肯定的。若清華大學在本省本科一批理科的招生計劃是70人,一位理科考生在全省的排名是95名,這位考生想去清華大學能否走成?一定會存在疑問。我們就應該用這種數學的思維方式、方法來進行修正。
3、專業錄取的最高分平均分最低分及招生人數 把每一所院校這些具體的數據,都看成是一個集合裡的不同元素,并把它們進行統計排列,都會組成一個類似的對角線矩陣。這個矩陣體現着這所院校具體專業錄取考生成績的分布走勢,這個走勢将進一步修正該院校各專業的錄取分數。同時,這個矩陣将決定着做方案時對院校的取舍和專業的取舍。這是對等效分的第三次修正。
4、當年的數據 主要就是“大厚本”的所有内容和當年的錄取規則及限制要求等。我們應該将當年的招生計劃及備注等内容整理成我們使用的數據,便于我們逐條的進行分析,有利于精準定位的設計高考志願填報方案。有這些具體的數據信息,在做方案時,還能有效地避免因小分不符、身體條件不符、加試不符合要求等因素而造成退檔的現象。絕對不能出現提供的方案是上年的信息而今年沒招的笑話。
5、數據的合成與測算 把曆史數據與當年的數據進行合成,并利用一次修正值、二次修正值、三次修正值和矩陣裡各元素的排列規律,對當年各院校的錄取線和各專業的錄取線進行預測,得出了經過初步整理的源數據表。
6、對源數據表進行綜合分析處理 将源數據表所有的招生院校和專業都進行對比分析,并按我們制作高考志願填報方案所需的要求進行整理,最終實現所有曆史的和當年的數據信息都在我們的掌控之中,全面準确,一目了然。在設計高考志願填報方案時抛棄“大厚本”。我每年拿到“大厚本”都是在處理數據時使用,當我把數據處理完,“大厚本”就被束之高閣了。有這樣一份全面的、詳實的、可操作的數據,就能做到設計方案時準确、快速、完整,都會對涉及到的院校和專業的數據逐條分析,不遺漏任何對考生有用的信息,規避所有對考生不利的信息,有效地提高工作效率,極大地提高目标志願的錄取概率。
為啥特别強調數據要全面、詳實、準确呢?
在這裡我以2019年理科一批為例,舉幾個省的數據。
内蒙古的本科一批理科2019年的數據大約有3869條,其中有曆史數據做參考的3127條,2019年新增的數據742條。這742條有的是院校和專業都是新增的,有的是院校招生類型發生變化的,有的是院校沒變,但是專業是新增的。新增的數據占總數據條數的19%。
河南省的本科一批理科2019年的數據大約有8150條。其中有曆史數據做參考的6733條,2019年新增的數據1417條。新增的數據占總數據條數的17%。
河北省的本科一批理科2019年的數據大約有7596條。其中有曆史數據做參考的6445條,2019年新增的數據1151條。新增的數據占總數據條數的15%。
這些有變化或新增的數據信息,已經占了1/6。隻有全面的掌控這些數據,才能在制作方案時不出現遺漏,做到給考生精準定位,突出個性化的設計。
一份完整的高考志願填報方案包含的内容應有:當年招生院校的代号、院校名稱、院校的招生計劃、專業代号、專業名稱、專業的招生計劃、招生專業的備注(包括專業報考的身體要求,小分要求,加試要求、錄取規則、大類招生的專業說明、辦學模式、辦學地點、收費标準等說明);還要有曆史的對應數據(包括曆史的院校招生計劃、專業的招生計劃、專業錄取的最高分、最低分、平均分等信息)。
綜上,是我從事高報若幹年處理數據時的一點心得體會,不對的地方請各位批評指正。謝謝大家。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!