對于需要統計的一組數據,高一學生學完了代表集中趨勢的中位數、衆數、平均數之後,就會學到衡量數據離散程度的數字特征——方差,描述的是這一組數據與平均數的平均偏離程度,當然描述部分數據的偏離程度還有極差,消除單位影響之後還有标準差,這裡咱們把目光暫時集中在方差上,另外用樣本估計總體就不說了。
方差顧名思義,有平方、有作差,這個名字已經顯現了方差的計算方法和計算公式的一部分,加上“平均偏離程度”,就有1/n,這樣就完整了。
從教材内容來看,是以選擇甲乙兩個運動員誰去參賽作為問題背景的:均值相同的情況,誰的方差小,誰的成績就更穩定,也就更容易在大賽打出相對較好的成績。從生活實際來說,這個道理不難理解,但是要徹底弄懂方差的概念、公式,還需要問自己如下幾個問題:
1、結合教材在引入方差這個概念之前,對于射擊這個的問題情境,教材給的是2個獨立的條形圖,能不能引導學生來整理為更易于理解的形式呢?
在課堂上,對于射擊問題,先讓學生們自由讨論,暢所欲言2分鐘,再反問那些答對的同學:你是憑感覺還是靠的邏輯證明?再引導學生,請2名同學一起合作把上圖畫出來,然後再讓大家通過兩個目标對象合在一起的二維折線圖直觀說明,确實乙運動員的成績更加穩定,接着引入為方差作鋪墊的“平均距離”。
第一步,x1-x拔,x2-x拔,……,xn-x拔
到n說明是有限個數據,高中階段暫時處理這麼多。大家會發現作差後新産生的n個數據有正有負,而從黑闆上的圖來觀察,距離要加總的,因此每個數據都得是非負數,比如加絕對值,要不然正負抵消,失去評估數據波動幅度的意義;
第二步,加了絕對值後也能手工計算,但是數據量大且多的時候,使用計算機遇到絕對值機械式分類讨論不聰明,于是采用人工和計算機都好處理的平方和運算,順便把差的值同時做大,也更容易比較兩者之間的波動幅度;
第三步,除以n,給平均一個交待,大家也會發現要比較2個或多個數據的方差,它們的樣本容量肯定要一樣,否則不公平。
2、為什麼要用每個具體數據xi跟平均數x拔做對比呢?難道不能讓所有的數據跟第一個數或者中位數進行作差平方和再均值的計算嗎?
這裡面到底有什麼“道道”?請看下面2個實例:
例1:求絕對值函數y=f(x)=|x-a| |x-b|(x∈R,a≠b)的最小值。
在數軸上畫出來,一眼可知最小值就是a到b的距離,即|a-b|,取得最小值的條件就是x要在a和b之間;
例2:求二次函數y=g(x)=(x-a)^2 (x-b)^2(x∈R,a≠b)的最小值。
畫出二次函數的草圖,開口向上,最小值在對稱軸x=(a b)/2處取得;
把例1和例2聯系在一起看,求方差為什麼都要減去x拔的價值不言自明:就是要讓方差的數值盡可能小,小小益善不是嗎?
方差不僅僅是偏離程度的平均值,而且是可以計算得到的最小值,這和高二線性回歸分析中求斜率參數b尖(帽)的最小二乘法的思路是一緻的,高一這一節
方差概念的教學可以作為最小二乘法得到線性回歸方程中斜率參數的前奏。
其實,現實中很多東西并非十分精确的、也難以做到無誤,但是為了數學化,就用一個可測度的值來替代,包括概率也是這麼回事。
3、方差的基礎是這一組數據的平均數,進一步說,兩組數據如果平均數不一樣,那麼比較方差就沒有基礎,也就無從比較起;
進一步想想,如果兩者均值不一樣,一個均值大、一個均值小,一個方差大、一個方差小,如何比較呢,咱們分類讨論瞧瞧:
對于情況1和4的分析,第三個細分情況
類似于正态分布的3σ區間,都是采用了區間判斷的方法,
根據甲乙兩人的射擊數據,誰更多地、概率更大地落在賽前制定的成績區間,就派誰去,把離散的數據點變為連續的數據區間。
最後總結一下,高中階段許多知識點間有直接或間接的聯系,聯系是普遍的;少一些的知識點也少不了對立和矛盾,做對看情況。因此,對于某一個具體的知識點,經常提問題、問十個為什麼,把其他學過的知識點進行聯系和對比總會有一些新的收獲,畢竟教材不是面面俱到的高中數學百科全書。
本文表述不太嚴謹,上課應以教材和教參為準,平時表述思想略随意,借康托爾大師的話給自己找個台階哈——數學的本質在于它的自由。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!