tft每日頭條

 > 圖文

 > 沒有經驗的人可以做統計工作嗎

沒有經驗的人可以做統計工作嗎

圖文 更新时间:2024-08-26 15:10:10

這年頭,在公司裡,不管你是做質量的,還是搞生産的,又或者是負責研發工作的,甚至是财務或者物流的,或多或少得遇上些(概率)統計學的知識。

然而,大多數朋友在大學一畢業後,就将(概率)統計學的知識,統一打包還給老師了!

今天,我們一起,看看 (概率)統計學在過程能力研究中的應用。

沒有經驗的人可以做統計工作嗎(不懂點統計學怎麼行)1

1.變差(Variation)

世界上沒有完全相同的兩片樹葉。

同樣,也沒有完全相同的兩個零件,哪怕是在同一生産過程之下。

沒有經驗的人可以做統計工作嗎(不懂點統計學怎麼行)2

零件之間的差異就是變差(Variation)

變差是有害的,至少在追求零件一緻性的工業化生産中是這樣的。

盡管如引,變差卻與人的生老病死一般,是不可避免的

沒有經驗的人可以做統計工作嗎(不懂點統計學怎麼行)3

當變差大到一定程度,大到人們無法容忍的地步,就會産生不合格品

這個對于某個特性能容忍的區間,就是所謂的公差/規格限

對于公差/規格限,很多朋友會有這樣的一種思路,某一特性,在要求範圍内的就是合格的,比如長度、寬度、重量等等。

這好比足球比賽,隻要足球進了球門,不管是在中間進了,還是擦着門柱進去的,都算得分!

沒有經驗的人可以做統計工作嗎(不懂點統計學怎麼行)4

當特性在要求的範圍内,我們覺得客戶是滿意的。

沒有經驗的人可以做統計工作嗎(不懂點統計學怎麼行)5

确實,這樣的思路有一定的道理,也很同意理解。

然而,随着時間的推移,一個新的變差理論慢慢嶄露頭角并慢慢被人們所接受。

它的核心理論是:不管技術規格大小,任何偏離目标值的産品都會帶來損失

沒有經驗的人可以做統計工作嗎(不懂點統計學怎麼行)6

新理論雖然也關注産品,但視野卻慢慢擴大的制造産品的整個過程——即過程質量。

即盡量保證過程質量的穩定,減少制造出不合格品的“可能”

這些“可能”會産生産品檢查、測試、返工的成本;顧客不滿意度增加的成本,最終導緻“損失”。

這些都是什麼樣的“可能”,如何進行評價,要回答這些問題你需要了解些(概率)統計學方面的知識。

2.兩個非常重要的定理(律)

談到(概率)統計學,不可避免得要去談很多很多的數學公式,運算與推理。

這些正是很多朋友望而卻步的,因為這些東西太抽象了。

抽象到“要不是要寫這篇文章,我也不願意去看它們,哪怕一眼”!

沒有經驗的人可以做統計工作嗎(不懂點統計學怎麼行)7

既然這麼抽象,我們就不妨異想天開一下,話說你穿越到17世紀的法國。

看到一大幫無聊透頂的貴族在皇宮玩擲硬币。

沒有經驗的人可以做統計工作嗎(不懂點統計學怎麼行)8

第一個人擲了10次,正面出現7次。于是他得出結論,任意擲一次硬币出現正面的概率是0.7。

第二個人擲了50次,正面出現30次。于是他得出結論,任意擲一次硬币出現正面的概率是0.6。

第三個人擲了100次,正面出現65次。于是他得出結論,任意擲一次硬币出現正面的概率是0.65。

第四個人擲了200次,正面出現110次。于是他得出結論,任意擲一次硬币出現正面的概率是0.55。

……

第一百個人擲了1000次,正面出現505次,于是他得出結論,任意擲一次硬币出現正面的概率是0.505。

這時候,在邊上一直看着的你,終于忍耐不住,擡手推了一下隐形眼鏡,大聲地說:

沒有經驗的人可以做統計工作嗎(不懂點統計學怎麼行)9

女士們,先生們,大家别再抛了,安靜一下,現在我來宣布兩個定理(律):

定理一:當我們把擲的次數擴大到無限時,會發現出現正面的概率會趨向于0.5,這就是大數定律

定理二:我們繪制一個直角坐标,X軸表示這一百回合我們每次擲的次數:即10,20,100,200……,1000。Y軸表示每一回合正面出現的概率:即0.7,0.6,0.65,0.55……0.505。把這些點全部連接起來,會發現它的形狀非常像正态曲線,此乃中心極限定理

沒有經驗的人可以做統計工作嗎(不懂點統計學怎麼行)10

為什麼大花周章講這兩個定律?我們來看看。

大數定律的核心是當樣本數量很大的時候,樣本均值和真實均值充分接近

中心極限定理同樣有着廣泛的實際應用背景。

在自然界與生産中,一些現象受到許多相互獨立的随機因素的影響,如果每個因素所産生的影響都很微小時,總的影響可以看作是服從正态分布的

大數定律與中心極限定理一起,成為現代概率論、統計學、理論科學和社會科學的基石

沒有經驗的人可以做統計工作嗎(不懂點統計學怎麼行)11

哇!可以這麼牛?

(概率)統計學是與某些事發生的“可能性”打交道的,尋找這些可能性的規律并總結出來,來推測尚未發生事情發生的可能性大小。

大數定律與中心極限定理正是前人總結的關于可能性的規律。

這些規律在雖然都被後人用嚴格的數學證明過,但最開始的時候是人們通過經驗或猜想所得。

盡管如此,這些經驗或猜想還是推動概率論、統計學、理論科學和社會科學等學科的長足進步。

3.在過程能力研究中的應用

在中心極限定理裡,我們提到了正态分布,那麼什麼叫正态分布呢?

正态分布也稱“常态分布”,又名高斯分布,其曲線呈鐘型,兩頭低,中間高。

沒有經驗的人可以做統計工作嗎(不懂點統計學怎麼行)1

在工業生産中,很多特性都符合正态分布,我們就以某産品尺寸舉例。

上圖的“μ”數學期望,你可以理解成目标值,比如尺寸為10mm;

“σ”标準差,是總體各單位标準值與其平均數離差平方的算術平均數的平方根(注意這裡是總體),假設這裡的σ為1mm;

沒有經驗的人可以做統計工作嗎(不懂點統計學怎麼行)13

如果對于這個零件的公差要求為1mm,如下圖(紅線包在其中的部分),則該尺寸的合格率為34.1% 34.1%=68.2%

沒有經驗的人可以做統計工作嗎(不懂點統計學怎麼行)14

類似的,如果公差為2mm,合格率為為95.4%

公差為3mm,合格率為99.7%(紅線包在裡面數字相加)。

上面的描述略顯累贅,于是我們定義了過程能力指數Cp

沒有經驗的人可以做統計工作嗎(不懂點統計學怎麼行)15

式中的USL與LSL分别代表公差的上下限(如11mm,9mm)。

然而,在實際中,我們遇到了兩個困難。

a. 産品的平均值不一定恰好等于“μ”稱數學期望

比如上面提到的産品尺寸要求為10±1mm(這是期望),但實際所有産品的平均值可能算出來有偏差,比如是13mm。

沒有經驗的人可以做統計工作嗎(不懂點統計學怎麼行)16

為了解決這個問題,我們在Cp後面跟了個小尾巴k,計算公式也調整為:

沒有經驗的人可以做統計工作嗎(不懂點統計學怎麼行)17

X上面兩橫表示均值,min表示兩個裡面選小的。

b. 我不可能測量所有的産品

注意上面标識出來“σ”為标準差裡講的是“總體”,而實際操作過程中我隻可能取一定數量的樣本而不是整個生命周期所有産品去測量。

這就存在一個樣本去推測總體的問題,其前提是過程穩定(這也是計算Cpk的一個大前提)。

沒有經驗的人可以做統計工作嗎(不懂點統計學怎麼行)18

什麼樣的過程才算穩定呢?其實關鍵是看有沒有“特殊原因”。

那如果過程不穩定怎麼辦?就不能評價了嗎?别急,我們還有其他指标。

4.Cpk、Ppk與Cmk

過程不穩定,表明過程中還有“特殊原因”的幹擾,在一些産品還未正式進入批量時常會遇到(那會兒,屁股還沒完全擦幹淨)。

沒有經驗的人可以做統計工作嗎(不懂點統計學怎麼行)19

完了!屁股沒擦幹淨被發現了!

對于這種情況,我們又創造了過程性能指數Pp與Ppk。其公式分别如下:

沒有經驗的人可以做統計工作嗎(不懂點統計學怎麼行)20

沒有經驗的人可以做統計工作嗎(不懂點統計學怎麼行)21

注意公式中紅框強調出來的“s”,叫樣本标準差,這是與Cpk中σ(總體标準差)最大的區别。

對于此,可以理解成已經不強求一定要推測出總體的能力了(那是Cpk幹的事),所以過程不一定需要穩定。

沒有經驗的人可以做統計工作嗎(不懂點統計學怎麼行)22

聊到現在都是講過程,過程的影響因素有句很有名的口訣叫“人機料法環”。

在新的過程認可時,美國人更加關注初始過程能力(Ppk或Cpk)的研究,而德國人則更加關注“人機料法環”中設備,即機器能力(Cmk)的研究。

沒有經驗的人可以做統計工作嗎(不懂點統計學怎麼行)23

Cmk的計算公式與Ppk完全相同,從此我們也可以看出它同樣不需要過程穩定。這三者的關系如下圖所示。

沒有經驗的人可以做統計工作嗎(不懂點統計學怎麼行)24

Cpk:大批量生産的長期的過程能力控制(重點是組内差異),一般要求>1.33;

Ppk:小批量生産或訂單量不大,可以不連續,(重點是組間差異)一般要求>1.67;

Cmk:新設備、檢修後的設備或新産品試産,對設備能力的評估,至少50件樣品,一般要求>2.0。

5.6σ(六西格瑪)的誤區

相信很多人都聽說過6σ,可是你真的知道它的真正含義嗎?

我們之前在算過σ、2σ、3σ的情況,這裡不妨都羅列一下:

P[|X|<σ] = 68.26 % P[|X|<2σ] = 95.44 % P[|X|<3σ] = 99.73 % P[|X|<4σ] = 99.9936% P[|X|<5σ] = 99.999994 % P[|X|<6σ] 幾乎等于1(次品率約十億分之一)。

沒有經驗的人可以做統計工作嗎(不懂點統計學怎麼行)25

相信有些朋友看到這裡可能會想,嗯,這就對了,6σ就應該是這樣,追求完美,幾乎為1。

但實際上并不如此,十億分之一的次品率沒有企業可以達得到,我們還有個6σ有個3.4ppm的說法。

中間的推導過程這裡就不展示(有近10頁之多),我們需要了解的關鍵詞就是“漂移”

沒有經驗的人可以做統計工作嗎(不懂點統計學怎麼行)26

據資料記載,有美國學者花了近30年時間研究發現,實際的生産流程中會是有數據的“漂移”現象的,經過計算,這種漂移是1.49個标準差(σ),四舍五入的話就是1.5σ。

“漂移” 的原因噪音因子。是長期生産過程中,質量數據的噪音因子是不可避免的,并且是上下波動的;通過大量數據演算,估算出在穩定情況下(僅存在噪音因子)長期質量能力相對短期而言的有一定的偏差,這就是“漂移”。

去除這個1.5σ的漂移,6σ就變成4.5σ了,有興趣的朋友算算看是不是3.4ppm。

以上就是今天的全部内容,有點燒腦。

更多内容,歡迎關注卡爾先生~

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关圖文资讯推荐

热门圖文资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved