Minitab軟件是為質量改善、教育和研究應用領域提供統計軟件和服務的先導,具有強大的功能和簡易的可視化操作界面,深受廣大質量學者和統計專家的青睐。上世紀90年代後Minitab公司通用統計産品進入工業企業統計應用領域,提供統計過程控制、統計分析、統計圖形的繪制、實驗設計、功效與樣本量計算等豐富的功能,随着軟件版本的提高,增加了更多統計功能,受到了廣大用戶的青睐和采用。
六西格瑪管理中DMAIC模型的第三個階段是分析(A),在量測階段識别了發生什麼(Y)之後,接下來的工作就是通過分析尋找發生問題的原因。即最終确定出一組按重要程度排列的影響Y的因素X1、X2、…、XN。
分析階段所用的方法在很大程度上取決于所解決的問題和面對的業務流程,通常采取數據分析和流程分析相結合的方法。數據分析主要是利用已經收集的數據或為分析而需要收集的數據來分辨問題模式、問題發展趨勢或其他一些有關因素;流程分析主要是從整個流程運行的角度,辨别不一緻的、不相關的或可能引起問題發生或導緻問題發生的某些領域。将各種方法發現的結論放在一起,獲得對影響因素的全面認識。
從六西格瑪管理的角度看,分析階段實現的目标具體說有三個:找出影響項目Y的所有因素;辨别出關鍵少數的因素;評估預測改進效益。分析階段的工具根據工具的類型分為三大類,由頭腦風暴法等組成的定性分析方法、由統計技術支撐的定量分析方法以及由統計技術和管理技術支撐的圖形工具。
圖形分析工具主要包括:比較兩組數據差異的箱線圖、描述因素變量間相關關系的散點圖、顯示影響因素的直方圖、描述影響因素之間關系的多變量圖、從客戶要求、技術、産品要求的角度進行綜合分析的質量功能展開、通過二維圖表分析三個變量間關系的等高線圖、通過流程尋找原因的流程圖等。下面結合Minitab軟件重點介紹箱線圖、散點圖、邊際圖、矩陣圖、等高線圖、多變量圖等。
1、箱線圖
箱線圖的結構如上圖所示,這是使用Minitab軟件自帶數據,樣本相應的4個Q值,這4個Q值依次為:Q1、Q2、Q3、Q4,位于中間位置的數據或兩個數據的算術平均數稱為中位數。
從Graph下拉菜單打開Boxplot主對話框,通過變量的選擇輸入,可以畫一個箱線圖,也可以根據類别變量将每一個類别值的箱線圖畫在同一個視窗中。Datadispaly選項可選擇箱體的類型:InterquartileRange 箱線圖(IQRangeBox)、中位數置信區間箱形圖(CIBox)、樣本全距的箱線圖(RangeBox)。Edit Attibutes 子對話框,可改變箱體的屬性值,如填充顔色、邊線類型、顔色、尺寸、寬度、觸須的顯示與否以及将箱體的寬度設為與樣本大小成比例。Annotation選項還可設定異常點、中位數、均值等的标記屬性。
箱線圖是通過一個或幾個箱形來描述數據分布特征的繪圖工具。在六西格瑪質量管理中,它的主要作用表現在以下兩個方面:比較不同樣本間數據的分散程度與集中程度,找出差異為下一步的判斷和決策提供依據。
對于每個獨立的箱線圖,判斷數據是否有異常點(outlier)的存在,對異常點應重點分析,總結原因。
要建立與分析箱形圖,必須先了解Q值。Q是quartile的縮寫,代表數據的1/4,每一個樣本共有4個Q值,當将樣本數據按由小到大排序後,把這些數據均分為4部分,即Sata目錄下的Pulse.mtw數據集得出的。箱形圖的判讀與分析方法如下:
長方形箱體代表從第一四分位數Q1到第三四分位數Q3的樣本數據,箱體内标出中位數的位置,這樣,箱體包括了一半的樣本數據。本例選擇I QRange Box。
上部觸須與下部觸須的比較可看出數據對稱與否。當下部觸須大于上部觸須說明數據成左偏分布,相反,當上部觸須大于下部觸須說明數據成右偏分布,隻有上、下觸須相等時,數據分布才可能具有對稱性。與正态數據的箱線圖相比較,還可看出樣本數據是否服從正态分布。顯然,本例中左邊的樣本數據成左偏分布,右邊的則成右偏分布。
異常點的判讀。若觀察值位于長方形箱體上下邊的3倍四分位距之外則成為異常點,在箱形圖中以星号*标注,這些值對質量特性的分析影響重大,應特别注意。本例中無異常點出現。
2、散點圖
為了考察兩個變量X和Y的關系,把關于(X,Y)的N對觀測數據值:(X1,Y1),(X2,Y2),…,(XN,YN),描繪在二維直角坐标系中,便形成了散點圖。
在Minitab的Graph下拉菜單下的散點圖Plot對話框中,Y與X欄下分别輸入要分析的因變量與自變量,若兩變量間存在因果關系,則設原因變量為X,結果變量為Y。若要分析多對變量間關系,則在欄下分别按行輸入即可。Data display 選項中可指定分組變量對數據分組,可為每對數據或每一組數據或每個圖表選擇顯示内容(如符号、面積等)。
設定顯示内容的屬性值,在Edit Attributes中選擇實現。Annotation用來指定繪圖的标題、注解、數據标記、異常值标記、中位數和均值标記、直線、多角形與書簽标記等屬性值。Frame可用來指定坐标軸、多圖表顯示、坐标軸的取值範圍等屬性值。Regions選項可設定數據、圖表與圖例的區域屬性值。
從散點圖可以觀察變量X和Y的關系:正相關:Y值随X值的增加而增加;負相關:Y值随X值的增加而減少;不相關:Y值與X值的變化無任何規律可循。
另外,由散點圖還可以知道兩變量間的相關程度;檢驗是否有異常點的情形出現等。
散點圖中點的分布形狀很多,對六西格瑪質量管理人員來講,最感興趣的往往是這些點是否散布在某條直線附近,因為如果這一趨勢出現,就可以通過一個變量的取值去預測或控制另一變量的取值。
這裡的例子使用Minitab軟件自帶數據Pulse.mtw,分析的是變量Weight與Pulse 1的關系,以及反映兩變量各自的分布情況的箱形圖。由二維散點圖可以看出,變量weight與pulse 1間不存在相關關系,即人體脈搏不會因體重的差異而有區别,這也符合現實中人體的生理特征。由變量weight的箱形圖可見有一點為異常點(outliers),處于上限以外,說明有一人的體重較大,通過圖表的編輯功能Brush選項,可查看關于該點的具體信息,對該個體應予重點關注。在變量pulse 1的箱線圖中,無異常點出現,說明觀察對象的脈搏均無不良現象發生。在六西格瑪質量管理分析中,尤其是有關的統計分析,一定要結合實際情況,以防判斷錯誤,例如從數據看,有些變量間存在相關性,并且相關性較強,但現實中兩變量并不相幹,這種相關也成為僞相關。
3、矩陣圖
矩陣圖也是散點圖的一種,可在一張二維圖中,顯現多個變量間的分布關系圖,這樣可在一張圖表中觀察多個變量間的相關性,方便了多個數據間的數據分析,可以節省很多時間。一個矩陣圖最多可以分析20個變量。
4、邊際圖
邊際圖實際上也是散點圖的一種,通過在與Y軸和X軸平行的方向上附帶關于變量Y和變量X的直方圖、箱形圖或點圖的邊際圖,可以對兩變量的分布情況進行個别分析。
産生一個邊際圖,在Graph菜單下的MarginalPlot對話框中選擇即可。在對話框中,分别輸入作為Y軸和X軸的變量Y和X,選擇邊際圖的種類,可在直方圖、箱形圖或點圖中擇一,同時可選擇要做邊際圖的變量,可以隻做變量Y或變量X的邊際圖,也可給兩變量都做邊際圖,另外還可選擇Y軸和X軸的标記以及圖表的标題,來取代默認值。
在Symbol選項中,可為數據點顯示設定屬性值,如顯示的符号、顔色等。
Options對話框中,可用來設定坐标軸的刻度取值,标記屬性值等。如取兩個坐标軸的最大刻度值與最小刻度值相同時,在一定情形下,可使具有相同計量單位的兩個變量更具可比性。
邊際圖包括二維的散點圖和每個變量的分布圖,其中二維的散點圖可用來分析兩變量間的相關性以及兩變量間的聯合分布,而每個變量的分布圖可用來分析各個變量的分布情況。
Graph variables 選項用來指定要分析的變量,其中至少要選擇兩個變量,但最多不能超過20個。使用Minitab軟件自帶數據Pulse.mtw,在該選項中由左側的變量列表選入Pulse1、Pulse2、Height、Weight,可分析這四個變量間兩兩的相關關系。
Options子對話框中的可選項有:列出矩陣全部(默認值)或左下角或右上角的内容;将變量名放在矩陣的對角線位置(默認值)或是在邊界上;為分辨重疊的數據點,加入“Jitter”作數據點的offset,系統默認為不加任何顯示信息。
矩陣圖中每個散點圖所反映相關關系的變量為該散點圖橫向和縱向分别對應的變量。如本例的矩陣圖中右上角的散點圖橫向對應變量Pulse1,縱向對應變量Weight,所以該散點圖反映了變量Pulse 1和Weight間的相關關系。
從該矩陣圖可見,變量Pulse 1與變量Weight和Height間均不相關,變量Pulse2與變量Weight和Height間也均不相關,說明脈搏與體重和身高即人的體形均無關系,符合現實中的實際情況。在變量Weight和Height的散點圖中,一變量值随另一變量值的增加而增加,兩者呈現出明顯的正相關關系,反映了實際情況,一般體重會随身高的增加而增加。
散點圖、邊際圖、矩陣圖都是用來描述兩變量間的相關關系,當隻是分析兩個變量間的關系時,選用一般的散點圖即可;當同時要描述各個變量的分布情況時,選用邊際圖;若要在一張圖表中同時分析多個變量間的關系,選用矩陣圖。各個圖表關于相關關系的分析是一緻的。
5、等高線圖
等高線圖是将三個變量描繪在二維圖表中,若橫坐标和縱坐标分别代表變量X和Y,則第三個變量Z可看作是繪圖平面内/外的延伸,圖中陰影部分代表變量Z的值。
Graph菜單下的Contour Plot是用來做等高線圖的,在其主對話框中,分别輸入變量X和Y、Z,其中的變量X和Y分别設為等高線圖的橫坐标和縱坐标,變量Z則作為第三變量。Data Display 選項可指定數據的顯示形式:區域(Area)或連接線(Connect),同時可指定區域的填充顔色與大小以及連接線的種類、顔色與大小。
使用Minitab軟件的自帶數據Exh_grph.mtw,在Contour Plot主對話框中Z欄下選擇輸入Alt,Y欄下輸入Lat,X欄下輸入Long。選擇Area方塊,并且單擊Attributes,進入對話框,Filltype中輸入1(1=solid),Fill color中輸入4 15 2 5 3,分别代表藍色、灰色、紅色、青色和綠色。
在等高線圖中,陰影是XY平面上由等于z值的線條或線條所圍成的區域所組成。對等高線圖的分析,也主要從這個角度進行。
本例分析的是經度、緯度與海拔高度間的關系。
6、多變量圖
六西格瑪質量管理中,當研究多個指标時,可應用多變量圖形象地描繪變量間的關系。多變量圖是以圖示的方法來呈現連續性數值方差分析的數據,這些圖也可以用于在做方差分析之前,先對數據有一些初步的形象了解。這個圖的實現不是在Graph菜單了,而是在Stat菜單下的Quality Tools下的Multi-Vari Chart。在其主對話框中,各選項和子對話框可實現的功能有:
Response:輸入被解釋變量所在的數據列名稱,該變量必須為數值型;
Factor:輸入因子變量,最多可輸入四個,因子變量可為數值型、文字型或日期/時間型;
Options子對話框:繪圖顯示每個數據點、用直線将每一因子的樣本均值連接起來、設定繪圖輸出标題取代默認值。
使用Minitab軟件的自帶數據Sinter.mtw。這一數據是用來評估三種金屬在強壓下熔渣時間的效應,數據收集過程是在每個熔渣時間:100、150和200分鐘裡分别測量每種金屬的5個樣品,在進行數據分析之前,首先想要以多變量圖看看是否有明顯的趨勢或交互作用。
在輸出的多變量圖中,在每一金屬類型上都有連接三個點的連線,這三個點表示在對應的金屬類型下,各個時間段裡金屬的壓縮強度平均值,也反映了各個金屬類型組内的信息,圖中橫方向連線上的各個點分别代表三種金屬的壓縮強度平均值,代表着各個金屬類型組間的信息。
結果顯示,三種金屬分别對應于熔渣時間的壓縮強度差異較大,說明金屬的種類與熔渣時間的長度有交互作用,與三類金屬的最大壓縮強度所對應的熔渣時間分别為:100分鐘、150分鐘、200分鐘。
若要将因子間的交互作用和其他因子作用量化,可以進一步采用方差分析或一般的線性模式等方法。
文章轉自網絡,如有侵權請聯系删除。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!