python中數學統計方法-tft每日頭條

python中數學統計方法

科技更新时间:2026-08-02 14:31:55

第六節散點圖

在上一節中，我們看到了一個散點圖的例子，它可以使我們看到兩組數字之間存在相關性的初步迹象。在本節中，我們将通過查看包含4組數據的數集來分析散點圖的重要性。對于這個數據集，傳統的統計量結果都是相同的，但每個數據集的散點圖顯示出重要的差異。

首先來看看如何在Python中創建一個散點圖：

>>> x = [1, 2, 3, 4] >>> y = [2, 4, 6, 8] >>> import matplotlib.pyplot as plt >>> plt.scatter(x, y) <matplotlib.collections.PathCollection object at 0x000001A8088089E8> >>> plt.show()

scatter()函數用于在兩個數字列表x與y之間創建一個散點圖。這個圖與我們第二章學到的繪制圖形相比較，唯一的區别在于不使用plot()函數，而是使用scatter()。同樣，必須調用show()函數來顯示圖形。

要了解更多散點圖的信息，我們來看一個重要的統計學研究：統計學家Francis Anscombe 的統計分析圖。該研究考察了4各不同的數據集，稱為Anscombe四重奏，他們具有相同的屬性：均值，方差和相關系數。

數據集如下表所示（從原始研究轉載）。

python中數學統計方法（Python數學編程第三章）1

Anscombe四重奏

我們分别将（X1，Y1）、（X2，Y2）、（X3，Y3）和（X4，Y4）稱為數據集A、B、C和D。下表顯示了四舍五入到兩位小數的數據集統計量。

python中數學統計方法（Python數學編程第三章）2

Anscombe四重奏的統計量

各個數據的散點圖如圖所示。

python中數學統計方法（Python數學編程第三章）3

Anscombe四重奏的散點圖

如果我們僅僅看傳統的統計量，如均值、标準差和相關系數，這些數據集幾乎是完全相同的。但散點圖顯示這些數據實際上差異非常大。因此，散點圖是一個重要工具，在得出數據集的任何結論之前，他應該與其他統計量一起使用。

第七節從文件中讀取數據

在本章的所有程序中，我們在計算中使用的數字列表都是自己輸入到程序中的。如果你想計算不同數據集的統計量，你必須在程序中輸入整個新的數據集。還學習了如何使程序提示用戶輸入數據并将輸入的數據作為輸入參數，但是對于大數據集，讓用戶在每次使用該程序時都輸入長的數字列表并不方便。更好的選擇是從文件中讀取用戶數據。我們來看一個簡單的例子，介紹如何從文件中讀取數字并對其執行數學運算。首先，我将演示如何從一個簡單的文本文件中讀取數據，文件的每一行包含-一個新的數據元素。然後，我将向你展示如何從以 csv格式存儲數據的文件中讀取數據，這将拓展很多應用，因為有大量有用的數據集可以通過CSV格式從網上下載。

3.7.1 從文本文件中讀取數據

我們先來看一個文件mydata.txt，它包含我們在本章一開始就講解的捐贈列表（一行一個數字）

100 60 70 900 100 200 500 500 503 600 1000 1200

以下程序将讀取該文件并輸出文件中存儲的數字的總和。

# find the sum of numbers stored in a file def sum_data(filename): s = 0 with open(filename) as f: for line in f: s = float(line) print('Sum of the numbers : {0}'.format(s)) if __name__ == '__main__': sum_data('mydata.txt')

首先打開filename指定的文件，并逐行讀取（f為文件的對象，你可以使用它來指代打開的文件）。打開後将裡面的每行數據轉為浮點數，然後相加求和，直到讀取完所有的數據。最後一個數據（标簽為s）包含數字的總和并在執行結束時輸出

運行程序前，在.py文件同目錄下需要有一個名為”mydata.txt“文件，其中數據内容為上述剛剛提到的捐款清單，運行程序：

Sum of the numbers : 5733.0

本章中的所有程序都是從列表中讀取數據。要讀取文件中的數據并且複用之前的代碼，我們可以将文件中的數據讀取出來然後創建一個列表來存儲數據，然後既可以使用之前的代碼啦。以下程序可以計算存儲在mydata.txt文件中數字均值：

''' Calculating the mean of numbers stored in a file ''' def read_data(filename): numbers = [] with open(filename) as f: for line in f: numbers.append(float(line)) return numbers def calculate_mean(numbers): return sum(numbers) / len(numbers) if __name__ == '__main__': numbers = read_data('mydata.txt') mean = calculate_mean(numbers) print('Mean : {0}'.format(mean))

可以看到，我們在調用calculate_mean()函數之前，先把文件中的數據讀取出來，轉成浮點數後存儲到一個列表中，然後傳入calcula_mean()函數進行求均值，剩下的部分之前已經說過，此處不再贅述。

運行程序：

Mean : 477.75

對于mydata.txt裡面的數據，大家可以多做一些修改來試試。

當然也可以做一些修改，就是可以讓用戶輸入輸出文件名稱，這樣用戶就可以指定數據文件。

3.7.2 從CSV文件中讀取數據

如果把一個csv文件使用記事本打開的話，我們就可以看到，csv文件值之間使用逗号分隔，也就是列和列之間用逗号分隔。

以下是一個csv文件樣本，其中包含幾個數字以及他們的平方。

Number,Squared 10,100 9,81 22,484

第一行為列名稱。在本例中告訴我們，第一列為數字，第二列為他們的平方。接下來包括三行數據，每行的值之間使用逗号隔開。可以使用類似于.txt文件的讀取方式來讀取數據。但是，Python的标準庫有一個用于讀取（和寫入）csv文件的專用模塊（csv），這個模塊可以讓讀取變得更容易一些。

将以上數據保存到名為numbers.csv文件中，并與程序放到同一目錄下。以下程序演示了如何讓讀取此文件，然後創建一個散點圖來顯示數字與其平方值。

import csv import matplotlib.pyplot as plt def scatter_plot(x, y): plt.scatter(x, y) plt.xlabel('Number') plt.ylabel('Squared') plt.show() def read_csv(filename): numbers = [] squared = [] with open(filename) as f: reader = csv.reader(f) next(reader) for row in reader: numbers.append(int(row[0])) squared.append((int(row[1]))) return numbers, squared if __name__ == '__main__': numbers, squared = read_csv('numbers.csv') scatter_plot(numbers, squared)

read csv()函數使用csv模塊（在程序開始時導入）中定義的reader()函數讀取CSV文件（可以理解為使用csv方式打開），調用該函數，将文件對象f作為參數傳遞它。然後，該函數返回一個指向CSV文件第一行的指針(pointer)。我們知道文件的第一行是标題，我們要跳過，所以我們使用next()函數将指針移動到下一行。然後，使用for循環讀取文件的每一行，每一行由标簽row 指代，row[0]指代數據的第一列， row[1]指代第二列。對于這個特定的文件，我們知道這兩個數字都是整數，所以我們使用int()函數将它們的類型從字符串轉換為整數，并将它們存儲在兩個列表中。返回結果是一個包含數字，另一個包含平方值的兩個列表。

然後我們使用numbers和squared這兩個列表作為參數來調用scatter_ plot()函數，創建散點圖。我們之前寫的find_corr_x_y()函數也可以很容易地用于計算兩組數字之間的相關系數。

現在我們來處理一個更複雜的CSV文件。在你的浏覽器中打開Google Correlate的頁面，輸入你想搜索的任何查詢(例如，夏天)，然後單擊搜索相關按鈕。你将看到在“與夏天相關”标題下返回了一些結果，第一個結果是相關性最高(每個結果左邊的數字)。單擊圖形上方的“散點圖”選項可查看散點圖，其中x軸标記為夏天，y軸用頂部結果标記。忽略在兩個軸上繪制的精确數字，因為我們隻對相關性和散點圖感興趣。

在散點圖上方，單擊“導出數據為CSV"，文件下載将開始。将此文件保存在與程序相同的目錄中。

此CSV文件與我們之前看到的文件略有不同。在文件的開頭，你會看到一些空行和帶有#符号的行，直到最後你會看到标題和數據。這些行對我們來說是沒有用的，使用能打開CSV文件的任何軟件，手動删除它們，使得文件的第一行是标題。你還需要删除文件末尾的空行。然後保存文件。在這個步驟中，我們清理了文件以便能更簡單地使用Python執行操作，此步驟通常稱為預處理數據。

标題有幾列，第一列包含每行中數據的日期（每行的數據對應于此列中日期開始的周數），第二列是你輸入的搜索查詢，第三列顯示與你的搜索查詢相關性最高的搜索查詢，其他列包含與你輸入的搜索查詢按相關性降序排列的其他多個搜索查詢。這些列中的數字是相應搜索查詢的z分數。z分數表示在特定周期間搜索詞語的次數與該詞每周的總平均搜索次數之間的差異。正的z分數值表示搜索次數高于該周搜索次數的均值，負的z分數值表示低于均值。現在，我們隻處理第二和第三列。你可以使用read_csv()函數來讀取這些列，隻需修改上述代碼中的read_csv()函數，并且修改也很簡單，讀取第二列和第三列，并且将其轉為浮點數即可。

def read_csv(filename): summer = [] highest_correlated = [] with open(filename) as f: reader = csv.reader(f) next(reader) for row in reader: print(row) summer.append(float(row[1])) highest_correlated.append((float(row[2]))) return summer, highest_correlated

然後加入到剛剛程序中，即可繪制出你輸入和搜索和與其相關性最高的搜索的散點圖：

python中數學統計方法（Python數學編程第三章）4

Summer與Highest_correlataed的散點圖

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

科技 teniodl.exe是什麼進程
1、這個是遊戲的一個下載進程,隻要進行下載騰訊的遊戲或安裝時都有的,該進程不會自動退出。2、此進程會... 2023-07-13
科技手機電池鼓了怎麼放氣
1、先放幹電池電量，可把電池靜置幾天。2、剝皮抽筋露出電芯，選一個不容易碰着極闆的邊角切一小口子放氣... 2023-07-13
科技魅族手機全部型号
1、魅族M8；型号：M8，2009年2月18日正式上市，M8公測版（帶wifi無入網許可）；M8正式... 2023-07-13
科技怎樣用手機驗鈔票
1、方法一：相機放大紙币上的小字。1、可以說人民币屬于精密印刷，肉眼幾乎無法辨别的小字就是一項防僞技術，首先我們将紙币反面朝上，找到小字的位置。2、打開手機相機，對準小字部分，然後放大圖片，你會明顯看到大量<；RMB100>；的重複字樣，很精緻，可以通過看這些小字的清晰度辨别真假。2、方法二... 2023-07-13
科技 vivo新手機充電方法
1、vivo手機的電池激活過程在出廠前已完成。2、購機後第一次充電無需将電量全部用完，在手機提示“電... 2023-07-13
科技草木灰可以栽種蟹爪蘭嗎
1、雖然草木灰成為營養全面的農家有機肥，但是由于呈現堿性的原因，并不是所有的花卉植物都能使用。2、其次，蟹爪蘭喜歡富含有機質的微酸性土壤，忌諱土壤出現堿性或者中性的情況。如果使用草木灰作為底肥，或者混合土壤種植，那麼就會阻礙根系進行呼吸，從而導緻植株不生長、不開花，或者枯萎的情況。3、最後，蟹爪蘭喜... 2023-07-13
科技對方微信号己被限制登錄我發朋友圈他能...
1、對方微信号己被限制登錄，你發朋友圈他不能看到的。2、微信（WeChat）是騰訊公司于2011年1... 2023-07-13
科技蘋果平闆密碼忘了怎麼辦
1、通過iCloud還原如果用戶在自己的iPhone或iPad上啟用了“查找我的iPhone”功能，... 2023-07-13
科技單招考的是大專還是本科學校是什麼學曆
每年都有很多人參加單招考試，那麼單招是專科還是本科?下面是由本站編輯為大家整理的“單招考的是大專還是本科學校是什麼學曆”。單招是專科還是本科單招一般是專科層次的院校招生的一種方式，但是也有的省份自主招生也叫單招，具體還是要看考生是哪個省份的，一般專科的單招分數線不高，基本上200分左右就可以上，本科... 2023-07-13
科技聲卡驅動的正确安裝方法
1、開始之前，我們需要先打開設備管理器，展開聲音、視頻和遊戲控制器，确定您設備對應的聲卡型号。2、右... 2023-07-13
科技小愛音箱怎麼連接藍牙
1、首先打開小愛音箱軟件，接着點擊我的”，選擇藍牙設置。2、在這裡可以開關藍牙，接着點擊音響藍牙和可被發現的開關。3、然後進入手機設置應用點擊藍牙選項，在裡面點擊小米AI音箱，即可成功連接。 2023-07-13
科技孩子幾歲開始學才藝學什麼才藝
第一、繪畫比較安靜，對畫畫又感興趣的孩子，可以讓她學習繪畫，由淺及深，不但增加孩子的涵養性，更能讓孩子發現生活中的美。第二、舞蹈形體好的孩子，可以讓她學習舞蹈，學習舞蹈，可以提升一個人的氣質，使身體更挺拔、優美，孩子将受益終生。第三、音樂如果孩子嗓音條件好，或是對音樂悟性高，可以讓孩子學習音樂，讓孩子領略到音樂世界的美好，既能當愛好，也能當職業。第四、武術如果孩子特别好動，精力充沛，可以讓孩子學習 2023-07-13
科技玉樹如何修剪
1、冬季修剪：冬天是玉樹休眠的時期，這時候需要将它剪短一些，并剪掉其上多餘的枝條和葉片來減少養分的消耗。這樣能夠讓它更好的過冬。2、春季修剪：春季是它生長比較快的季節，這時候需要根據它的狀況和花主的喜好進行修剪。如果想讓它長得更加圓潤，可以将頂部的枝葉剪掉，來促進側芽生長。另外，如果有覺得不好看的枝... 2023-07-13
科技 ppt怎麼下載
1、officeplus官方網站：這個網站是微軟官方的集PPT、Word、Excel、圖片素材于一體的，無需登錄，直接下載。2、第一PPT網站：這個網站每天會從各大PPT模闆網站中更新免費的PPT作品，相當于篩選過一次，也是免費的，質量一般般。3、銳普PPT論壇：10多年的曆史積累，有大量的免費圖片... 2023-07-13
科技風神奕炫有什麼缺點
1、尾門沒有設置開啟按鍵，與大多用車習慣相悖，稍有使用不便。噪音方面，高速胎噪會明顯些。2、變速箱響應慢，起步時會有1秒以上的思考時間，拖慢駕駛節奏。3、輪胎抓地力較差，在賽道中非常容突破輪胎抓地極限。如果日常用車的影響不大，另外後排中間地闆凸起的較高，作為家轎一家人出行這是硬傷。 2023-07-13
科技懷孕老是吐怎麼辦
第一、空氣清新大多數女性在懷孕後，身體的各個方面便會發生較為明顯的變化，對于氣味也比普通人敏感許多，若平時仍舊處于彌漫着刺鼻氣味的室内的話，如油漆味，油煙味等，不僅會導緻惡心，嘔吐，嚴重的還可能對胎兒的發育造成影響。建議大家平時一定要注意做好通風工作，如早晚開窗等，以确保室内的空氣保持流動性，進而改善孕吐。第二、喝山楂水由于先天因素的影響，使得我們每個人的體質都變得有所不同，對于各方面都特别敏感的 2023-07-13
科技電腦被鎖定怎麼解鎖
1、重新啟動計算機，開機後按下F8鍵不動直到高級選項畫面出現後，再松開手，選擇命令提示符的安全模式”按回車。2、運行結束後，系統會列出了超級用戶administrator”和其他用戶的選擇菜單，單擊administrator”，進入命令行模式。3、輸入netuser用戶名666666/add”按回車，強制将該用戶的密碼改為666666。4、重新啟動計算機，用新密碼登錄。 2023-07-13
科技黑屏顯示時間怎樣設置
1、打開手機【設置】——找到【顯示】選項。2、點擊進入顯示設置頁面，看到底部有一個“滅屏顯示”開關，... 2023-07-13
科技華為nova5pro跟華為榮耀20p...
1、外觀區别。華為nova5Pro采用和華為P30類似的珍珠屏設計，6.3英寸屏幕大小，分辨率為2340*1080，支持屏下指紋識别。榮耀20Pro則采用了魅眼全面屏設計，6.26英寸屏幕大小，分辨率為2340*1080，支持側面指紋識别。2、在配色方面，華為nova5Pro提供了绮境森林、仲夏紫、... 2023-07-13
科技 vivo手機恢複出廠設置在哪裡找
以vivoX27Pro，FuntouchOS3.2為例：點擊“齒輪”圖标打開手機設置。在設置中找到“更多設置”。在更多設置中找到“恢複出廠設置”。點擊恢複出廠設置，在恢複出廠設置中，點擊“還原所有設置”。繪制解鎖圖案，清除所有手機設置（還原所有設置不會删除任何數據，隻會改變設置參數）。點擊“ 2023-07-13
科技醫學檢驗技術專業主要課程及就業方向
在高考志願填報時，很多考生對醫學檢驗技術專業的就業方向有哪些的問題很關心。下面是由本站編輯為大家整理的“醫學檢驗技術專業主要課程及就業方向”。醫學檢驗技術專業主要課程主要課程為：有機化學、無機化學、物理化學、生物化學、分子生物學、醫學統計學、分析化學、檢驗儀器學、生理學、病理學、系統解剖學、局部解剖... 2023-07-13
科技柑橘采收有哪些注意事項
1、天氣要合适：采摘柑橘時不是說随時都可以采摘的，需要看天氣情況，天氣不好的話采摘後會給果樹造成較大的影響，其次也不利于采收。下雨、刮風、大霧的天氣采摘時風險較大，不适合戶外操作，如果露水比較大的，需要遲一點采摘，等露水幹了再采摘，不然容易導緻果樹感染病害。一般以晴朗或者陰涼的天氣采收最适合，這樣除... 2023-07-13
科技為什麼抖音看不到評論
1、一般情況下是網絡出了問題，打開控制中心，将WiFi或移動數據打開，重新點擊評論圖标，即可查看評論... 2023-07-13
科技 xp如何取消開機密碼
1、鼠标單擊開始菜單，選擇控制面闆，點擊用戶賬戶，單擊需要取消開機密碼的賬戶，選擇更改我的密碼，鍵入... 2023-07-13
科技圖片水印怎麼去掉
相信大家在網上都找過圖片，一定都遇到很多漂亮的秃圖片都有水印，由于不知道怎麼把水印去掉，隻能找另外的圖片的，所以，今天小編來帶大家學習圖片水印怎麼去掉，隻要學會這一技能，以後圖片水印去水印就沒壓力啦。第一步：把要去除水印的圖片直接從桌面拖進PS，如下圖。第一種去水印方法：填充工具去水印。用選取工具選取水印1（圖中所用矩形選取工具），左單擊上方編輯，選擇填充工具。快捷鍵（shift+F5）直接按en 2023-07-13
科技如何關閉qq圖标
1、我們在打開QQ面闆的時候,會看到很多已點亮的圖标。2、如果想要關閉這些圖标,我們可以在打開的QQ... 2023-07-13
科技電腦怎麼關機
1、打開電腦，點擊左下角的開始”鍵。2、找到并點擊關機”按鈕即可關機。3、在鍵盤上找到開始的圖标，點擊鍵盤上的按鈕”，之後再點擊鍵盤上的X”按鈕，電腦即可關機。 2023-07-13
科技闆式抱閘調試說明
1、調節電磁抱閘前端上的螺絲，來使頂杆于足夠的長度，頂住電磁鐵。2、調節電磁抱閘的彈簧螺絲，保證其的... 2023-07-13
科技鏟車黃油打不進去妙招
1.可根據裝載機周圍環境而調整擺放姿勢。2.拿出黃油槍,帶上手套,将黃油槍頭用力擠壓入黃油嘴,此時黃... 2023-07-13
科技台式電腦密碼忘記了打不開怎麼辦
1、以管理員賬戶登錄：1.登錄：如果管理員Adminstartor帳号沒有設置密碼，可以在開機登錄界... 2023-07-13

tft每日頭條

> 科技

> python中數學統計方法

python中數學統計方法

相关科技资讯推荐

热门科技资讯推荐

网友关注