相關分析散點圖怎麼做-tft每日頭條

加載數據集和快速浏覽數據

為簡單起見，使用可從scikit-learn庫加載的Iris數據集，輸入以下代碼:

from sklearn.datasets importload_iris import pandas as pddata = load_iris() df = pd.DataFrame(data['data'], columns=data['feature_names']) df['species'] = data['target'] df.head()

相關分析散點圖怎麼做（散點圖箱線圖核密度函數）2

可以看到，我們有一個隻有5列的數據集。使用數據框上的info()函數對其進行快速分析: df.info()

相關分析散點圖怎麼做（散點圖箱線圖核密度函數）3

如圖可見，隻有150個條目，在任何一列中都沒有丢失值。

此外，還可以看到前四列有浮點值，而最後一列隻允許出現整數。事實上，根據數據集描述，我們知道“物種”列隻取三個值，每個值代表一種花。

要确認這一點，可以對該列使用unique（）函數：

df.species.unique() array([0, 1, 2])

确實，“物種”列隻取三個值:0、1和2。

了解了數據集的基本信息之後就可以進行可視化了。請注意，如果列中缺少一些值，應該對其進行删除或填充。我們稍後将讨論的一些技術不允許出現丢失值。

線形圖

從一個簡單的線狀圖開始可視化。選中整個數據框。

df.plot()

相關分析散點圖怎麼做（散點圖箱線圖核密度函數）4

如圖可見，它已經根據索引值(x軸)繪制了不同顔色的所有列值。這是不為函數提供x軸參數時的默認行為。

現在看來這個圖不是很有用。如果x軸是一個時間序列，那麼線圖是一個很好的選擇。我們可能會在數據中看到一些時間上的趨勢。

在本例中，隻能看到數據是按“物種”列排序的(圖中紫色的步驟)，并且其他列的移動平均值遵循該模式（花瓣長度，特别是紅色标記的花瓣長度）。

散點圖

這是一種将兩個連續變量之間的關系可視化的完美圖表。通過散點圖來分析萼片長度和萼片寬度的關系。

df.plot.scatter(x='sepal length(cm)', y='sepal width (cm)')

相關分析散點圖怎麼做（散點圖箱線圖核密度函數）5

為了生成此圖，需要通過其列名來指定圖的x軸和y軸。這個圖表顯示這兩個變量之間沒有很強的相關性。讓我們來檢查另一對萼片長度和花瓣長度:

df.plot.scatter(x='sepal length(cm)', y='petal length (cm)')

相關分析散點圖怎麼做（散點圖箱線圖核密度函數）6

在這種情況下，可以看到當萼片長度增加時，花瓣長度也會增加(當萼片長度大于6厘米時，增加幅度更大)。

餅狀圖

可以使用餅狀圖來可視化目标變量的類計數。我們将在這裡對正在處理的Iris數據集進行處理。同樣需要一些輔助函數，這次使用的是groupby和count。

df.groupby('species').count().plot.pie(y='sepallength (cm)')

相關分析散點圖怎麼做（散點圖箱線圖核密度函數）7

這一類目具有完美的比例，因為我們的數據集包含每個類的50個條目。

注意，必須在這裡使用y參數并将其設置為某個列名。這裡使用了萼片長度列，但它可以是任何列，因為所有列的計數都是相同的。

面積圖

還可以為這個數據集創建一個面積圖。圖中包括所有有厘米的維度，但是要删除“物種”列，因為這些在本例中沒有任何意義。

columns = ['sepal length (cm)','petal length (cm)', 'petal width (cm)', 'sepal width (cm)'] df[columns].plot.area()

相關分析散點圖怎麼做（散點圖箱線圖核密度函數）8

這張圖上的測量值是一個接一個的。這個圖表可以讓你直觀地檢查包含在圖表中的每個度量之間的比率。所有的數值向之後的條目都有一個增長的趨勢。

條形圖

當顯示條目的平均或計數時，這是一個很好的圖表類型。可以用它來計算數據集中每個類型的每個維度的平均值。為此，需要使用groupby和mean函數。

df.groupby('species').mean().plot.bar()

相關分析散點圖怎麼做（散點圖箱線圖核密度函數）9

上圖非常直觀，可以看到不同類型和不同柱的平均測量值存在差異。

箱線圖

箱線圖也是應該用于數值變量的可視化技術。它可以為所有的測量列繪制箱線圖（不包括物種列，因為對于這個分類變量來說，箱線圖沒有意義）。

columns = ['sepal length (cm)', 'petallength (cm)', 'petal width (cm)', 'sepal width (cm)'] df[columns].plot.box() plt.xticks(rotation='vertical')

相關分析散點圖怎麼做（散點圖箱線圖核密度函數）10

如圖所示，所有的箱線圖都畫在同一張圖上。由于沒有太多的變量來表示，所以這對我們來說是很好的。注意，必須旋轉x标簽，不這樣做标簽的名稱會相互重疊。

柱狀圖

柱狀圖對于任何連續變量來說都是一個完美的可視化技術。讓我們從簡單的hist函數開始。

import matplotlib.pyplot as plt df.hist() plt.tight_layout()

相關分析散點圖怎麼做（散點圖箱線圖核密度函數）11

可以看到，這會為數據集中的每個數值變量生成一個柱狀圖。要制作圖表，就不得不添加一些額外的代碼行。這是我調用tight_layout函數的第一個導入行和最後一行。如果不添加這個，标簽和子圖名可能會重疊并且不可見。

核密度函數

與柱狀圖類似，可以使用核密度函數:

df.plot.kde(subplots=True,figsize=(5,9))

相關分析散點圖怎麼做（散點圖箱線圖核密度函數）12

它給出了與柱狀圖相似的結果。必須在這裡指定一個圖形大小，否則圖形會在垂直方向上被壓得太厲害。

此外，還将subplots參數設置為True，因為在默認情況下，所有的列都會顯示在同一個圖表上。

散點矩陣圖

這是我最喜歡的數據分析的可視化技術之一，因為它可以對數據集中的所有數值及其相關性進行快速分析。

默認情況下，它将為數據幀中的所有數字變量對的散點圖和所有數字變量的柱狀圖。

from pandas.plotting importscatter_matrix scatter_matrix(df, figsize=(10, 10))

相關分析散點圖怎麼做（散點圖箱線圖核密度函數）13

你将得到這個繪制精美的平面圖，隻用一行代碼就能告訴你很多關于數據集的信息。在這組數據中，隻需掃一眼就能發現這組數據中的一些變量之間的相關性。唯一需要設置的附加參數是數字尺寸，這是因為圖中的地塊非常小，默認的圖表尺寸很小。

可視化技術是你在數據分析的修煉道路上必不可少的一關，試試将這些知識應用到你所選擇的數據集。把數據玩出花，其實很簡單。

相關分析散點圖怎麼做（散點圖箱線圖核密度函數）14

留言點贊關注

我們一起分享AI學習與發展的幹貨

如轉載，請後台留言，遵守轉載規範

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

科技 fgo全從者寶具排名
fgo這次國服開啟的聖誕卡池，迎來核心UP的從者就是作為綠卡體系核心的拐子，斯卡哈斯卡蒂，作為拐子之一，時至今日基本上綠卡隊已經是趨近于淘汰的邊緣了，雖然官方這才很好心的給了斯卡蒂強化方面的寶具本，但依舊拯救不了整體的頹廢之勢，結合目前的大... 2023-04-04
科技 miui12.5最新版有什麼功能
在昨天發布的MIUI12.5中，MIUI的隐私保護系統進一步強化，增加了智能剪切闆隐私保護和模糊定位兩個新功能。其中智能剪切闆隐私保護，大體作用是曝光哪些應用在讀取剪切闆，并提示用戶同意或者拒絕，又或者系統自己智能放行。模糊定位則是對不需要... 2023-04-03
科技 pdf怎麼把多個文件拆分
PDF拆分成多個文件如何完成？一般一份PDF文件都是由多頁PDF組成的。文件頁數太多，查找起來也很麻煩。很多人在使用這種頁數很多的PDF文件時會先将PDF文件拆分。怎麼将一個PDF拆分成多個PDF文件呢？今天小編就來跟大家分享一下PDF拆分... 2022-11-28
科技 9.22版本雲頂之弈最強陣容
9.22版本雲頂之弈最強陣容?本篇将為大家分享雲頂之弈12.17最強陣容，一定還有很多小夥伴們還不是很了解新版本，也就是12.17版本的強勢陣容都有哪些那麼目前的最強陣容排行是什麼樣的呢，下面就來跟大家一起了解一下，下面我們就來聊聊關于9.... 2022-10-07
科技用wintogo做的u盤系統能上網嗎
大家好，分享君今天分享的軟件名為WinToGo，這是一款制作U盤系統的小工具。可以将你喜歡的計算機系統直接安裝到U盤，也可以将系統安裝到其他存儲設備。不僅節省了計算機存儲空間，随身攜帶U盤，無論你在哪裡，隻要有電腦都可以使用它！特别是計算機... 2023-03-23
科技解讀腦膜炎患者的人工耳蝸植入
“國産人工聽覺腦幹植入系統”8日完成成果轉化簽約。奚榮佩攝“國産人工聽覺腦幹植入系統”8日完成成果轉化簽約。奚榮佩攝中新網上海7月8日電(陳靜賈歡)中國醫學專家研發的“國産人工聽覺腦幹植入系統”8日完成成果轉化簽約，該成果以專利技術許可的方... 2023-01-24
科技電腦上怎麼設置一個加密文件夾
你會加密電腦文件夾嗎？還在用Windows自帶的EFS加密方法嗎？今天小編就帶你來了解一種加密效果更加安全，操作方法更加簡單的加密方法，讓你的文件夾更加安全。文件夾加密超級大師文件夾加密超級大師是一款專業的電腦數據加密軟件，可以為文件夾提供... 2023-04-03
科技安裝皮革烘幹機時需要注意哪些
皮革烘幹機廣泛運用于皮革制品及做鞋、皮具及箱包皮具、膠手套及遮陽帽、加工工藝及絲花、刺繡、吸朔與包裝、包裝印刷與紙制品、文具用品、塑料化工廠、轎車和電子器件等以及它輕工業産業鍊。那麼在安裝皮革烘幹機時需要注意哪些？在安裝皮革烘幹機的過程中需... 2023-03-27
科技攝影愛好者怎樣選相機閃光燈
以下文章來源于糖皮網，作者糖皮-鄧小糖糖皮網專注于攝影器材評測、閃光燈評測、閃光燈攝影教學、分享。我們的口号是因為分享，所以更強！因為分享所以更強大家好，我是鄧小糖，上期的手機攝影之宜家小花瓶不知道大家看了沒有，内容很精彩，所以老暫就讓我來... 2022-12-01
科技設備維修管理軟件哪個好
設備管理是工業制造業領域的一項重要工作，甚至與生産管理同等重要。傳統的設備管理模式都是人工管理各種記錄，紙質文檔保存台賬信息；但是随着時間的推移，設備越來越多，各種曆史數據保存不便，導緻管理上的矛盾逐漸增加。在這樣的背景下，設備維護管理系統... 2023-02-23
科技 win10鬧鐘與時鐘
手機上很容易設置鬧鐘、時鐘、倒計時、秒表等，但以往要在WindowsPC中設置這些項目，往往需第三方軟件的協助。現在，我們使用新版Windows10的“鬧鐘和時鐘”應用，就可以輕松實現上述任務。1.輕松随意設鬧鐘要設定一個鬧鐘，點擊“鬧鐘”... 2023-02-17
科技戴爾筆記本電腦類型大全
據宅秘了解，戴爾于8月17日，在韓國市場推出了全新一代Chromebook——戴爾Chromebook3110toinone，該産品是戴爾首次在韓國市場推出的教育用筆記本電腦。戴爾Chromebook3110toinone據悉，這款産品搭載... 2023-03-23
科技迪麗熱巴連續幾年全球最美面孔
近日，外國網站發布2023全球最美女演員排名，迪麗熱巴獲得第一。, 2023-03-24
科技用什麼軟件可以去除水印
什麼軟件能去掉視頻水印？很多小夥伴在觀看視頻的時候，特别喜歡電影或者電視劇中的一個片段，想要截取下來，設一個朋友圈背景或者動态壁紙等等，這時候我們點擊下載，就能發現在平台下載下來的視頻都是有水印的，那這個時候我們該怎麼辦呢？小編下面就教大家... 2022-11-09
科技語音轉文字有沒有什麼好的軟件
作者|江下科技有哪些可以把語音轉文字的軟件處理錄音文件時是小編近段時間來最頭痛的事了，會議上領導們的滔滔不絕，就很挑戰本人的打字實力，小夥伴們是不是也像小編一樣在快速書寫筆記或敲打鍵盤的記錄過程中而感到十分無助呢？遇到這種情況，小夥伴們可以... 2023-03-14
科技電腦上的文件夾怎麼加密
電腦中的那些重要文件夾，都需要我們進行合理的保護，而最簡單有效的方法就是進行文件夾加密。那麼我們該怎麼加密電腦中的文件夾呢？方法一：WindowsEFS加密EFS加密是Windows自帶的加密方法，被加密的文件夾将會隻允許該用戶登錄訪問，其... 2023-04-03
科技廈門什麼時候有移動5g
昨日上午，中國電信股份有限公司廈門分公司（簡稱“廈門電信”）在濱北營業廳、江頭營業廳同時開售首批電信5G商用手機之一——華為Mate20X（5G）。市民莫先生成為廈門電信首位5G體驗客戶，“不換卡不換号不換套餐”，便能輕松享有5G高速暢玩體... 2022-12-09
科技華為手機怎麼在屏幕桌面顯示天氣
對于許多經常滿地跑的網友而言，最重要的事情之一莫過于了解當地的氣候。一般情況下，我們都是通過手機的天氣插件進行查看的。那麼是不是有更加直觀的方法可以顯示我們常去城市的天氣呢？答案是有的。今天數碼日記君就給大家說說，如何讓手機桌面顯示2個城市... 2022-12-11
科技 iqoo手機怎麼拍月亮
iqoo手機怎麼拍月亮?所有手機拍攝月亮基本流程都是一樣的，iqoo手機拍月亮隻需要稍加設置打開相機将拍攝模式設置成專業模式，将專業lso調成200，S調成1/8000，然後對準月亮、放大，放大倍數多的能拍攝的好一點然後調大光圈增加進光量，... 2022-06-08
科技踢足球孩子聰明嗎
現在有不少父母都挺喜歡向身邊的朋友展示自家的孩子到底有多優秀，而炫耀的方式就像提前商量好了一樣，雖然嘴上謙虛得不得了，心理卻不知道有多麼的優越。這就是大家經常說的凡爾賽式秀娃。那麼很多朋友就會問了，什麼是凡爾賽呢？凡爾賽其實就是用最謙虛最低... 2022-11-25
科技淋浴器多少尺寸合适
淋浴器多少尺寸合适?“三分質量七分裝”，再好的産品安裝之前，也隻能算個半成品很多事故或者問題經檢查，産品質量沒問題，而是安裝使用時的粗心造成的雖然現在商家都有一條龍服務，淋浴器安裝也有專業師傅負責，如果安裝過程中出現了問題，業主隻有裝前仔細... 2023-01-15
科技輿情監測軟件算不算信息系統
輿情監測系統，是為應對當今網絡輿情而形成的輔助工具，目的是讓企業快速收集輿情信息，充分應對輿情危機。近年來，輿論呈現出一定的趨勢：傳播速度更快，破壞性更強。所以企業購買輿情監測系統是必不可少的，以消除或減輕輿情造成的損害。輿情監測系統是一個... 2023-03-16
科技被稱為00後老師的日本女演員
日前，早已“上岸”嫁為人婦的“硬盤女神”蒼井空老師又來搞事情了，在微博上發了幾張美美的浴室照，側顔殺無敵，并配文：“我最近在浴缸裡記住電視劇的台詞”，瞬間讓人遐想無邊。對于“硬盤女神”老師送上的福利，廣大粉絲宅男自然照單全收，紛紛在微博下留... 2023-04-02
科技筆記本換硬盤運行能變快嗎
從理論上講，老式筆記本的機械硬盤換成固态硬盤，是能夠加速電腦的運行速度的，但是可惜的是，電腦的運行速度是能加快的，但是并不明顯，這種升級改造或者說升級意義并不是很大。而且筆記本電腦這種電子産品，其更新換代是非常快的，一台老的筆記本電腦基本上... 2023-03-26
科技唇紋深适合啞光口紅還是唇釉
對于啞光唇妝的執着，在于啞光的質感，大抵是那種讓人有着無法忽視的高級感。如果說口紅的顔色是心情的表達，那麼質感就代表着一種内核的精神，畢竟高級不是一種能夠輕而易舉就得到的東西。啞光唇妝效果自帶高級感愛美的小仙女們，大家好。今天給大家帶來5款... 2022-12-29
科技單反讀卡器連接手機讀取
如果想把單反照片拷貝到手機上，發朋友圈，要怎麼做？很簡單，第一部相機打開WiFi，第二部手機連接相機WiFi，第三部手機打開APP下載照片。但是，如果像我一樣，用尼康D610，或者D3400，趕巧了，就是不帶WiFi的，那怎麼傳照片到手機發... 2022-11-23
科技怎樣用華為手機nfc坐地鐵在石家莊
怎樣用華為手機nfc坐地鐵在石家莊?打開華為錢包在交通卡選項點擊“+”按鈕既可以開啟石家莊一卡通，現在小編就來說說關于怎樣用華為手機nfc坐地鐵在石家莊?下面内容希望能幫助到你，我們來一起看看吧!怎樣用華為手機nfc坐地鐵在石家莊打開華為錢... 2022-06-12
科技旋耕機耕不同的地形怎麼耕
電機動力強勁，操作靈活，多功能的設計讓它更加的使用，而且耐用。多功能微耕機，電機動力強勁，一機多用，松土、翻地、除草等，輕松搞定體積小，重量輕，結實耐用，可秒斷樹幹，輕松鋸木斷枝。采用優質的鋼材材質，剪切時鋒利省力，非常鋒利的修枝剪提高工作... 2023-01-24
科技新手如何安裝win7系統
（可以打開上面背景音樂，放松心情閱讀）昨天電腦有死機了，藍屏0x000007B代碼，檢查後沒辦法，隻得重新安裝了系統。我們每人的電腦，不管是中小企業管理人員還是個人創業者或學生等，平時使用電腦時免不了出現問題，找人安裝又需要時間和金錢，對于... 2022-11-29
科技水桶機什麼意思手機
水桶機什麼意思手機?手機水桶機指的是各項配置都均衡的手機，我來為大家講解一下關于水桶機什麼意思手機?跟着小編一起來看一看吧!水桶機什麼意思手機手機水桶機指的是各項配置都均衡的手機。改詞出自2018年3月15日也就是紅米Note5發布的前一天... 2022-07-07

tft每日頭條

> 科技

> 相關分析散點圖怎麼做