大家好,我是dk。這是Excel神器PowerQuery實戰入門系列的第3篇。往後,我會更新更多關于PQ的相關内容,有興趣的小夥伴可以關注下。
衆所周知,Excel2003版最大行數是65536行,到了2007及之後的版本最大行數是1048576行,也就是說1百萬的數據,已經是Excel處理數據的權限了。事實上,Excel在處理30萬左右的數據時,用公式或操作都會很慢,還經常會卡機。
不過,有了Power Query,幾百萬的數據,也能實現統計和查詢。(據官方介紹,Power Query可以處理上億的數據,前提是你的内存足夠大。)下面舉個例子:導入一個約為200萬行的數據,進行統計。
大家可以跟着我一起操作:
Step1:導入TXT。新建一個空白工作簿,點選【數據】選項卡中的【從文本/CSV】(見下圖) ,點擊後會彈出【導入數據】對話框,從對話框中找出文件所在路徑,選中【百萬到億級數據,快速統計查詢.txt】,進入【導航器】對話框。
Step2:設置分隔符。
在【導航器】中,我們可以預覽文件數據,Power Query會自動檢測文件的格式,分隔符,數據類型。這些Power Query都自動檢測完成,少數情況需要自己修改下分隔符,然後點擊【編輯】進入Power Query。
Step3:加載到數據。
數據加載到Power Query後,我們就可以進行一些簡單的查詢,比如,要查詢數據中,尺子有多少筆,數量總共是多少?選擇對應列【産品】篩選尺子,根據彈出的對話框,尺子的左邊打鈎,按确定結束。(界面與操作跟Excel上是一樣的)。
結果返回了列【産品】是尺子的所有數據,選中列【數量】,點選【轉換】選項卡中的>>【統計信息】>>【值計數】>>返回結果:574253,這代表了尺子的行數。
如果要知道尺子的總數量,在右邊【查詢設置】>>點選【篩選的行】返回上一步的操作>>選中【數量】這一列,點選【轉換】選項卡中的>>【統計信息】>>【求和】>>返回結果:4598525,這代表了尺子的數量之和。
Step4:删除步驟。
上面的查詢隻适用于少量的查詢統計,如果查詢統計的項目多,并不建議用這個方法。這時候我們可以借助數據透視表來查詢統計。首先,把多餘的步驟删除,點擊【篩選的行】>>【計算的總和】>>【計算的計數】前面的X,删除掉,返回未篩選前的數據。
Step5:加載到數據透視表。
點選左上角的【文件】>>【關閉并上載至】>>【數據透視表】>>按确定結束。
Step6:透視表操作。
數據加載200萬行後,會在左面出現空白的透視表區域,右邊數據透視表字段列表,可以拖動和設置。大家自己嘗試一下就好。
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!