嗨咯大家好,我是亮仔
今天我們來虛拟一個任務或者項目來作為制作數據可視化圖表的實例,逐步制作數據可視化分析報表,如果小夥伴沒有基礎也沒關系,制作過程中用到的知識點我都會進行說明,知識點較多,制作的周期會比較長
首先我們假設領導要你做一個銷售分析,我們接到這個任務時,首先和領導确認以下事項:
1、了解分析的目的,是面向哪些人,比如彙報給總裁和彙報給客戶的報表是完全不同的
2、分析的大緻闆塊、主要方向,避免數據分析的方向錯誤導緻返工
3、完成時間,這個直接關系到自己下班是到點跑路還是決戰到天明
所有的東西确認完之後,我們就開始着手準備報表制作的數據
我們的數據一般來源于3個地方:系統導出、公司内部收集及自制、網上獲取。
因為數據來源的不同,數據的格式、字段表頭也不一緻,所以我們需要對數據源進行處理,今天先聊聊數據獲取中存在的一些常見問題及處理辦法
來源一:系統導出我們從公司ERP系統中導出的常見格式一般有3種文件:
1.Excel文件(文件後綴名xlsx、xls)
2.逗号分隔值文件(文件後綴名CSV)
3.文本文檔(文件後綴名TXT)
其他格式日常辦公中不常用,如有需要可自行了解
1、Excel文件
目前系統導出基本是采用這種格式,文件導出後直接使用Excel打開
【亮仔提示】
因數據為系統直接導出,Excel表格内單元格格式可能會全部為文本格式,可使用分列功能進行處理
2、逗号分隔值文件、文本文檔
這兩種文件相對于Excel來講出現的次數會少一點,不過我們還是需要了解下
CSV格式是文件我們可以直接使用Excel打開,然後另存為xlsx文件,
TXT文件使用記事本打開,有2種辦法導入到Excel中
①直接複制粘貼進Excel中,所有數據會在1個單元格中,我們可以使用分列對文本進行分列,從而達到将數據導入Excel的作用
Excel高版本中複制到Excel中可自動識别,無需分列
②使用Excel中數據導入功能
因為系統導出的數據比較規範,在這不過多的闡述,主要聊聊公司内部收集和制作的數據,這部分是問題最大的闆塊。
來源二:公司内部收集及自制因為每個人對數據的理解認知不同,操作習慣也不同,我們收集的數據錯誤會非常多,我整理了5個常見的錯誤,看看你有沒有經曆過
示例一【問題場景】
二維表數據表,這種表格數據看起來非常的直觀,一般用于報表展示,但是不利于數據分析、透視(可以試試将這類數據插入透視表,會得到什麼結果)
【解決方法】
正确的做法是使用Power Query轉換功能,将二維表轉換為一維表,操作方法如圖
最終結果如下圖
【亮仔提示】
Power Query在office2013版本以上才有,2013版本需要下載安裝文件,2016版本以上自帶無需下載
示例二【問題場景】
在我們的數據中經常看到數據中為了方便而進行合并單元格,但這個合并單元格在數據分析中可以說是萬惡之首
【解決方法】
我們可以使用批量填充的辦法解決
這個合并單元格的解決辦法很多,這隻介紹其中一種最簡單的
關于合并單元格後期我會單獨介紹
示例三【問題場景】
示例三是關于數據缺失、數據含有非打印字符,這個是比較細小的問題,但是如果不注意,對于數據分析的結果也是很大的影響
各位小夥伴們看下圖,你會發現什麼問題?
這份數據可以說是很完美,因為是一維表,但是有個細節需要注意
1、在客戶姓名中存在空值;
2、客戶姓名中存在空格
【解決方法】
先用顔色标記,然後再進行逐個解決
可采取替換法
示例四、五
【問題場景】
我們很多時候向分公司、向其他部門收集報表,經常會出現這種情況,
1、一個文件(工作簿)裡面有很多很多個子表,每個表的表頭都是一樣的
2、每個月/人一個文件,收集的壓縮包裡有N多個文件
對于這種分散的數據,我們是不利于數據統計分析的,需要将數據整合到一個工作表中。
【解決方法】
對于需要使用多表合并的場景,我将分享3種解決方法:1、Power Query法;2、WPS合并;3、VBA代碼,由于文章知識點較多且篇幅有限,多表合并我将單獨寫一期
原創不易,希望多多支持
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!