1.1 觸手可及的數據
經過三次信息化浪潮的洗禮,将生活的點滴進行數字化記錄和存儲,已經變得司空見慣。将一天中的美好瞬間記錄成數字化圖片,錄下小寶寶剛剛學會走路的可愛影像;或者用apple watch記錄下心跳,用以規律的運動和飲食;或者用便攜式電子設備記錄下血糖數值,科學指導用藥。到如今,虛拟現實(VR)和增強現實(AR)已經開始模糊數字化世界和真實的世界,新興起的腦機接口技術則将人類帶向了人機融合的未來。人類正在朝着比特化生存的大路狂奔而去,未來難以确定,但是有一點可以肯定的是,您的生活正在被量化。
相比于個體的人來說,企業組織則早就是數字化革命的先鋒。從最早的業務電算化,到業務信息化的發展過程中,企業就創建了大量基于軟件和互聯網的業務系統。如今ERP、CRM等信息系統,更是企業的标配,一些大型企業集團經過20多年的信息化建設,甚至形成了幾十種、數百種業務信息系統,而這些用比特記錄的業務系統的點點滴滴正在形成龐大的數據池。
據IDC預測,全球數據總量預計2020年達到44個ZB,我國數據量将達到8060個EB,占全球數據總量的18%。物聯網,5G技術的普及,工業4.0水到渠成。精益生産越來越普遍,企業将更加注重效率,通過數據分析,挖掘提升組織效率成為必然。
1.2 數據資産的價值
一個普通人一年會産生100GB的數據,其中大部分是圖片、視頻或音頻數據。大部分人會選擇将這些寶貴的生活記錄保存下來,以便空閑的時候回顧精彩人生。而一個中小型企業組織,每年則會産生1TB的數據,大型企業集團一年的數據增加量甚至會突破1PB。如此大量的數據,僅僅是被記錄存儲,就耗費巨大,企業付出昂貴的代價僅僅隻是為了保存這些數據嗎?
有人說,數字化時代“數據就是石油”。企業業務系統所形成的數據大部分與企業的生産、經營、市場活動息息相關,這些數據記錄着企業的業務規律,承載着客戶關系。但如果僅僅隻是把數據記錄存儲起來,那麼這些數據将成為企業永遠的成本。隻有将數據進行有效整理和挖掘,這些數據才會從沉默的費用成本變成有效的資産,如果輔之以高效的數據分析平台,業務人員随時随地可以進行數據分析,從數據中獲得對企業有業務啟示的生産經營規律、市場線索,那麼這些數據将變成具有高度變現能力的流動資産,才會真正的變成企業的業務增長引擎所必須的燃油。
1.3 什麼是數據可視化?
數據對于大多數人來說隻是一個概念,大數據尤其如此。以比特方式存儲在電腦中的數據,對我們并沒有什麼用。比如下面這個數據記錄,對于大多數人來說,這是一串毫無意義的數據:
[{'編号': '001' , '年齡': 15 , '身高': 165 , '體重': 59 } , {'編号': '002' , '年齡': 18 , '身高': 195 , '體重': 78 } , {'編号': '003' , '年齡': 16 , '身高': 170 , '體重': 63 } ]
因為這些數據沒有帶入任何場景,也沒有任何上下文提示,更不符合大多數人的閱讀習慣(這是json格式的數據表示),這隻能稱之為數據,但如果是下表所示的數據,就變得有意義了:
這是一個簡單的體檢數據,記錄了某個編号被測量者的年齡、身高和體重。為什麼同樣的數據,一個難以理解,一個很容易理解呢?二者的區别是,前者隻能叫做數據,是一種特定的計算機可讀取的格式;而後者可以稱之為信息,人類可以直接閱讀和理解。
而數據可視化,則是将數據進行有效整理變成易于接受的信息,人類通過頻繁處理這類信息,從而産生正确的知識。比如,将以上表格用下圖可視化展示出來,我們不僅能理解數據的含義,還能發現随着年齡的增長,身高和體重都會增加這樣一個規律,這便将數據從信息轉變成了知識。
同樣的道理,企業業務系統中的數據因為帶有業務的背景特征,隻要稍微經過系統的整理,就可以很好的通過這些數據來理解業務。但是僅僅隻是一些表格還是不夠的。将數據變成信息,用表格的方式來表示,隻是具備了可視化的基礎,還沒有真正的可視化。
1.4 如何數據可視化
1.4.1 人類視覺感知的特點
我們可以用眼睛、耳朵、鼻子等各種感官來接觸、感受、理解這個世界。科學研究表明,進入大腦的信息有75%來自視覺,進入或離開中樞神經系統的纖維細胞占38%。而視網膜上有1億個傳感器,但隻有500萬個能夠從視網膜傳遞信息到大腦。這表明,實際上眼睛處理的信息要多于大腦處理的信息,可以說眼睛過濾了信息。
可以說人類最有價值的器官,就是眼睛。正是因為人類具備了優良的視力,所以才能在狩獵或采集活動中保持較高的效率,判斷環境的風險,很好的躲避猛獸的襲擊。人類對于信息攝取的速度,視覺器官是占絕對主導地位的。,因此我們可以充分利用人類最為高效的信息獲取器官—眼睛,來快速吸收、加工和處理信息。在越來越強調效率的今天,與其聽長篇大論的彙報,還不如親自看看來得快。
“視覺感知并非是記錄刺激物質的被動過程,而是大腦的主動關注,視覺是選擇性的工作,對外形的感知包括對形式分類的應用,因其簡單性和一般性又被稱為視覺概念。”
--奧恩海姆《視覺思維》
人類的視覺同樣存在諸多缺陷。比如,人們在已有的認知或經驗的基礎上,知覺系統對客觀事物進行了某種最合理、最可能的解釋,但在特定條件下,這種解釋往往容易産生偏差,就形成了錯覺。舉個例子:缪勒—萊爾(Maller-Lyer Illusion)發現末端加上向外的兩條斜線的線段比末端加上向内的兩條斜線的線段看起來長一些(圖-?)。而著名的艾賓浩斯錯覺(Ebbinghause Illusion)則表明人類對圓形大小的感知極易受參照物的影響(圖-?)。以上人類認知的視錯覺還有很多。
缪勒—萊爾錯覺 艾賓浩斯錯覺
1.4.2 數據可視化的基本原則
那麼同樣是運用視覺,什麼樣的數據可視化才最有價值呢?人類經過漫長的進化,視覺系統接受和加工信息已經形成了一些獨特的規律,我們正是要充分理解這些視覺特點,将數據信息加工成适合人類快速接受的方式,同時規避一些人類視覺的缺陷(比如一些錯覺),使得信息以不容易造成偏差的方式高效組織,并向人類進行傳遞。
數據可視化方式多種多樣,每種不同的展示方法都從特定的視角表達了信息。好的數據可視化設計原則,可以很好的向讀者展示數據的内在規律,能夠快速抓住讀者的眼球,同時避免傳遞錯誤信息。我們把結構化數據分為:數值型數據、類别型數據和時間序列三大類型。而人類可以從數據中觀察到的模式則包括:局部與整體、趨勢、偏離、分布、相關性、可比性等等。
通常用來進行數據可視化的基本圖形則包括柱狀圖、餅狀圖、折線圖、散點圖和地理位置圖等,由這些基本圖形又可以衍生出更多,比如DataFocus中就包括36中可視化圖表類型。在進行可視化設計時,請謹記10大原則。
一個類别隻用一種顔色表示;
排序和分類要符合邏輯,比如從大到小等;
使用标注突出重點信息;
展示多種數據時盡量用可對比的方式進行;
減少不必要的标簽;
不要使用高對比度顔色組合,如紅色/綠色或藍色/黃色
盡量不要使用三維圖表,避免錯覺;
盡量減少陰影和裝飾,避免分散注意力;
單個圖形顔色不要超過6種;
不要用分散注意力的字體或元素(如粗體、斜體或下劃線)
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!