作者介紹
@李慶輝(新芭)
數據産品專家,數據産品團隊負責人;
擅長數據治理、數據分析、數據化運營;
Python書籍《深入淺出Pandas》作者;
“數據人創作者聯盟”成員。
01 遠古時代的數據
「數據」本身是存在的,就像空氣,隻有出現霧霾使它顯式地呈現在我們腦海裡。在百萬年前,推及上億年前,在人類沒有出現在這個藍色星球之時,數據這個事物一直在那裡,它等待着的是人類那靈光乍現的智慧賦予它正真的含義。
在沒有計算這個高端的家夥之前,人們為了讓「數據」更加具象,便于統計,進行了至今數萬的探索。在身邊堅硬的物體如石器、骨片以及樹幹為載體,刻下紋理來代表對現實事物的表達,似乎成為了一個理所當然的開始。1960年在非洲烏幹達與紮伊爾交界處的伊尚戈漁村發掘的一根記數刻骨“Ishango Bone”(伊尚戈骨頭),這是距今一萬前伊尚戈人新石器時代早期的作品,是最早的刻符記數實物。遠古部落人民使用這些凹痕記錄日常的交易活動、物資儲備和大事小情,并用他們來進行基本的算術計算。
伊尚戈骨頭
02 現代化的數據
在今日計算機普及的社會裡,數據更是顯得非常有存在感,身處于大數據時代的我們已然意識到數據的重要性。那麼什麼是數據呢?看起來簡單的問題,往往是最複雜的。
當下對數據更普遍的定義往往是從計算機原住民的視角。我們對客觀事物進行觀察、度量、猜測,按照統一或者不統一的尺度标準将結果予以記錄,這些記錄或多或少,都是數據。這些數據期望是未經加工的,它們能非常良好地代表原始事物本來的面貌和形态。
國際數據管理協會(DAMA)也認為,數據是以文本、數字、圖形、圖像、聲音和視頻等格式對事實進行表現。也就是說,數據要表現事實,受限于數據的采集技術以及數據解讀能力,這或許這是一種理想。
數據表征存在,存在是不以人的意志為轉移,包括物質的和精神的。物質方面有大自然中的風、雨、雷、電、人和動物等實體,這些是有明确感知的,非常方便數據化。在精神方面,人的歡樂、哀怨等情緒可以被大量多次主觀度量,最終也可以形成數據。
數據似乎往往應用于實體,實體是大多數據刻畫的對象。在刻畫實體時往往需要系統數據,單一的數據似乎不那麼受歡迎。在擁有了大量的對一個實體的刻畫數據後,經常會從量變發生質變。集結數據成為「信息」,加工信息成為「知識」,運用知識産生「智慧」,數據成為低層的驅動者。它們之間環環相扣、循序漸進,構成了「DIKW 金字塔」。
數據-信息-知識轉化模型
我們再來看看東方智慧。中文詞語「數據」暫且不論其詞源,容我們從字面窺探一二。「數」有兩層含義,一個是數據往往用數字來記錄事實,如一個人的年齡,一座山的高度;另個一個層面是它用數學的方法來進行統計最終得到記錄結果,如一群人的平均年齡和群峰的平均高度,都應用了數學中的平均數概念。再看「據」,我将據理解為日常生活中的票據,票據是證明,證明發生過此事,是人類大腦缺點的補充,是對時間的凝固,因此「據」是事實。所謂數據就是事實的數字化憑據。
03 展望未來
正如開頭所講的一樣,對于數字時代的我們,數據或許真的和空氣一樣,已經不需要我們再去思考其概念。當我們每天生活有數字化加持的小區裡,工作在繁華的智能辦公商業區,享受着數字生活的便利時,這一切顯得是那麼自然,而這也正是物聯網時代下新的數據生态。
物聯網時代下的數據
更多的思考,是為了更好地出發。在對數據概念的理解上我們還需要繼續探索,歡迎各位數據人在評論區留言,談一談你認為的數據是什麼。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!