“大數據”這個詞的受歡迎程度不必誇大。在過去兩年中,“大數據”部分對于任何與互聯網相關的活動和會議都是不可或缺的。
關于大數據的書籍和文章鋪天蓋地,似乎在一起傳遞着一個信息:越來越多的行業和人們開始關注并實際探索大數據的應用。我們正在一起為大數據的巨大效用繪制藍圖,但在實踐中,我們仍在初級階段邁出一小步。
大數據根源基于互聯網,數據倉庫、數據挖掘、雲計算等互聯網技術的發展為大數據的應用奠定了基礎。然而,實際應用仍在探索中。
什麼是大數據?
列舉三個常用的大數據定義:
(1)具有較強決策、洞察和流程優化能力的海量、高增長、多樣化的信息資産需要新的處理模式。
——Gartner
(2)海量數據量、快速數據流和動态數據速度、多樣的數據類型和巨大的數據價值。
—— IDC
(3)或者是海量數據、海量數據、大數據,是指所涉及的數據太大,無法在合理的時間内被截取、管理、處理、整理成人類可以解讀的信息。
—— Wiki
大數據的其他定義也差不多,可以用幾個關鍵詞來定義大數據。
首先是“大尺度”,可以從兩個維度來衡量,一是從時間序列中積累大量數據,二是對數據進行深度提煉。
其次,“多樣化”可以是不同的數據格式,比如文字、圖片、視頻等。,可以是不同的數據類别,如人口數據、經濟數據等。,也可以有不同的數據源,如互聯網和傳感器等。
第三,“動态”。數據是不斷變化的,它可以随着時間迅速增加大量的數據,也可以是在空間不斷移動變化的數據。
這三個關鍵詞定義了大數據的形象。
但是,需要一個關鍵能力,就是“處理速度快”。如果有這樣的大規模、多樣化、動态的數據,但是需要很長時間的處理和分析,那就不叫大數據。從另一個角度來說,要實現這些數據的快速處理,肯定沒有辦法手工實現,所以需要借助機器來實現。
最後,借助機器,我們可以快速處理和分析這些數據,以獲得所需的信息或整個應用系統,這可以稱為大數據。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!