大數據
BIg data
大數據(big data),指無法在可承受的時間範圍内用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資産。
在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數據時代》中大數據指不用随機分析法(抽樣調查)這樣的捷徑,而采用所有數據進行分析處理。大數據的5V特點(IBM提出):Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)Veracity(真實性),對于“大數據”(Big data)研究機構Gartner給出了這樣的定義。“大數據”是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資産。
特征
容量(Volume):數據的大小決定所考慮的數據的價值和潛在的信息;
種類(Variety):數據類型的多樣性;
速度(Velocity):指獲得數據的速度;
可變性(Variability):妨礙了處理和有效地管理數據的過程。
真實性(Veracity):數據的質量
複雜性(Complexity):數據量巨大,來源多渠道
意義
現在的社會是一個高速發展的社會,科技發達,信息流通,人們之間的交流越來越密切,生活也越來越方便,大數據就是這個高科技時代的産物。 阿裡巴巴創辦人馬雲來台演講中就提到,未來的時代将不是IT時代,而是DT的時代,DT就是Data Technology數據科技,顯示大數據對于阿裡巴巴集團來說舉足輕重。
有人把數據比喻為蘊藏能量的煤礦。煤炭按照性質有焦煤、無煙煤、肥煤、貧煤等分類,而露天煤礦、深山煤礦的挖掘成本又不一樣。與此類似,大數據并不在“大”,而在于“有用”。價值含量、挖掘成本比數量更為重要。對于很多行業而言,如何利用這些大規模數據是成為赢得競争的關鍵。
大數據的價值體現在以下幾個方面:
1)對大量消費者提供産品或服務的企業可以利用大數據進行精準營銷;
2)做小而美模式的中長尾企業可以利用大數據做服務轉型;
3)面臨互聯網壓力之下必須轉型的傳統企業需要與時俱進充分利用大數據的價值。
不過,“大數據”在經濟發展中的巨大意義并不代表其能取代一切對于社會問題的理性思考,科學發展的邏輯不能被湮沒在海量數據中。著名經濟學家路德維希·馮·米塞斯曾提醒過:“就今日言,有很多人忙碌于資料之無益累積,以緻對問題之說明與解決,喪失了其對特殊的經濟意義的了解。”這确實是需要警惕的。
企業組織利用相關數據和分析可以幫助它們降低成本、提高效率、開發新産品、做出更明智的業務決策等等。例如,通過結合大數據和高性能的分析,下面這些對企業有益的情況都可能會發生:
及時解析故障、問題和缺陷的根源,每年可能為企業節省數十億美元。
為成千上萬的快遞車輛規劃實時交通路線,躲避擁堵。
分析所有SKU,以利潤最大化為目标來定價和清理庫存。
根據客戶的購買習慣,為其推送他可能感興趣的優惠信息。
從大量客戶中快速識别出金牌客戶。
使用點擊流分析和數據挖掘來規避欺詐行為。
結構
大數據就是互聯網發展到現今階段的一種表象或特征而已,沒有必要神話它或對它保持敬畏之心,在以雲計算為代表的技術創新大幕的襯托下,這些原本很難收集和使用的數據開始容易被利用起來了,通過各行各業的不斷創新,大數據會逐步為人類創造更多的價值。
其次,想要系統的認知大數據,必須要全面而細緻的分解它,我着手從三個層面來展開:
第一層面是理論,理論是認知的必經途徑,也是被廣泛認同和傳播的基線。在這裡從大數據的特征定義理解行業對大數據的整體描繪和定性;從對大數據價值的探讨來深入解析大數據的珍貴所在;洞悉大數據的發展趨勢;從大數據隐私這個特别而重要的視角審視人和數據之間的長久博弈。
第二層面是技術,技術是大數據價值體現的手段和前進的基石。在這裡分别從雲計算、分布式處理技術、存儲技術和感知技術的發展來說明大數據從采集、處理、存儲到形成結果的整個過程。
第三層面是實踐,實踐是大數據的最終價值體現。在這裡分别從互聯網的大數據,政府的大數據,企業的大數據和個人的大數據四個方面來描繪大數據已經展現的美好景象及即将實現的藍圖。
趨勢
趨勢一:數據的資源化
何為資源化,是指大數據成為企業和社會關注的重要戰略資源,并已成為大家争相搶奪的新焦點。因而,企業必須要提前制定大數據營銷戰略計劃,搶占市場先機。
趨勢二:與雲計算的深度結合
大數據離不開雲處理,雲處理為大數據提供了彈性可拓展的基礎設備,是産生大數據的平台之一。自2013年開始,大數據技術已開始和雲計算技術緊密結合,預計未來兩者關系将更為密切。除此之外,物聯網、移動互聯網等新興計算形态,也将一齊助力大數據革命,讓大數據營銷發揮出更大的影響力。
趨勢三:科學理論的突破
随着大數據的快速發展,就像計算機和互聯網一樣,大數據很有可能是新一輪的技術革命。随之興起的數據挖掘、機器學習和人工智能等相關技術,可能會改變數據世界裡的很多算法和基礎理論,實現科學技術上的突破。
趨勢四:數據科學和數據聯盟的成立
未來,數據科學将成為一門專門的學科,被越來越多的人所認知。各大高校将設立專門的數據科學類專業,也會催生一批與之相關的新的就業崗位。與此同時,基于數據這個基礎平台,也将建立起跨領域的數據共享平台,之後,數據共享将擴展到企業層面,并且成為未來産業的核心一環。
趨勢五:數據洩露泛濫
未來幾年數據洩露事件的增長率也許會達到100%,除非數據在其源頭就能夠得到安全保障。可以說,在未來,每個财富500強企業都會面臨數據攻擊,無論他們是否已經做好安全防範。而所有企業,無論規模大小,都需要重新審視今天的安全定義。在财富500強企業中,超過50%将會設置首席信息安全官這一職位。企業需要從新的角度來确保自身以及客戶數據,所有數據在創建之初便需要獲得安全保障,而并非在數據保存的最後一個環節,僅僅加強後者的安全措施已被證明于事無補。
趨勢六:數據管理成為核心競争力
數據管理成為核心競争力,直接影響财務表現。當“數據資産是企業核心資産”的概念深入人心之後,企業對于數據管理便有了更清晰的界定,将數據管理作為企業核心競争力,持續發展,戰略性規劃與運用數據資産,成為企業數據管理的核心。數據資産管理效率與主營業務收入增長率、銷售收入增長率顯著正相關;此外,對于具有互聯網思維的企業而言,數據資産競争力所占比重為36.8%,數據資産的管理效果将直接影響企業的财務表現。
趨勢七:數據質量是BI(商業智能)成功的關鍵
采用自助式商業智能工具進行大數據處理的企業将會脫穎而出。其中要面臨的一個挑戰是,很多數據源會帶來大量低質量數據。想要成功,企業需要理解原始數據與數據分析之間的差距,從而消除低質量數據并通過BI獲得更佳決策。
趨勢八:數據生态系統複合化程度加強
大數據的世界不隻是一個單一的、巨大的計算機網絡,而是一個由大量活動構件與多元參與者元素所構成的生态系統,終端設備提供商、基礎設施提供商、網絡服務提供商、網絡接入服務提供商、數據服務使能者、數據服務提供商、觸點服務、數據服務零售商等等一系列的參與者共同構建的生态系統。而今,這樣一套數據生态系統的基本雛形已然形成,接下來的發展将趨向于系統内部角色的細分,也就是市場的細分;系統機制的調整,也就是商業模式的創新;系統結構的調整,也就是競争環境的調整等等,從而使得數據生态系統複合化程度逐漸增強。
碼字不易,如果您覺得文章寫得不錯,
請您 1.關注作者~ 您的關注是我寫作的最大動力
2.私信我“大數據”
我将與您分享一套最新的大數據學習資源和全套開發工具
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!