tft每日頭條

 > 科技

 > 大數據分析主要有啥

大數據分析主要有啥

科技 更新时间:2024-07-20 01:16:17

随着移動互聯網、物聯網、5G技術的普及,大數據采集、存儲、治理和應用的場景越來越多,大數據的特征相比早些年也有了一些變化,以下是我整理的新時期下大數據的一些特征:

大數據分析主要有啥(大數據4V特征詳細解讀)1

大數據4V解讀

一、數據體量特别巨大(Volume)

數據體量是大數據區分于傳統業務數據最顯著的特征。随着新的數字技術的高速發展,大量自動或人工産生的數據通過互聯網聚集到特定地點,包括電信運營商、互聯網運營商、政府、銀行、商場、企業、交通樞紐等機構,形成了大體量的數據,移動互聯網的核心網絡節點是人,人人都是數據制造者,文章、照片、短視頻都是其數據産品;數據來自無數自動化傳感器、自動記錄設施、生産監測、環境監測、交通監測、安防監測等;來自自動流程記錄,刷卡機、收款機、電子不停車收費系統,互聯網點擊等,數據開始爆發性增長,存儲單位從過去的GB到TB,乃至現在的PB、EB、ZB級别。

二、數據類型多(Variety)

早期的數據類型以結構化、半結構化為主,随着物聯網、5G技術的普及,為非結構化數據的大量産生奠定了技術基礎,類型多主要體現在三個方面:

1)數據來源多,企業所面對的傳統數據主要是交易數據,而互聯網和物聯網的發展,帶來了諸如社交網站、傳感器等多種來源的數據。由于數據來源于不同的應用系統和不同的設備,決定了大數據形式的多樣性,大體上可以分為三類:一是結構化數據,如财務系統數據、信息管理系統數據、醫療系統數據等,其特點是數據間因果關系強;二是非結構化數據,如視頻、圖片、音頻等,其特點是數據間沒有因果關系;三是半結構化數據,如HTML文檔、郵件、網頁等,其特點是數據間的因果關系弱。

2)數據類型多,且以非結構化數據為主。傳統的企業中,數據都是以表格的形式保存的。而大數據中有70%-85%的數據是如圖片、音頻、視頻、網絡日志、鍊接信息等非結構化和半結構化的數據。

3)數據之間關聯性強,頻繁交互,如遊客在旅遊途中上傳的照片、視頻、日志,與遊客的位置、行程等信息有很強的關聯性。

自然語言也是一個新的數據來源,而且也是一種更複雜、更多樣的數據,它包含諸如省略、指代、更正、重複、強調、倒序等大量的語言現象,還包括噪聲、含混不清、口頭語和音變等語音現象。

多類型的數據對數據的處理能力提出了更高的要求。

三、數據快速度(Velocity)

快速度是大數據處理技術和傳統的數據挖掘技術最大的區别。大數據是一種以實時數據處理、實時結果導向為特征的解決方案,它的“快”有兩個層面。

1)數據産生得快。有的數據是爆發式産生,例如,歐洲核子研究中心的大型強子對撞機在工作狀态下每秒産生PB級的數據;有的數據是涓涓細流式産生,但是由于用戶衆多,短時間内産生的數據量依然非常龐大,例如,點擊流、短視頻、人造購物節(雙11)産生的訂單數據、日志、射頻識别數據、GPS(全球定位系統)位置信息。

2)數據處理得快。正如水處理系統可以從水庫調出水進行處理,也可以處理直接對湧進來的新水流。大數據也有批處理(“靜止數據”轉變為“正使用數據”)和流處理(“動态數據”轉變為“正使用數據”)兩種範式,以實現快速的數據處理。

四、數據價值性(Value)

政府、企業擁有大量的數據,但是發揮價值的僅是其中非常小的部分。大數據背後潛藏的價值巨大。由于大數據中有價值的數據所占比例很小,而大數據真正的價值體現在從大量不相關的各種類型的數據中,挖掘出對未來趨勢與預測分析有價值的數據,并通過機器學習方法、人工智能方法或數據挖掘方法深度分析,并運用于農業、金融、醫療等各個領域,以期創造更大的價值。

綜上所述,大家對大數據的特征有了一個整體的了解,如何高效處理如此快速、海量的大數據,對人類的數據駕馭能力提出了新的挑戰,涉及到的知識領域包括對業務的深入理解、大數據戰略、大數據組織架構和人才的培養、數據治理、流批一體的大數據技術架構、大數據價值變現等,我個人也正在數字營銷領域不斷地探索,同時也希望大家共同探讨學習。

最後,我想說:大數據為人們獲得更為深刻、全面的洞察能力提供了前所未有的空間與想象力。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved