大數據分析是指對規模巨大的數據進行分析。大數據可以概括為4個V, 數據量大(Volume)、速度快(Velocity)、類型多(Variety)、價值(Value)。
大數據開發其實分兩種,第一類是編寫一些Hadoop、Spark的應用程序,第二類是對大數據處理系統本身進行開發。第一類工作感覺更适用于data analyst這種職位吧,而且現在Hive Spark-SQL這種系統也提供SQL的接口。第二類工作的話通常才大公司裡才有,一般他們都會搞自己的系統或者再對開源的做些二次開發。這種工作的話對理論和實踐要求的都更深一些,也更有技術含量。
大數據作為時下最火熱的IT行業的詞彙,随之而來的數據倉庫、數據安全、數據分析、數據挖掘等等圍繞大數據的商業價值的利用逐漸成為行業人士争相追捧的利潤焦點。随着大數據時代的來臨,大數據分析也應運而生。
應用案例,與往屆世界杯不同的是,數據分析成為巴西世界杯賽事外的精彩看點。伴随賽場上球員的奮力角逐,大數據也在全力演繹世界杯背後的分析故事。一向以嚴謹著稱的德國隊引入專門處理大數據的足球解決方案,進行比賽數據分析,優化球隊配置,并通過分析對手數據找到比賽的“制敵”方式;谷歌、微軟、Opta等通過大數據分析預測賽果…… 大數據,不僅成為賽場上的“第12人”,也在某種程度上充當了世界杯的"預言帝"。
分析開始的時候,數據首先從數據倉儲中會被抽出來,被放進RDBMS裡以産生需要的報告或者支撐相應的商業智能應用。在大數據分析的環節中,裸數據以及經轉換了的數據大都會被保存下來,因為可能在後面還需要再次轉換。
舉報/反饋
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!