目錄 | CONTENTS:
專業認知
培養方案
知名高校
未來規劃
就業前景
入門書籍
第一章 專業認知
大數據(big data),指無法在一定時間範圍内用常規軟件工具進行捕捉、管理和處理的數據集合。這些數據需要進一步處理,才能具有更強的決策力、洞察發現力和流程優化能力,以便實現資源高增長和多樣化。這樣的信息,才能變成資産。
也就是說,大數據技術的意義不在于掌握數據,而在于專業化處理數據,通過“加工”數據以實現“增值”,更好地輔助決策。
當前,中國互聯網正在邁向人工智能時代,大數據已應用到我們生活的方方面面。從打車軟件、網購軟件、導航軟件,無不體現大數據運算的能力。
快速增長的社會需求,導緻人才巨大的需求缺口,為了填補這一領域人才空白,高校紛紛開設數據科學與大數據技術專業,為社會培養和輸送人才。
就專業學科而言,大數據的本質是什麼?
大數據=統計學 數學 計算機
第二章 培養方案
大數據專業學什麼?大數據專業全稱為數據科學與大數據技術,這是一門交叉學科,以統計學、數學、計算機為三大支撐性學科。
生物、醫學、環境科學、經濟學、社會學、管理學為應用拓展性學科。
為了學好該門學科,還需學習數據采集、分析、處理軟件,學習數學建模軟件及計算機編程語言等。
一、需學課程(參考)
1、專業基礎課:
計算機
數學分析
高等代數
普通物理
數學與信息科學概論
數據結構
數據科學導論
程序設計導論
程序設計實踐
2、專業核心課:
離散數學
概率與統計
算法分析與設計
數據計算智能
數據庫系統概論
并行體系結構與編程
計算機系統基礎
非結構化大數據分析
3、專業選修課:
數據科學算法導論
數據科學專題
數據科學實踐
互聯網實用開發技術
抽樣技術
統計學習
回歸分析
随機過程
二、培養目标
作為最年輕的本科專業之一,本專業旨在培養社會急需的具備大數據處理及分析能力的高級複合型人才。
1、培養掌握計算機科學、大數據科學與信息技術的基本理論、方法和技能人才;
2、培養具備一定大數據科學研究能力與數據工程實施基本能力的人才;
3、培養掌握大數據工程項目規劃、應用、管理及決策人才;
4、具有大數據工程項目設計、研發和實施能力的複合型、應用型卓越人才。
三、學習大數據專業應具備的能力
1、紮實的數學功底
由需學課程可知本專業對學生的數學基礎有一定要求,光通識課部分就設置了三門數學課。學科基礎課裡還有離散數學、數字邏輯、數學系統。
2、堅強的意志
與計算機專業同樣,大數據專業非常注重實踐。學生需要獨立編寫程序,對心浮氣躁的學生來說,不經曆一番磨練很難靜下心來。
3、自學能力
大數據專業隻是一門工具,要解決實際問題,還需要具備相關行業的專業知識,比如對從事金融行業數據挖掘工作的學生來說,還必須對金融産品及用戶有所了解。
第三章 知名高校
一、選擇名校的理由:
進入好學校就讀是每個同學的心願,但為什麼要進入名校就讀,無非是以下幾個方面:
學校軟硬件資源
學校聲譽與雇主評價
社會需求
這表現在:
1、更好的師資、更多的經費、更優的科研項目等;
2、更優異的校風、校友、發展機會等;
3、更多的保研、實踐機會等;
4、更有機會申請國外名校實驗室進行研究。
關于本科階段申請國外前沿實驗室,名校的這項優勢并不廣為人知。教育部有個面向本科生的海外暑期科研項目,但隻面向包括清華、北大、浙大、南大在内的985院校。
在求職階段,相關企業更願意接受有名校背景的求職者。這意味着同等條件下更強的學習能力和專業素養,以及科研能力。
二、國内知名高校
第一梯隊:北京大學、複旦大學
第二梯隊:中南大學、北京理工大學
第三梯隊:山東大學、同濟大學
第四梯隊:哈爾濱工業大學等
三、國外知名高校
哥倫比亞大學
加州大學伯克利分校
斯坦福大學
麻省理工學院
卡耐基梅隆大學
......
第四章 未來規劃
本科畢業以後,學生面臨三個選擇:國内升學、出國深造,直接就業。
大數據專業作為一門基礎技術類學科,進一步深造對本科生來說,是必選項。原因有二:
一方面,大數據類專業的本科生大多隻涉及到專業大類的輪廓,沒有足夠的知識、很難進行高端工作。
另一方面,在一個具體專業領域進行深入地學習和研究,接受更多的專業知識和技能的學習和訓練,一般需要在研究生階段,甚至博士階段進行。所以,為了成為研究型人才,物理學專業還得深造。
繼續深造一般有以下途徑:
一、國内升學
國内升學分為:考研和保研。如果是自己考研,這裡沒什麼好說的,隻要努力學習就可以。但保研,講究一定的策略。
名校,或985以上院校,隻要GPA在院系前60%,沒有挂科記錄的同學都有獲得推免資格。其中,GPA前50%大概率都能本校保研成功。
所以,對高中生來說,考上大學不是學習的結束,而是新的開始,排名當然是越靠前越好,但所謂強中更有強中手,你努力别人也努力,要想獲得好的成績,需要付出艱辛的努力。
特别提醒:
如果有機會讀985院校,盡量讀這類院校,至少保研的機會多很多。當有機會保研,一般就不要選擇考研,原因是考研壓力大,并且會浪費很多機會成本。
二、出國深造
該專業留學首推美國,美國高校設置的數據科學專業,包括數據提取、數據挖掘、預測分析等。知名高校有哥倫比亞大學、加州大學伯克利分校、斯坦福大學等。
三、出國準備
如果打算出國留學,以下五項需及早規劃:
成績排名
科研經曆和成果
英語成績
推薦信
海外暑期科研
申請文書
1.成績排名
這裡成績排名沒什麼好說的。就是認真對待每一門學科成績,如果某門成績不夠理想,甯願申請重考。
2.科研經曆和成果
衡量科研經曆的指标:
①文章發表(科研文章)
②科技競賽
無論是發表文章,還是參加競賽,都不短期内能夠做好,因此,得提早規劃,什麼時候開始呢?一般須從大二就開始,甚至剛進校就進行規劃。
所以需要盡量早點進入教授團隊實驗室,在師兄和導師的帶領下做課題,少走彎路。這有兩個目的:
①發表高質量的文章
②獲取導師推薦信
就獲取導師推薦這件事,也要求大家盡量早一點參與教授項目,如果人家對你不熟悉,如何推薦你呢?
特别提示:
本科生申請直接讀博士時,一般都需要面試。面試内容一般包括但不限于:
①科研經曆
②導師認知
③學術觀點
3.英語成績(托福、GRE)
托福和GRE考試這個也沒有更多的需要說,但時效需要提示:托福成績兩年有效,GRE成績五年有效。所以有需要的,大家要算好時間。
4.推薦信
這裡特别強調:大牛的推薦信往往能起到重要且決定性的作用。但如何獲得大牛的推薦呢?
①自己的授課老師
②科研老師、實習老師
③業界高端人士
所以,平時和這人獲得交集很重要。
5.海外暑期科研
一般來說,名校的大三學生有機會暑假到國外名教授的實驗室以研究助理的身份從事2-3個月的科研活動。
這裡有交換生項目、官方合作項目、國内導師内推以及學業專業類的項目,以幫助學生實現以上目标。
6.申請文書
申請文書,有些同學可能會請專門的機構來做,但是與其這樣,還不如自己來做,因為有溝通的時間成本,已足以抵得上自己花費的時間了。
特别提示:
無論是保研、考研、還是出國深造,什麼時候開始準備呢?從時間安排來看,大二就要開始,如果打算走保研這條路,這裡再次強調,千萬不要挂科。并且必須保持對英語學習的熱情。
無論是國内升學,還是國外深造,以下工作在校期間必須得參與:
①争取參與科研
打算本校保研的學生,早一點參與相關老師和實驗室的科研項目,與學長學姐經驗分享等,至少混個臉熟。
②參加保研目标校的夏令營
對打算異校保研的,多參加公共類活動,比如,教育部每年舉辦的夏令營,以認識更多外校的教授,這個關注本校信息即可(當然異校保研對成績要求高一點,一般在年級排名全10%以内)。
③參加一些跟本專業有關的有技術含量的競賽
大數據專業全國性的比賽有:
CCF大數據與計算智能大賽;
全國大學生數據技能競賽。
直接就業将在下一章就業前景詳細說明。
第五章 就業前景
一、行業地位
未來時代将不是IT時代,而是DT時代,也就是數據科技時代。
從公布的“中華人民共和國國民經濟和社會發展第十四個五年規劃和2035年遠景目标綱要”來看,國家對大數據發展作出重要部署,所以這方面專業人才在未來必定是炙手可熱。
無論是金融、互聯網,還是醫療、教育、城市規劃等行業,都需大量的大數據人才。具體表現在三個方向:
大數據系統研發類人才;
大數據應用開發類人才;
大數據分析類人才。
二、職業分類
數據科學與大數據技術專業可細分為以下十大職位:
1、ETL研發;
2、Hadoop開發;
3、可視化(前端展現)工具開發;
4、信息架構開發
5、數據倉庫研究
6、OLAP開發
7、數據科學研究
8、數據預測(數據挖掘)分析
9、企業數據管理
10、數據安全研究
三、相關企業(參考)
螞蟻集團
滴滴打車
百度金融
北京宇信科技集團股份有限公司
深圳亞聯發展科技股份有限公司
曙光信息産業股份有限公司
北京四維圖新科技股份有限公司
普元信息技術股份有限公司
廣東奧飛數據科技股份有限公司
深圳萬潤科技股份有限公司
廣東紫晶信息存儲技術股份有限公司
四、升學方向
主要方向有:
計算機科學與技術
計算機系統結構
計算機軟件與理論
計算機應用技術
科學與信息技術(清華、北大、複旦、北京航空航天大學等少數學校開設)
第六章 入門書籍
一、《大數據時代》——維克托•邁爾•舍恩伯格
這本書展示了谷歌、微軟、IBM、蘋果、twitter、VISA等大數據先鋒們具價值的應用案例。
作為大數據系統研究的先河之作,作者圍繞“要全體不要抽樣、要效率不要絕對精确、要相關不要因果”三大理念,以實際商業和學術案例,向讀者剖析了萬物數據化和數據應用的巨大價值。
二、《大數據競争力如何成為真正的數據分析型企業》
這本書為讀者展示了大數據分析在企業中的應用價值和未來前景。
在長期觀察和訪談調研基礎上,作者以豐富的案例闡釋了數據分析型企業的競争優勢和核心特征,以及企業人力資源管理、财務管理、供應鍊管理、客戶管理對數據分析技術的依賴與實踐方法。
這本書可作為公司管理者借助大數據分析構建競争優勢的實踐手冊,也可指導相關人員對各類商業數據進行分析。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!