3月24日,北京郵電大學軟件學院副教授傅湘玲在CIO時代APP微講座欄目作了題為《大數據與企業管理決策》的主題分享,具體從大數據在企業管理決策中的應用及企業做過的一些案例與體會展開。
關于大數據在企業管理中的應用我們要回答的有四個問題:第一,這些大數據說明了什麼問題;第二,這些數據從哪裡來;第三,我們得出了什麼分析;第四,在結果中得到了什麼啟示。要實現大數據在企業管理決策中的應用,一方面是要有好的數據支撐,另一方面則需要經典的管理理論的應用。隻有數據與經典理論結合起來,才可能會形成新的管理決策的應用和模型,這是對大數據與企業管理決策的理解。
分享五個案例:第一是基于海量的互聯網數據的新産品開發決策;第二是基于海量互聯網數據的競争産品分析;第三是基于企業社交網絡的員工潛力員工潛力測量研究;第四是利用公衆博客文本進行公衆幸福感測量;第五是基于微博在線數據的新聞線索挖掘。
一、基于海量的互聯網數據的新産品開發決策即如何在線評論中幫助企業的産品設計師更好地設計産品。傳統的新産品設計一般是通過問卷的方式進行,用戶買了産品之後,會留下很多評論,這種評論實際上代表了用戶的需求,我們能否将這些用戶需求轉變為産品設計師的維度用戶需求,從而改進産品設計。我們能否将經典的卡洛模型用在在線評論分析之中,從而實現智能及時地實現新産品的改進。如針對手機産品的評論所做的二次開發過程中,手機新産品開發過程中如何利用在線評論提取其需求,從而幫助設計師更好地改進産品設計。
在上述的技術路線圖中,首先是做一個數據調研,從京東、淘寶、新浪微博中提取我們需要做的手機數據,本研究中我們選取了十款需要分析的手機數據,從京東等網站上進行數據的爬取。獲取到數據之後,在技術路線圖中可以看到進行了數據的預處理,其中包括評論的去重,當然還有一項很重要的工作,即樣本的有用性人工标記,其實對産品設計師而言,有些評論對産品設計師沒用,但對消費者有用。做完樣本的有用性标記之後,進行有用性模型訓練,同時在大量的評論中構建了一個需要提取的特征、情感、機型,因此在技術路線中,構建了特征詞庫、情感詞庫、機型詞庫,在此基礎上構建手機的主題模型,主題模型是指構建一個詞對,比如手機的待機時間較長,接着進行情感的分析。做完這項工作後,再結合管理中的卡洛模型進行客戶需求分析。卡洛模型中提到客戶的滿意包括基本需求,期望需求和驚喜需求,我們根據用戶效用值的大小進行排序,得到用戶的1)基本需求:版本、功能、外觀、物流及售後、其他;2)期望需求:處理器及配件、屏幕、信号及發熱、相機;3)驚喜需求:電池、價格、手感、系統。對此我們也提出相應的管理建議:對于基本需求,管理建議:保證符合服務标準,努力降低産品故障率和服務失誤率;對于期望需求,管理建議:不單是考慮符合服務标準,而是如何提高服務标準。同樣對于驚喜需求,管理建議:首先保證另外兩類需求,開發新服務,增加新内容。
二、基于海量互聯網數據的競争産品分析在産品評論中存在不同産品間的各種不同屬性特征的比較,在此基礎上我們提出了另外一個概念——産品在線聲譽。産品的在線聲譽分為産品美譽度和知名度。美譽度又從屬性美譽度和屬性權重兩個角度進行考慮。就屬性的美譽度而言,前面的過程中提取了手機的每個屬性特征,如電池、屏幕、内存等,對每個屬性都有一個評價的矩陣值,即一條評論中對某個屬性的效用值,據此計算出屬性的美譽度,接着對屬性的權重進行計算,便可得出第i條評論對某個産品屬性j的評價,從而測量出不同産品的在線聲譽。在此案例中,我們針對四款手機進行了研究,分别為:華為、IPhone、三星、聯想。
得出的結果大家在這個圖中可以看到:
①三星N7108的各個屬性的美譽度均在最外圍(價格除外),即美譽度高;②聯想A820T的各個屬性的美譽度均在最内層,即美譽度最低;③iphone4S的大部分屬性的美譽低于三星N7108(價格除外),卻高于華為G520(相機、外觀和屏幕除外),因此,從屬性美譽度層面來看,三星N7108表現較好,最好能再适當下調點價格,聯想A820T整體上都需要提升。
三、基于企業社交網絡的員工潛力員工潛力測量研究人資資源管理中企業員工的潛力研究一般也是多基于問卷進行,在這裡我們也希望通過企業内部社交網絡的數據來進行員工潛力的測量研究。我們選取了某企業社交網絡中員工的社交數據,在此基礎上構建了将員工的潛力分為了協調潛力和知識潛力兩個維度。在此基礎上進一步細化構建了每個細化的指标測量方法。通過對文本數據的分析與挖掘,量化測量出每個指标的值,從而進行員工潛力指數的測量研究。
能不能利用文本進行量化的幸福感的測量呢?傳統的做法是Watson教授提出來的PANAS量表,測量情感的幸福通過問卷的方式測量某個人的幸福感。但這種量表的方式無法實現大規模、可重複、無幹擾的測量,也就是說,很多人在測試時未反映出真實的感情。因此,要實現無幹擾環境下大規模、可重複的測量,則需要一個更好地可以利用海量客觀數據的自動化方法測量公衆的幸福,我們做了一個測量幸福感的模型,主要是從某一篇博文中出現的情感詞數量及頻率在整篇文章中所占的比例。其中有一個很大的問題,即中文的情感詞庫需要量化,傳統的詞庫很多隻有正面和負面,對每一個情感詞并沒有得分的比較,這是工作過程中很大的一個難題,英文中有公開的詞庫,經過多方努力,我們找到了Ren詞庫。
可以看出,我們模型的結果與實際情況是比較符合的,我們對曆史已經發生的事件和現在模型的結果對比是可以對應的,這是我們對公衆幸福感利用博客文本做的結果和重大事件的對比。同樣,我們也做了周、年的比較,将六年中每年的數據進行對比後發現,每年的二月份是情感較高的,由于二月份有春節,春節後幸福感開始下降,同時十一也是如此。在周的對比中,周一較低,周二較高,由于工作比較疲憊,周三比較低,由于看到周末了,周四之後又開始上升。這是關于重大事件的對比、每年高峰低峰的對比以及一周的對比。
因此,在這個研究中,我們将經典心理學的主觀幸福感測量(PANAS量表),利用互聯網中大量非結構化數據設計了一個新的幸福感量化模型,實現了對社會公衆幸福感的實時動态監測。
目前來看,記者也是通過博客、社交網絡大量的發現新聞線索,如通過微信群、QQ群、微博等發現有哪些熱點發生,根據自己的知識判斷,這有可能是一個值得深究的會成為一條新聞的消息,在此過程中可能浏覽過一萬條微博才發現一條值得調研和采訪形成新聞的内容,我們稱之為新聞線索。首先,我們構建了一個新聞線索的新聞價值模型,其中提高了線索的重要性、異常性和權變性。在構建了新聞線索後,我們聽取了新華社、人民網的記者,以及一些新聞專家、公衆的看法,進行了模型的改進,在技術路線圖中可以看到,一方面是構建新聞價值線索模型,另一方面是從數據中找到新聞線索,在數據準備階段,主要利用了微博,對微博事件進行了事件觸發抽取、命名實體識别、時間表達抽取、事件後果抽取,由于在新聞價值模型中發現,這四個要素對新聞價值的評價是有用的,對這四個特征進行抽取後,構建了微博事件信息庫和訓練集、測試集,從而進行新聞價值模型的計算,這個計算過程中也進行了模型的計算和調整。以交通事故為例,通過這個過程可将某一天與所有交通有關的微博信息、新聞提取出來,并對其價值進行評分,在評分過程中,新聞事件的排名越前價值越高。對新聞記者而言,現在隻需要看一千條微博便可以篩選出新聞報道的線索,減輕其工作量,從而更好地評價微博數據中可能存在的新聞線索。
以上便是五個方面的案例,其實數據是一個方面,經驗管理模型的應用是第二個方面,将模型和數據結合起來,可以判斷需要哪些數據、數據說明了哪些問題,以及這些數據分析如何應用到管理決策之中。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!