tft每日頭條

 > 科技

 > 可以查大數據的公衆号

可以查大數據的公衆号

科技 更新时间:2024-08-06 10:10:56

在中國國際大數據大會——大數據技術與發展論壇上,新浪微博大數據産品總監王磊做了《建設數據能力,開放服務業務》的講演。新浪微博的确講是從去年開始做大數據這方面的建設,其實在沒有大數據這個理念之前,微博的産品有自己的經營方式。在運用了大數據之後,在具體實踐過程當中新浪微博也有五個方面的分享,跟大家一起來探讨。

可以查大數據的公衆号(新浪微博五大大數據應用分享)1

王磊

聚合、計算、輸出、反饋形成數據和業務閉環

微博大數據其實是一個很閉環的業務,從底下的原始數據開始,微博一條一條的文本,實際都是非結構化數據。通過自然語言處理的技術,把每一條文本内容提取出來,之後放在底層網絡上。如一個客戶對一家飯的評論内容,将内容提取後就放到這個飯店的邊框上。

基于文本處理還可以做語義的分析,把這些非結構化的内容進行結構化,再上一層達到算法層,這個算法實際就是跟不同場景不同的算法,到達用戶端,用戶端再回到底層的數據算法當中。因此整個過程并不是一個孤立的,而且跟場景的理解關系非常大。每個點都非常靈活,要把這個合力用到整個閉環上。

平台化思路建設計算能力、數據能力、服務能力

大數據本身的建設如果從效率提升來講,其實是一個平台化的東西。微博的在線場景非常多,每個在線場景都會留下用戶的行為。所以對微博來說,大數據的建設是一個平台化的思路。所謂平台化的思路,要從不同的場景裡面去做足夠的抽象,這個抽象有三層含義,一個數據結構的抽象,還有一個是策略算法的抽象,還有就是輸出的抽象,三個層面的抽象。

從場景上來說,會分成内容流,用戶流,推薦搜索,還有開放平台的輸出,還有離線報告的應用,不同的業務,不會去針對每個業務特點去做,而會把場景要用的策略算法做一個梳理,具體在工程實施的時候,有一些是需要批處理的,有一些是需要流處理的。

結合雲計算技術挖掘大數據價值

新浪微博數據類型非常多,内部分基本是幾十個領域,而每個領域從一開始都是從底層往上做,做數據非結構化到結構化的轉化。但是走到一定階段,如果想要做到場景級别,還是需要垂直領域的理解。新浪有各個頻道,跟音樂、電影這些門戶頻道有比較深入的合作,到這個階段并不是技術層面的事情,而是跟垂直領域,跟行業關系密切。

另外新浪微博也跟外面合作夥伴有一些合作,這些合作夥伴會把算法部署到新浪的計算環境當中來,因為畢竟涉及到一些數據的問題,不可能把這個開放的程度過大。如果能夠有技術合作的公司把垂直領域的理解還有他們的算法部署在我們這個環境之上的話,他們獲得數據的範圍可以更大,這個也是新浪微博後面的一個發展方向。新浪微博提供一個雲環境,在這個環境裡面,可以用到基礎的數據,微博基礎數據。另外還可以用到大數據這邊已經做到的一些标簽,還有自然語言處理這些内容,甚至就是這些合作夥伴可以基于新浪微博提供的基礎數據,還有挖掘出來的标簽,他自己挖掘的标簽,做一些APP,來滿足用戶的訴求。

建立合作更好的滿足客戶需求

新浪微博跟一些其他領域合作夥伴進行多方面的嘗試。目标主要是圍繞用戶的衣食住行各種需求,目前已經跟央視索福瑞有一些合作,這是已經上線的産品,後台的數據包括給微博文本打上标簽,還有大家平時見到的曲線圖。

在微博電視指數裡面,想表達的是某一款電視在播出的時候,在社交媒體上會有口碑的影響力,還會有用戶的覆蓋度,這些都是節目制作方,電視台都非常關心的内容。我們從後台的數據來看,某一款節目在播前、播中、播後都有一個曲線,這個曲線那來之後,比如《爸爸去哪兒》,比如《中國好聲音》,這款産品究竟在哪個地區哪類用戶有非常好的反響,這個用戶是什麼年齡群的,微博上觀衆經常關注什麼,看什麼,在這樣一個場景裡面新浪微博都能夠獲得。前端展示出來的就是一個微博電視指數,但是後台其實還有很多要做的事情。

開放微博大數據和雲計算環境

整個微博大數據建設的過程當中,也希望能夠跟有共同服務用戶這一點理解訴求一緻的行業的合作夥伴去進行合作。這裡面微博這邊能夠開放出來的就是UGC的内容流,還有基于微博這個生态體系所打的用戶方面的一些标簽。

還有能夠提供一個開放雲計算的環境,具體合作也有三個層面,最基礎的就是數據這個層面的合作,比如數據的互補,對奇。第二個是場景層面,比如在微博這個場景上面一些功能,用戶在使用微博的時候,互聯網産品本身就是在創造場景,不斷滿足人細分場景下的需求。新浪微博跟這個垂直行業的夥伴一起尋找,在其他場景還有哪些可以做的。第三個就是産品的層面,這個形式不一定在微博内,具體什麼形式不确定。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved