滴滴“猜你去哪”這個功能,是怎麼實現的呢?這背後有哪些數據原理和數據邏輯呢?
數據産品經理老曹,自從入職了這家初級規模的互聯網公司,給大家帶來了很多驚喜和意外。不僅從業務角度給大家普及數據産品知識,傳播數據文化。還能在平時的生活中,通過日常接觸到的數據産品入手,講解背後的原理和邏輯,讓大家觸類旁通,更深入的了解和掌握數據産品知識。
這不,數據産品經理小王在用滴滴打車的時候,就發現一個很有意思的功能:還沒等自己輸入目的地,滴滴居然猜出并提示了自己要去的地方。
這簡直太神奇了,帶着好奇心,小王趕緊跑到老曹身邊,帶着求知若渴的眼神,對老曹說:
“老曹,滴滴這個猜你去哪功能太有神奇啦,居然一下子就猜中了我要去哪裡,而且還很方便,它是怎麼實現的啊?快給我講講吧!”
老曹一聽,這小夥越來越可以了,居然能在生活中發現細節,并有着強烈的好奇心,善于學會提問,心中還是很滿意的:
“小王,既然你這麼愛學習,那我就給你好好講一講。”
數據産品經理小王:
“好啊好啊,快來講一講,我小闆凳都搬過來了!!!”
老曹又把自己旁邊的那塊畫布拖了過來,塗塗改改又講了起來:
首先,來說一下,滴滴猜你去哪這個産品為什麼大家覺得好。
- 第一,它能減少用戶輸入,如果猜測準确,用戶直接點擊目的地就可以了,減少用戶使用步驟;
- 第二,提升用戶體驗和粘性,足夠準确的話,讓人眼前一亮,印象深刻。
數據産品經理小王:
“這還用你說嘛,趕緊進入正題吧,它是怎麼實現的啊!!!”
老曹笑一笑,娓娓道來:
好吧,那我們就進入正題,首先,讓我們來看一下建設一款數據産品必經的四個步驟:數據采集->數據清洗->策略算法->數據展現。
- 第一步,數據采集。主要是根據自己的業務場景需求,針對數據産品需要的數據内容,進行數據采集方案設計。數據來源可能是埋點數據上報,也可能是業務數據,還可以是爬蟲獲取的外部數據。
- 第二步,數據清洗。主要是針對采集的數據進行清洗,形成方便程序實現的數據字段和格式,并存儲在數據表中。
- 第三步,策略算法。根據數據産品要實現的功能,選擇算法策略模型,實現數據邏輯處理程序,并最終輸出可以滿足産品需求的數據或者結論。
- 第四步,數據展現。根據産品設計方案,完成最終的産品展示,可以用圖表樣式的方式展現,也可以直接展示結論或者建議。
數據産品經理小王:
大概了解步驟和方法了,老曹,能不能結合猜你去哪這個功能來講一下每一步都是怎麼實現的啊?
老曹在畫闆上抹去剛才寫的東西,繼續拆解起來:
結合滴滴猜你去哪,讓我們看下第一步,數據采集。用戶打開滴滴,它不像大衆點評這種場景,用戶不知道應該吃什麼。絕大部分情況下,打開滴滴,都是明确有要去的目的地。我們需要做的隻是将目的地猜對并提示出來。
所以需要兩個核心數據:
- 第一個就是當前的時間、用戶id、是否為工作日,當前地點的經緯度數據。
- 第二個就是用戶的曆史行程記錄,因為用戶去什麼地方僅取決于用戶及他所處的上下文,此處上下文包括位置,時間,曆史行程等。
數據産品經理小王:
哇,那看來這些數據滴滴自己的系統裡都有記錄啊,大部分都是後台業務數據。
老曹點點頭,接着說:
嗯,是的,這些數據其實都比較明确,很多都是後台系統數據。接着第二步,是數據清洗。根據算法策略需求,針對第一步采集的數據進行數據清洗,清洗出自己滿足需求的數據格式。
根據第一步采集的數據,進行加工彙總,完成數據清洗工作,主要實現大概這樣格式的數據形式,進行存儲為算法策略提供輸入。
實際産品涉及的數據和算法會更為複雜,此處僅從數據産品策劃的角度拆解基礎邏輯和數據,小王你主要是通過我的拆解意會下數據産品的實現方法。
數據産品經理小王:
嗯,我知道,我其實也是想通過案例看方法,掌握方法才是處理各種問題的根本,學會數據産品方法論,實現各種數據産品都不怕。
老曹不禁豎起了大拇指,點贊道:
再讓我們來看下第三步,策略算法。模型選擇上,可以使用高斯分布,從數據上來看,出發上下文和目的地之間,分布上應該是類似這樣的一個鐘形的樣子。
然後,對每個用戶的數據、以及每一個去過的候選目的地使用高斯分布來構建基于上下文的條件概率分布。并根據計算出的用戶在特定場景上下文情況下去特定目的地的概率,選出最後可能去的地點作為’猜你去哪’的推薦結果。
數據産品經理小王聽的越來越投入:
高斯分布,我記下來,我趕緊去了解下這個高大上的算法。
老曹一把把小王拽回來,趕緊說到:
别着急啊,我還有最後一步沒介紹呢,就是數據展現環節,這裡,主要分兩個方面:
- 展現時機:在用戶打開滴滴,還未輸入數據目的地時展現。
- 展現樣式:以tooltip的形式提示推薦目的地,可以點擊選擇。
經過這兩個方面,最終就是你看到的在滴滴實現的猜你去哪這個數據産品功能啦!
數據産品經理小王兩眼放光:
哇哇哇,厲害啦,原來這麼多門道在裡面,真是外行看産品表面,内行看實現路徑,學習了,我要在以後的數據産品實現中,好好用這個實現方法和步驟,搞出更多厲害的數據産品來。
老曹想了想,補充說:
既然你提到了滴滴的猜你去哪這款數據産品,那有沒有考慮過,滴滴背後還有哪些數據産品呢?
數據産品經理小王摸摸頭,不好意思的低下頭:
呃,我還真是想不到了。
老曹語重心長的對他說:
下次你可以再以點帶面,繼續觀察下,其實,滴滴背後有很多數據産品的,例如系統派單、推薦上車點、排隊時長預估、路徑規劃這些功能。
數據産品經理小王又來了興趣:
那老曹也給我講講這些功能怎麼實現的吧?
老曹一聽,真想一口鹽汽水噴死小王:
别忘了我今天通過滴滴猜你去哪介紹的數據産品實現四步法:數據采集->數據清洗->策略算法->數據展現,掌握這四步,你就可以自己來拆解下剛才說的這些數據産品功能啦!這個才是背後的核心和關鍵,好好消化下吧!
數據産品經理小王點點頭:
嗯嗯,有道理,方法論我有,天下數據産品任我選!不說了,老曹,貌似該吃飯了,我們去吃飯吧,邊吃邊聊。
老曹仿佛也聽到了肚子的抗議聲,摸摸肚子:
那還不快走,給你講個這麼多,肚子都咕噜噜叫了,我真是在用愛心發電啊。
#專欄作家#大鵬,公衆号:一個數據人的自留地。人人都是産品經理專欄作家《數據産品經理修煉手冊》作者。
本文原創發布于人人都是産品經理。未經許可,禁止轉載
題圖來自Unsplash,基于CC0協議
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!