tft每日頭條

 > 生活

 > 微軟小娜為什麼識别不了

微軟小娜為什麼識别不了

生活 更新时间:2024-12-06 05:03:59

近年來,虛拟人工助手迅速火熱,本文以産品經理視角分析一下當下熱門的微軟小娜和出門問問。

微軟小娜為什麼識别不了(以微軟小娜和出門問問為例)1

一、發展背景及用戶需求分析

1.發展背景

語音是人與人之間交流最方便快捷的方式之一,具備非接觸、簡潔高效等特性。

随着人工智能的快速發展,語音産業也得到了快速發展,并在其中占據着重要地位,如圖1所示,語音市場行業規模在逐年擴大。

微軟小娜為什麼識别不了(以微軟小娜和出門問問為例)2

虛拟人工助手作為語音産業的典型産品也在快速發展,各大公司均在推出自己的産品,如蘋果Siri、谷歌的Google now、亞馬遜ALEXA、微軟“小娜”CORTANA等等。

虛拟人工助手通過語音輸入獲取信息,控制手機程序以及其他設備,幫助用戶提高獲取信息和操作手機的效率,使其快速做出合理的決策。

本文以出門問問和微軟小娜為例,對虛拟人工助手的産品功能、操作效果和商業模式進行分析,以求進一步完善虛拟人工助手的産品功能和商業模式。

出門問問目前自主研發了一整套人工智能交互技術,包括熱詞喚醒,語音識别、語義理解、垂直搜索、語音合成,智能推薦和計算機視覺。從多個維度,打造優秀的人工智能交互體驗,已成為中國人工智能領域語音交互技術與産品化的領軍者。

微軟小娜(Cortana)是微軟發布的全球第一款個人智能助理。它“能夠了解用戶的喜好和習慣”,“幫助用戶進行日程安排、問題回答等”。它的産品方向是讓手機用戶與小娜的智能交互,不是簡單地基于存儲式的問答,而是對話。

2.用戶需求場景

場景一:雙手忙碌,無法打字的人

A在正在開車,想和家人打個電話,晚點回家,并且在B地區附近找個餐館,給一個朋友發個短信一會就到,然後想聽首周傑倫的歌曲,順便把車内空調的溫度調低一點。

如果開車的時候手動完成這些事,将會嚴重影響開車。但有了虛拟人工助手就不一樣了,隻需要輸入語音就能完成自己自己想做的事了。

“助手,撥打我老媽的電話,B地區附近有什麼好吃的,給c發短信說我一會就到,我想聽周傑倫的歌曲,把空調的溫度再調低一點”,通過語音就完成了自己想做的事。

場景二:工作學習或生活中事情多但容易忘記的人

大二同學小Q要上課,參加社團活動和做兼職,特别忙,所以總是忘記自己要做的事。

通過小助手就可以準确提醒自己做的事,前一天晚上小Q打開虛拟人工助手,說:“我明天晚上六點要給父母打電話,9點去沃爾瑪,到沃爾瑪後要提醒自己買洗發水和紙巾。”然後虛拟助手通過建立時間提醒和地點提醒來提醒用戶完成需要做的事。

場景三:手機APP數量繁多,想一鍵操作所有應用的人

小H早上起床上班前總是有很多事做,要打開微信看一下有沒有新的消息,打開時鐘設置個提醒中午要去銀行取個錢,打開浏覽器查下美元和人民币的彙率是多少。

刷牙的同時想打開新聞軟件知道今天的體育新聞有什麼,同時要把空調關了。

通過虛拟人工助手直接語音輸入一系列命令,就會打開微信,設置提醒,查出彙率,搜索體育新聞,通過遙控助手關掉空調。

場景四:想快速找到符合自己要求的信息,避免層層篩選的人

小S想在在A地區找個酒店,價格優惠,提供早餐,環境安靜,并且離地鐵站比較近的。

通過傳統APP搜索需要層層篩選,各種對比,但是如果告訴虛拟人工助手這些信息,助手就能快速幫你找到符合要求的酒店,避免傳統APP的篩選條件限制。

場景五:不方便打字的老人、小孩、盲人和手有殘疾的人。

叔叔是個盲人,平時獲得信息隻能從電視聲音、電台等渠道被動獲取信息,想要主動獲取信息很難,隻能和别人口述,在别人的幫助下獲取信息。

但有了虛拟人工助手後,就可以通過語音輸入查找自己想要的信息,十分便捷。

二、基本産品功能分析

1.産品基本功能

操作系統:Android8.0.0

體驗版本:微軟小娜2.10.4,出門問問6.7.0-2211

Slogan:微軟小娜(從電腦到手機,你随時随地的個人助理),出門問問(随時随地,個人助理)

出門問問産品功能圖:

微軟小娜為什麼識别不了(以微軟小娜和出門問問為例)3

微軟小娜的産品功能圖:

微軟小娜為什麼識别不了(以微軟小娜和出門問問為例)4

2.功能結構分析

從整體上看微軟小娜的用戶界面更加簡潔,功能隻有語音服務及其相關功能,點擊進去首頁主界面直接為自己設定過的提醒,一目了然。

出門問問,點擊進入首頁主界面後,雖然顯示“Hi,這是你今天的安排”,但下面依次顯示的是每日簽到、開心出行(24小時天氣變化,上下班路況、限行尾号、日曆)、今日計劃、漲知識(内容推薦、每日一言、今日百科)、待辦事項。

将出行的相關功能放在了首位,雖然功能緊扣“出門”,但是不符合用戶的使用習慣。

作為一個虛拟個人助理軟件,首先顯示自然是用戶關心的東西,用戶自己設置的事項。但出門問問整體的功能更加豐富,通過一覽、興趣、發現等功能與用戶互動,有利于增強客戶的粘性。同時通過發現和商城,出售公司的硬件産品,獲得盈利。

并且從具體語音服務功能,可以看出微軟小娜和出門問問的有以下不同,如表1:

微軟小娜為什麼識别不了(以微軟小娜和出門問問為例)5

3.操作流程及操作效果對比分析

(1)操作流程

微軟小娜和出門問問操作流程圖:

微軟小娜為什麼識别不了(以微軟小娜和出門問問為例)6

從以上操作流程看,微軟小娜的操作流程更加簡便,但兩者都是通過傳統的方式點擊圖标進入界面。

微軟小娜不具備熱詞喚醒功能,出門問問進入聊天界面後可通過熱詞喚醒功能進行聊天,但十分不靈敏,技術有待提高。

輸出結果的過程出門問問比微軟小娜更快,有着更加優越的信息抓取功能。

然後輸出的形式都是隻有一部分是語音輸出,大部分依然是文字或圖片輸出。輸出的結果基本為網頁搜索結果。

(2)操作效果對比

微軟小娜和出門問問操作效果對比:

微軟小娜為什麼識别不了(以微軟小娜和出門問問為例)7

微軟小娜為什麼識别不了(以微軟小娜和出門問問為例)8

微軟小娜為什麼識别不了(以微軟小娜和出門問問為例)9

微軟小娜為什麼識别不了(以微軟小娜和出門問問為例)10

虛拟人工助手一般要由三部分組成:

  • 語音信号轉換為文本信息的語音識别系統。
  • 提取用戶說話語義信息的語義理解系統和數據挖掘系統。
  • 數據抓取系統和語音合成系統。

整體來說,微軟小娜是偏向工作方面的,出門問問是偏向出行娛樂方面的;微軟小娜所用的資源均是來自公司自己的數據—微軟必應,出門問問出現的資源大部分為外部鍊接,和各領域内的企業合作。

在相對安靜的環境下,微軟小娜和出門問問的語音信号轉化為文本信息的語音識别系統已經滿足基本的需求。

在使用過程中,30厘米的人機距離,中文語音轉化為文本除了名字和縮略詞均沒有出錯。語音識别過程中,微軟小娜會顯示正在聆聽,當使用者語音輸出完畢後,再轉化為文本,然後進行處理。

出門問問,在使用者輸出語音的過程中就會轉化為文本,語音輸出完畢後,就會顯示結果,速度很快。

在第二個階段虛拟人工助手應該能夠準确的理解用戶的需求,然後通過數據庫連接和全網搜索,将服務送到用戶的手上。

微軟小娜的語義理解更加智能,出門問問會出現差錯,如“泰山有多高”結果出現的人的身高,與用戶需要的信息相差很大。

數據方面,微軟小娜基本都是采用本公司的必應系列産品,數據就相對單一、不完善,出門問問基于全網搜索,并且和其他企業合作,信息獲取的比較豐富。

在第三個階段虛拟人工助手具有了“說”的能力,能夠将信息“讀”給用戶聽。并且也應具備挑選信息對的能力。

從技術層面看,這個過程應該有語言處理、韻律處理和聲學處理,使合成語音能正确表達語意,聽起來更加自然。這個過程微軟小娜和出門問問均沒有實現,輸出的語音不夠自然,同時輸出結果多為搜索界面,需要用戶自己進一步操作選擇,與傳統浏覽器相比沒有很大的優越性。

4.功能建議

通過對産品的體驗及其分析,可得出以下建議:

(1)熱詞喚醒功能

得到用戶同意後,能夠通過麥克風,實時檢測用戶的語音,在虛拟人工助手首頁,能夠語音喚醒語音服務。甚至當該軟件運行後,不論手機處于什麼界面都能夠喚醒語音服務,以此減少手動控制動作,提高語音服務的效率和方便性。

(2)搜索結果需改善

搜索結果需要更加簡明,通過選擇權威高的域名、容易讀容易理解的内容或者PC端排名好的内容,隻需顯示一條結果即可,避免用戶的再次選擇和點擊。

利用當下的輕量級的深度學習技術,在獲得用戶權限後,通過訪問用戶的手機其他信息和日常操作行為,獲得用戶的喜好後,為用戶提供個性化的信息,從而改善用戶體驗。

(3)信息輸出細節改善

信息輸出應該有文字輸出和語音輸出的設置,出門問問已具備此功能,但微軟小娜并不具備。在輸入的時候,微軟小娜擁有語音輸入和文字輸入兩種形式;出門問問隻有語音輸入功能,在一些情況需要用到虛拟人工助手,但不方便語音輸入和輸出,因此應該有相應的設置選項。

設置語音輸出後,在輸出結果的時候應直接有語音輸出。

首先是翻譯和計算等功能,需要直接顯示對應結果,并能夠語音輸出。對于音頻服務,顯示結果後可以自動播放,并推薦相應歌單。

對于新聞百科等信息,界面顯示之後,能自動提取用戶需要新聞和百科知識的關鍵字詞,以簡短的話語語音輸出用戶所需要新聞和百科知識,或者直接鍊接到音頻服務,進行新聞播報。

(4)語音合成需要改善

輸出語音過于僵硬,文本分析模塊的輸出可以帶有一定标記的音标序列,在這些标記中包含必要的韻律控制信息,如輕重緩急,抑揚頓挫,甚至是不同的感情風格,是語音輸出更加的自然。

(5)具體功能細節改善

控制應用功能改善:

撥打電話和發信息的理想狀态,應該是說出人名和命令就能夠打電話和發短信。微軟小娜的電話服務不能使用,出門問問需要說出電話号碼才能撥電話和短信,但通常人們是記不住電話号碼的,所以功能相當于無用,亟待改善。

打開網站,當說出一個網站名稱的時候應該是直接進入該網站的首頁,不是浏覽器首頁或者搜索界面。

提醒功能的改善:

微軟小娜的提醒分為時間提醒和地點提醒,體驗效果比較好,是為比較理想的提醒設置,出門問問針對此方面應該做出改善。

天氣功能改善:

根據手機定位和氣象數據計算,可以為用戶提供精确到街道和小時的天氣狀況,避免出現局部有雨等幫助不大的信息,為用戶出行提供切實幫助。

(6)小結:

我認為虛拟人工助手的本質是讓用戶擁有一個“無所不知”、“無所不能”的私人秘書,幫助用戶更加便捷高效的獲取信息和完成一些常規的事情。因此在技術允許的情況下,應使虛拟人工助手更加像人,各類功能更加趨向于人的行為習慣。

三、商業模式分析

1.平台模式

大數據平台

可以利用其用戶範圍内的優勢為其采集大量優質數據。

相比傳統的搜索引擎,虛拟人工助手的搜索涵蓋了用戶的工作、衣食住行甚至情感等各個方面。能夠獲得更加全面的數據,同時對用戶的情況進行精準的分析,了解用戶需求,進行個性化内容定制,推出更适合用戶需求的産品。

數據除了供自身企業使用外,也可以出售統計分析數據來獲得收入。

售賣變現

當獲得龐大的用戶數量後,通過用戶轉換,為用戶提供交流、資訊、娛樂、搜索、電子商務、辦公和企業客戶服務等全方位的一站式的服務;其次基于用戶的行為,可以通過分析衍生出相關需求,進而通過開發新産品滿足用戶的需求。

廣告平台

廣告收入一直都是平台類産品的主要收入來源,因此也可以作為虛拟人工助手的來源之一。但是内容要求與投放方式與傳統廣告投放有很大不同,在虛拟人工助手中,廣告的内容應更加簡潔有效,并具有一定的具有情感性。

在投放形式上,要更加精準定位。當用戶收到廣告後,就像朋友推薦一樣,使用戶更加容易接受其内容,從而真正成為廣告主與用戶之間連接的橋梁。

流量與傭金分成

在用戶使用過程中,能将自身流量導向指定的第三方企業,為其銷售實現提供幫助而獲得的報酬。其次可以讓商家入駐自己的平台,來賺取傭金。

2.内容模式

提供優質及獨特的内容服務,通過付費會員、會員等級、功能購買的方式,擴展收入來源。

可以與專業領域結合,與旅遊結合使虛拟人工助手成為對景點知識無所不知的小導遊,并可以提供各種外語的講解,彌補二三線城市外語導遊數量的缺少。

與教育結合使虛拟人工助手成為可以随時随地互動的老師。

與客服部門結合,減少人工客服的工作量,提高其工作效率。在這些過程中,可以以會員的形式進行,也可以直接面向B端,進行服務收費。

3.終端模式

目前的終端主要包含智能手表、手環、音響、電視等硬件産品,使軟硬件産品相結合,給用戶帶來更好的服務體驗,硬件産品及其承載的視頻、音頻、應用及其他增值服務都會給企業帶來一定的盈利。

4.微軟小娜和出門問問的商業模式

微軟小娜信息呈現形式大部分還是以搜索引擎搜索網頁界面呈現,因此延續了搜索引擎廣告收入的盈利模式。

出門問問的商業模式一方面是是軟硬結合,以虛拟人工助手為中心的跨場景聯動,推出智能手表、智能音響、問問魔鏡等産品,并與其他公司合作實現語音交互技術在戶外、車載和家居等多個場景的應用落地。另一方面,也通過給但三方企業引流,來獲得流量分成收入。

微軟小娜作為微軟公司的一個子産品,在提高技術和服務體驗的基礎上,以微軟小娜為中心,連接其他産品,可以為顧客提供一站式的服務,使微軟小娜成為一個新的流量入口。

出門問問在現有産品基礎上,可以在其商城内引入其他人工智能産品,賺取傭金服務,同時進一步推動語音交互技術在各個領域的方案落實,通過技術和内容服務獲取盈利。

四、總結

當前我們生活的方方面面大部分都要借助智能手機完成,打開手機裡面有着各種各樣的APP,滿足我們的各種需求。

以後,或許手機中隻需要一個虛拟人工助手就行了,他可以了解我們的喜好,滿足我們各種需求,給我們提供信息,幫助我們做出決策,代替我們完成常規的事。

本文由 @建川 原創發布于人人都是産品經理。未經許可,禁止轉載

題圖來自 Pexels ,基于 CC0 協議

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved