從 Symbian 時代到如今的 iOS 和 Android,在手機上,我們已經經曆了一次從物理鍵盤到虛拟鍵盤的輪回。鍵盤從屏外到屏内,但手機輸入法依然還是那個輸入法,隻是它已經從單純的文字輸入工具,進化成了以文字輸入為核心賣點的「百寶箱」式的 APP。
它不隻是能幫你打字,還能幫你搜索、幫你鬥圖,甚至幫你翻譯。
有人會嫌棄說「手機輸入法變得越來越臃腫了」,但實際上手機輸入法的功能變得越來越強大和全面,也是不争的事實。輸入法之所以會向功能全面化進化,顯然是離不開中文輸入法這個大環境下的激烈競争。
尤其是搜索巨頭的進場,搜狗輸入法、塞班末期借殼點訊的百度輸入法和收購 A4 完成布局的 QQ 輸入法,為了「搜索截流」這個目标布局手機輸入法市場的搜索巨頭,直接推動了輸入法的功能進化。
搜索巨頭之所以看中輸入法,是因為「輸入」是用戶表達自我的基礎需求——你可以不使用任何一個手機 APP,但鍵盤任何人都必不可少——布局輸入法既能為用戶精準畫像,也能從用戶點擊輸入框的第一時間,就截取用戶的搜索流量。把輸入法用作一個可以無視時間和空間的 Launcher,做搜索引擎的百度、搜狗、騰訊瞄準輸入法是這個思路,做 AI 的訊飛瞄準輸入法,同樣也是這個思路。隻是百度在打字之餘位用戶提供了搜索入口,而訊飛為用戶提供了AI。
AI,正是訊飛的拿手好戲
2010 年發布時,訊飛輸入法更像是專長智能語音和人工智能技術的科大訊飛的 to C 先行者,拿出最新的技術在市場上試錯。而在逐漸叠代的過程中,訊飛成長成國内用戶增長第一、市場份額次席的手機輸入法,靠的正是科大訊飛在智能語音和人工智能領域的 20 年沉澱。如果跟熟悉手機輸入法的手機用戶提起訊飛,他們的第一印象一定是:語音無敵。
科大訊飛的「智能語音」和「人工智能」,落地在訊飛手機輸入法上,理所當然會是語音輸入。在聯網狀态下,訊飛輸入法目前可以支持除了普通話之外的粵語、閩南語、四川話等 23 種方言,以及英語、日語、韓語、和俄語等外文,甚至中英混輸也能無壓力識别。
這中間涉及到的一系列複雜的機器翻譯、自然語言理解、機器推理、知識發現,而且幾乎每一種方言 / 語言基本上都是一套獨立的語言系統,都既需要長時間的大量機器學習積累,也需要技術積累。而這恰好是背靠科大訊飛的訊飛輸入法的優勢所在。一方面,其背靠有 20 多年智能語音技術沉澱的科大訊飛,擁有超過 20 萬小時訓練數據積累;另一方面,科大訊飛有太多的國際賽事頂尖榮譽,比如2018年的國際權威英文語音識别大賽“CHiME-6”中,科大訊飛包攬了兩項第一名;2019 年在 ICDAR2019 舉辦的場景文本視覺問答挑戰賽 ST-VQA 中,科大訊飛包攬了三項冠軍。
在 2018 年訊飛輸入法就已實現 1 分鐘 400 字的高速輸入,而且能夠将識别率保持在 98% 以上。98% 的識别率意味着識别出錯的概率會非常小,而即便是因為主觀或者客觀原因識别出錯,也可以簡單手輸修改幾個字詞調整,易用性相當可觀。
要知道,在保證輸入準确的前提下,我們普通人在手機上手輸文字的速度大概在每分鐘 60 字以内,所以訊飛的語音輸入速度,基本上是手動輸入的 6 倍左右——這種輸入速度上的碾壓,往往能顯著地提高效率,尤其是在那些需要大量輸入文字的場景裡面,比如商務對接工作。
而且,在手機大屏化趨勢導緻手機的握持手感和輸入體驗都不夠理想的背景下,語音輸入不隻是更高效,而且體驗也會更加自然,畢竟,同樣是輸出文字,按住空格鍵「說話」毫無疑問要比抱着手機「打字」更加自然。
在更開放的 Android 上,訊飛能直接調起鍵盤錄入語音實時轉換文字,而不需要在當前 APP 和訊飛輸入法的 APP 之間跳轉,體驗非常流暢,邏輯清晰、使用也簡單。而且不管你是習慣用什麼方言,訊飛都能精準識别,這就非常符合國人的方言衆多、習慣不一的現實了。主流的方言,包括粵語、四川話、閩南語、上海話、武漢話等超過 23 種方言,延伸出的藏語、維語 2 種民族語言,都能直接在訊飛裡面語音輸入,而不需要從日常的語言氛圍裡面切換到普通話之後再語音輸入,消除了體驗痛點。
當前的語音輸入不可能不出錯,距離100%準确最後“一公裡”,訊飛輸入法也拿出了解決方案——智能糾錯的語音候選詞。實際體驗可以感知,在語音輸入過程中自動糾錯,AI提供了中、英候選建議,大大節省修改和重輸的時間。
但在訊飛輸入法上,落地科大訊飛智能語音和人工智能技術的并不隻有語音輸入這個功能,而是鋪開為更廣義的語音轉文字、文字識别在内的一些列工具性質的功能,比如文字掃描、語音便簽、實時翻譯。
OCR拍照取字有奇效
在訊飛的工具箱中啟用之後,我們可以直接在 APP 内工具欄上直接啟動訊飛的 OCR應用——也就是文字掃描功能。
OCR 主要涉及到為計算機視覺技術(包括了圖像識别和圖像理解),也是屬于人工智能的主要技術之一,基于語義分割的文字檢測方案,訊飛輸入法通過在特征圖上對每個像素進行前景和背景的分類,可以實現任意方向、任意形狀的文本行檢測。得益于此,訊飛輸入法的 OCR 拍照取字的速度和成功率也非常可觀,基本上可以做到立拍即取,而且取字之後還支持後續的翻譯操作,所以用作出國旅行的實時翻譯工具也有奇效。
語音便簽功能實際上是訊飛輸入法語音輸入的翻版,核心功能仍然是語音轉文字,但它不是用作文字輸入而是用作備忘,可以直接把臨時産生的思考直接轉換為文字存儲起來。
實時翻譯對大衆而言為剛需中的剛需。輸入法如何讓翻譯更普及,着實做了有用功。譬如,訊飛輸入法搭載了快捷翻譯(文本翻譯文本)、随聲譯(語音翻譯文本)以及面對面翻譯(線下場景的語音翻譯文本并支持語音播報)。和線上的「翻譯器」一樣,随聲譯是通過語音識别 - 翻譯轉換實現實時的雙語互譯,目前訊飛輸入法内支持的互譯語言包括英、日、韓、俄等多種語言與中文互譯。也就是,說中文譯外文,說外文譯中文,說是語音輸入的加強版也不為過。
輸入,訊飛同樣可圈可點
這些基于智能語音和人工智能的功能,是訊飛輸入法相比其他競品的相對優勢,不過作為目前市占率第二的中文輸入法,訊飛的基礎功能——也就是文字輸入,也非常強大。
影響中文輸入法按鍵出字效率的,包括這幾種因素:
1.輸入方式
2.詞庫(包括候選詞)
3.選詞效率
4.輸入輔助
如果分開各項來看,訊飛在分項中即便不是在所有輸入法中沒有做到最好,也至少是處于主流水準,并以肉眼可見的速度提升。
輸入方式,豐富趁手
輸入方式上,以國内用戶典型的中文輸入為例,訊飛支持既支持主流鍵位比如 9 宮格拼音、全鍵盤拼音、筆畫、手寫和語音,而且它還可以支持拼音雙鍵這種小衆的鍵位;支持點劃、經典布局,或者 iOS 系統布局;支持全拼或者 7 種雙拼、繁簡輸入……
詞庫,助力輸入效率
而至于詞庫,訊飛這種頭部的輸入法都有大量的分類詞庫、同時支持雲輸入,所以專用詞彙以及熱點詞彙的輸入效率都非常高,基本上不會出現自帶輸入法非常用詞需自造的情況。
選詞效率,智能調頻
訊飛在候選詞上仍然使用了自己拿手的機器學習,在海量數據訓練優化之後,訊飛能智能預測用戶的輸入習慣,結合字頻詞頻和上文語義,智能調整候選詞。
輸入輔助,戲也很多
在偏娛樂化的社交場景中,訊飛輸入法還支持輔助輸入一些流行等的表達方式,比如火星文、刷屏模式、咆哮模式,專門的「BiuBiu 工具」,來收納所有包括 emoji 聊天在内的趣味聊天方式,無論你是不是這些聊天方式的受衆,偶爾嘗試一下也會非常有趣。
所有這些輸入功能,讓訊飛輸入法具備有高效輸入工具的能力,再加上公認的強大的語音輸入能力,訊飛至少在中文相關的輸入場景下,稱得上是輸入效率最高的中文輸入法之一。
當然,因為有科大訊飛的智能語音和人工智能技術的加持,訊飛手機輸入法不隻是一款做得不錯的「中文輸入法」,而是一個以智能語音功能為核心的、加入了大量輸入輔助功能的Launcher,它所能提供的,已經遠超過中文輸入而已。
這款輸入法,遠不止輸入法。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!