tft每日頭條

 > 知識

 > 最快的拼音輸入法是哪一種

最快的拼音輸入法是哪一種

知識 更新时间:2024-11-25 16:03:54

英文字母隻有26個,可以一個鍵盤一個字母的輸入。

中文常用字有3500個,中華字海中收入全量簡體字有8萬5千個,GB2312 編碼收入漢字20902個。也就是說無法在一個漢字一個鍵盤的方式實現輸入。

現在回頭看,中文輸入法,基本經曆了自然音節編碼輸入,到偏旁筆畫拆字輸入,再回歸自然音節輸入的過程。

輸入法輸入漢字的快慢與漢字編碼長度相關,也就是輸入漢字需要敲擊幾次鍵盤。

一、輸入法前生今世

70年底末,個人電腦開始誕生。

80年代初,個人計算機開始使用五筆和拼音輸入。

五筆輸入法快速,但是學習成本高,需要背誦詞根,嚴重制約了電腦的普及。需要經過長時間的訓練。

拼音輸入法,常常需要翻很多頁才能找到所需要的漢字。

90年代,拼音輸入法軟件開始支持詞組輸入和整句輸入,能夠做到一邊打拼音的同時顯示漢字。

1993年朱守濤先生發明智能ABC輸入法,并被微軟收購納入windows系統中。

1994年的自通輸入法,1996年的神拼輸入法,支持漢語整句輸入。然而,整句輸入錯誤率高沒能解決輸入漢字不方便的問題。

1998年,譚亞軍發明拼音之星軟件,支持實時顯示,具有字母輸入容錯功能,沒有詞也能自動推薦類似的詞。

1999年,出現了拼音加加,自由拼音和考拉輸入法,支持不切換中英文的情況下,直接Enter輸入英文,提升了中英文混合輸入效率。

2000年,智能狂拼提供更智能的輸入,紫光拼音在考拉輸入法基礎上發展而來,提供更大詞庫,并具有了智能組詞。

2006年,搜狐公司推出搜狗輸入法,該輸入法基于搜索引擎技術的新一代拼音輸入法産品,用戶可以通過互聯網備份自己的個性化詞庫,搜狗拼音輸入法一經推出很快取得巨大成功。

谷歌、騰訊、百度和微軟也相繼推出類似的智能拼音輸入法,谷歌拼音輸入、QQ拼音輸入、百度輸入法、必應輸入法。

智能手機時代,基本就是搜狗、百度、google、必應輸入法的天下了。

目前大家使拼音打字是相當快了,速度已遠超英文輸入。

二、輸入法的數學原理

輸入法的本質時将方塊形狀的漢字輸入到計算機中,将人為約定的信息記錄編碼-漢字,轉化為計算機約定的編碼(如UTF-8)的轉化過程。

1、輸入法與編碼

鍵盤上有26個字母 10個數字。

漢字編碼分為兩部分:對拼音的編碼和消除歧義的編碼。漢字編碼的長度取決于這兩方面,隻有兩個編碼都短時,輸入才夠快。

最快的拼音輸入法是哪一種(秒懂中文拼音輸入法實現的數學原理)1

最快的拼音輸入法是哪一種(秒懂中文拼音輸入法實現的數學原理)2

雙拼的主要問題:

一是鍵盤是隻有26個字母,而漢字的聲母 韻母有50多個,很多韻母共用一個字母鍵,增加了歧義,就需要不斷的翻頁。

二是增加了每次擊鍵時間,人在脫稿輸入時,拆字過程會使得思維變緩慢。

三是雙拼對讀音的容錯性不好,前鼻音an、en、in和後鼻音ang、eng、ing,卷舌音ch、sh、zh和平舌音,編碼完全沒有相似性。大部分人前鼻音和後鼻音、卷舌音和非卷舌音多少有點分不清,在輸入聲母和韻母後,翻了好幾頁也沒有找到自己要得字。

2、輸入一個漢字需要敲擊幾次鍵盤?

GBK2312 一共有6700多個常用漢字,每一個漢字出現的概率:

P1, P2,P3,... , P6700

大緻估算需要10個比特。

輸入法有26個字母,每個字母可以代表log26大概是4.7比特,

也就是說平均一個漢字需要敲擊10/4.7 約等于2.1次鍵。

如果把漢字組成詞,平均輸入一個字可以少敲幾次鍵盤,

不考慮上下文情況下,以詞為單位統計,漢字信息熵大概是8bit,則平均輸入一個漢字要敲擊8/4.7 約等于1.7次鍵盤。

考慮上下文情況下,對漢語建立基于詞的統計語言模型,漢字信息熵可以降到6bit 左右。則平均輸入一個漢字敲擊6/4.7 月等于1.3次鍵,那麼這是漢字的輸入已經比英語快得多了。

紫光拼音,是通過建立大詞庫解立大詞庫,詞越來越多,越來越長,甚至将整句唐詩作為一個詞,沒有根本做到利用上下文。

利用上下文最好的辦法是借助語言模型,而語言模型對内存要求高,而輸入法不能占有過多的内容,因此目前google、搜狗、百度、微軟幾家輸入法基本在同一檔次。

3、拼音轉漢字

其實就是拼音到漢字的轉換解碼函數,每輸入一個字母,就類似導航中車輛每走一步,利用動态規劃方法不斷調整輸出。

4、個性化語言模型

現有漢字拼音輸入法距離信息論極限還有很大距離,從理論上講,隻要語言模型足夠大,拼音輸入法的平均敲擊次數就可以接近理論值。

個性化的特點是,不同人寫東西主題不同,用詞習慣不同,說話和寫作水平不同,應該各自有自己的語言模型。

通過不斷收集個人寫的内容,訓練一個特定的語言模型,可以較快的接近信息理論值。實現快速輸入的目的。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关知識资讯推荐

热门知識资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved