tft每日頭條

 > 圖文

 > 分享一下五筆輸入法落伍了嗎

分享一下五筆輸入法落伍了嗎

圖文 更新时间:2024-09-30 16:20:57

在之前介紹了雙拼輸入法之後,我其實沒有停下折騰的心思。從小鶴換到自然碼,又從自然碼換回小鶴,同時也打起了形碼的主意。這次實驗中,我嘗試了比較容易找到配置,也有相對較大的使用群體的形碼輸入法,并穩定在五筆輸入法到現在,持續日用了一個月左右。

先說結論:我對形碼輸入法的評價依舊沒有改變,比起作為長期的創作或日用輸入方案,五筆更适合作為雙拼這樣音碼方案的補償,尤其在目前大部分人已經有熟練音碼輸入基礎的情況下。但同樣,形碼輸入法仍然有學習的價值,有些優勢是音碼輸入注定不能替代的。

形碼:是什麼、為什麼、如何做成輸入法

形碼輸入法是一系列将漢字的部件作為碼元進行輸入的方案的統稱,與拼音和注音輸入法這樣有國家通行标準、并已經形成通識的音碼輸入法相對,形碼輸入法更是民間開發的集中區。形碼的開發更多體現了發明者個人對漢字的認識。和音碼相比,形碼輸入可以讓看到字的人即使無法認讀這個漢字,也可以通過對漢字外觀的觀察完成輸入,脫離了對讀音标注體系的依賴。

這個開發過程需要的,是對漢字形成一套完整的分拆識别規則。那麼最直白的分拆方式,就是我們在上學時都或多或少學過的「偏旁部首」。

首先,偏旁部首是有國家标準的,但它的标準并不能算是徹徹底底的「通識」。漢字作為表意文字,按國家語委的說法,合體字都可以分解出上下左右裡外的零部件,稱為偏旁,所以偏旁的數量其實可以很多;而部首就是個更小的概念,一些能組成字的部件組合,就是我們可以用來進行漢字查詢的部首,而沒有偏旁的獨體字也可以分拆出筆畫這個更加基本的單元,并以它們作為部首。對兩萬多個漢字進行歸總與整理後,國家語委根據部首的發展、結構等等,确定了 201 個主部首和 100 個附形部首。所以好消息是,即使我們不單獨開發形碼輸入法,直接用部首輸入,我們的形碼鍵盤也不會長成下面這個樣子。

分享一下五筆輸入法落伍了嗎(嘗試了七種形碼輸入法後)1

圖源:KnowYourMeme

接下來需要解決的問題,就是怎麼把這 201 個部首安排到鍵盤上了。但即使你真的這麼做了,你也會立即發現自己根本沒法輸入,因為你對标準的部首表一無所知。

舉個例子,傑、黑、叇、贛、長、既、炁,這七個字應當用于檢索的主部首分别是什麼?

分享一下五筆輸入法落伍了嗎(嘗試了七種形碼輸入法後)2

一定程度上,這解釋了字典裡為什麼會出現難檢字,我們在教學中為了方便,并沒有詳細解釋偏旁與部首的差别,也沒有解釋偏旁不一定是部首,更沒解釋清取部首的規則。簡單來說,完全以部首作為拆分的标準,說不定會帶來更多的麻煩。

那既然有官方規範的部首不好用,有沒有在電腦輸入之前就已經成體系的識别檢索系統,能給漢字編碼,還能方便地安排給鍵盤用來輸入呢?還真有。

舉個例子,我祖父查字典時會采用一種相對古老的漢字編碼方式,「四角号碼」。這套編碼體系需要對漢字四個角的結構進行識别,給予标記,根據規則生成四個數字編碼。

那既然四角号碼已經可以将漢字映射在數字按鍵上,為什麼我們不直接使用數字小鍵盤輸入漢字呢?我們不說具體的取碼規則,看看下面兩個字,尤其它們四個角的結構。

分享一下五筆輸入法落伍了嗎(嘗試了七種形碼輸入法後)3

這就涉及到了一個輸入法才需要考慮的問題:重碼。當一個形碼輸入法按照寫成的規則分拆漢字後,發現有兩個或更多漢字的編碼相同,就是出現了重碼——這其實是所有輸入法都需要解決的問題,拼音這樣的聲碼輸入法尤甚。

而減少重碼的方法很多。比如一,把編碼的數目限制去除,讓編碼可以像拼音一樣寫完每一個零件,那自然比拼音的重碼率低。這種模式的極端例子就是筆畫輸入法,按手機常用的數字編碼,赢字的編碼就是 41525135112534354 ——缺點也是顯而易見,首先隻能輸入單字,因為無法用固定長度的方法來分隔兩個字的輸入碼;其次編碼太長,輸入速度受限;再次,嚴重依賴筆順/框架結構知識,如果順序出錯,查字就會失敗。

二,是在重碼多的基礎方案上借助智能識别和用戶詞庫。比如拼音輸入法的主力從智能 ABC 到微軟拼音,再到走入大批 XP 和 Windows 7 系統的搜狗拼音,整句輸入、用戶詞庫和智能判斷詞頻成了音碼輸入法的主要方案。而對于形碼來說,采用同樣的方案顯然不如拼音這種已經成為通識的輸入策略好上手。

那麼,要讓形碼輸入法比音碼輸入法有一定優勢,就需要三,也是大多形碼輸入法采用的方法,找到更好的規律統合與拆分漢字部件,盡可能把常用漢字的編碼分開,人為減少可以獨立成詞的漢字的重碼率。

各種主流形碼輸入法的體驗

常見的形碼輸入法雖然都是以這樣的形式歸攏自己的字根,讓它們盡可能分布有規律地分布在鍵盤上,但在底層的設計邏輯和易用性上,即使是目前仍然使用者衆多的少數幾種形碼輸入法,其間的差别也是相當之大。

我選取嘗試的包括了簡體中文地區常用的五筆 86、五筆 98、鄭碼,以及繁體中文地區常用的倉颉(以及速成)、大易、呒蝦米、行列,各給了至少半天的時間學習基本規則和試打,一步步選出了我最終選定的五筆 98 輸入法。我也根據直覺,對這些輸入法主觀評了分。

輸入法

字根易學程度

鍵位易上手程度

拆字取碼容易度

簡/繁體字支持

倉颉輸入法

⭐️️⭐️️⭐️️

⭐️️⭐️️⭐️️

⭐️️⭐️️⭐️️

⭐️️⭐️️⭐️️

呒蝦米輸入法

⭐️️⭐️️⭐️️⭐️️

⭐️️⭐️️⭐️️⭐️️⭐️️

⭐️️⭐️️⭐️️

⭐️️⭐️️⭐️️

五筆 86

⭐️️⭐️️⭐️️

⭐️️⭐️️⭐️️⭐️️

⭐️️⭐️️⭐️️

⭐️️⭐️️⭐️️️

五筆 98

⭐️️⭐️️⭐️️⭐️️

⭐️️⭐️️⭐️️⭐️️

⭐️️⭐️️⭐️️⭐️️

⭐️️⭐️️⭐️

鄭碼

⭐️️⭐️️

⭐️️⭐️️

⭐️️⭐️️⭐️️

⭐️️⭐️️⭐️️⭐️️⭐️️

行列輸入法

⭐️️⭐️️⭐️️⭐️️⭐️️

⭐️️⭐️️⭐️️⭐️️⭐️️

⭐️️⭐️️⭐️️⭐️

⭐️️⭐️️⭐️️

大易輸入法

⭐️️⭐️️

⭐️️⭐️️⭐️️⭐️️

⭐️️⭐️️⭐️️

⭐️️⭐️️

字根易學程度

字根是形碼輸入法拆字的基本單元。字根是否易學、易記,決定了一個形碼輸入法在使用者心中的第一印象。用我評分最高的兩個輸入法舉例,行列輸入法是用筆劃做分組,從 A 到 ;的 10 排鍵對應十種筆劃,把 QAZ 三行作為「上中下」,字根的首筆定排(比如木,第一筆是正交 4),末筆定行(0-4 是上,5 或無是中,6-9 是下,比如木的末筆是捺 8,木字就是 4 下,對應第四排下的 V 鍵)。

分享一下五筆輸入法落伍了嗎(嘗試了七種形碼輸入法後)4

所以行列輸入法幾乎用不到專門背字根,如果你使用的是行列官方的輸入法,它還會自動給字根的提示。

而呒蝦米輸入法使用的則是聯想法,比如哈字,能拆成口和合,而合的上半部像 A,所以哈的編碼就是 OAO。除了字形,它還采用了字音、字義等等聯想,比如部字就是立 L(音)口 O(形)阝 B(形)。但字根較雜,有的聯想也很離譜,比如隹形似佳,佳是 Very good 所以是 V,還有一些隻能硬記,少一星。

鍵位易上手程度

除了字根設計的科學性,鍵位設計的合理可以讓輸入法的上手更快。行列和呒蝦米的鍵位更易記,是因為它們自己有一套與按鍵交互的規則,要麼是和字母直接建立聯系,要麼是無視鍵值去和位置建立聯系。類似地,五筆輸入法的一丨丿丶乛分區也是和位置建立聯系,但為了平衡字根的分布,還有不少的特例需要專門記憶。

而堪稱鍵位災難的,在我心中非倉颉和鄭碼莫屬。它們的字根排列的設計完全按照字母表順序,自己有内部邏輯,但放到鍵盤上,意義接近的按鍵卻隔了十萬八千裡。而鄭碼比倉颉低的那一星,是因為倉颉是繁體中文鍵盤的标配标識字根之一。

分享一下五筆輸入法落伍了嗎(嘗試了七種形碼輸入法後)5

至于同樣鍵位看起來沒什麼規律的大易輸入法,首先它是繁體中文鍵盤标準附帶的字根之二,其次它按内涵進行的字根分組和官方給的記憶方法其實沒什麼關系,字根分組講五行動物自然頭頭是道,一看記憶方法全是諧音梗。

分享一下五筆輸入法落伍了嗎(嘗試了七種形碼輸入法後)6

看得我頭疼

拆字取碼容易度

拆字取碼是否适合人們的日用頻率,是否符合寫字、認字的一般規則,都會影響拆字取碼,尤其對初學期剛剛了解基本字根的使用者。比如我們相對比較熟悉的五筆 86,我個人感覺它難上手,是因為它為了兼容一些部分部件相通的字形,采用了很多本身是破碎的字形,比較典型的例子就是「母」字。

分享一下五筆輸入法落伍了嗎(嘗試了七種形碼輸入法後)7

「母」在 86 版中為了兼容「毋」取了一個外框作為字根,可其實沒多少人天天打毋和毐,卻天天有人打繁海晦敏,而且這個先取橫再取兩點的取根方法也是和正确的筆順相悖的。98 版的字根設計就更貼近一般的識記原則,并糾正了不少筆順的錯誤,初學時拆起來也更容易猜對。

倉颉的拆字取碼則是另一種方式的不直觀。倉颉是把字元拆得太碎,認真地把字先拆成偏旁,再給每個偏旁取首碼和二碼。這樣做其實挺科學的,重碼率可以做到非常低,可從入門到日用的學習時間會比較長。所以現在更流行的是隻取兩碼的速成倉颉,但速成又把重碼率高的問題帶了回來。鄭碼其實也有類似的問題,它的優缺點也和倉颉差不多,不同的是鄭碼先天有更好的簡繁體兼容性,而且拆解跟随筆順;倉颉則是以字形為準,比較不符合我對「寫字」的理解。

簡繁體支持

如果前面這些都能克服,最後這項就是一錘定音的了。這些形碼輸入法中,學究氣最濃的鄭碼天生就是連異體字和罕見字都能直接通殺,别的大部分以繁體中文為基礎,隻有五筆是完全以簡體中文為基礎設計。在我的理解中,這可能和注音符号體系本身就需要和鍵位做一次對應有關。幾種繁體輸入法中除了大易都給簡體中文做了适配,隻是由于主要的服務對象還是繁體中文,當遇到簡繁重碼時,默認狀态下這些輸入法都優先展示繁體。此外,Windows 等系統自帶的輸入法也對使用這些輸入法輸入簡體的支持不甚完好。

使用形碼輸入的感想

作為一個簡體中文為主的輸入者,在這些限制條件下,五筆似乎成了我最省事的選擇——是的,從上面我的主觀評價裡就能看出它并非最優選,但每個需求它都能用一個不算太爛的方法實現。而在每天使用形碼接近一個月後,我仍然不能大方地推薦其他人也嘗試形碼,因為在達成足夠的速度之前,它的收益實在是太低了。

先來說說我感知到的優點。

四碼上屏和選字減少

四碼上屏或是五碼上屏可以說是重碼率低的輸入法的特權,因為隻有對輸入碼有限制,并且沒有選字負擔時,才可能抛棄空格和數字鍵。而且得益于簡碼的存在,輸入一個字的擊鍵次數其實不會有太大變化,如果算上輸入詞語帶來的擊鍵次數減少,整句的擊鍵次數甚至會比雙拼輸入時更少,尤其是當句子中出現了不常用的字詞時,不再需要來回翻找的感覺非常好,這還是在我的輸入算不上流暢的前提下。

在一段時間的習慣之後,常用詞我已經可以不需要額外思考字形就直接打出來了,速度也有所提升。而且錯字也明顯減少,畢竟五筆詞的 typo 打出來,連猜都猜不出原本應該是啥,強行讓我多了一次檢查。

查字與搜索變得簡單

另一個明顯有優勢的場景是搜索與認字。和自己寫文章不同,查不認識的字時,腦子或眼睛裡是一定有這個字的長相的,不依賴音碼後,我查字終于不用再靠描述了。類似地,搜索查資料也是一樣,關鍵詞會直接在腦中有具象的詞,這種時候照着把詞打出來就好。繁體字也可以直接拆字輸入,不用臨時 Ctrl Shift F,也不用擔心把罕用字的詞頻刷上來。

剩下的就都是大大小小的問題。

輸入法支持不佳

我本來就是雙拼的使用者。往前查幾年,雙拼在各大内置/主流第三方輸入法中的适配都成問題,一方面是使用者人群本就不大,另一方面是方案太多,想适配内置也要看看是哪些方案用戶更多,可能還要關注方案的版權問題。

形碼輸入法的支持則更加離譜。我自己選擇的方案是五筆 98。我能接觸到的設備中,隻有 iOS 内置了五筆 86、98、新世紀三個版本的支持,Windows 原生支持的隻有使用範圍最廣的五筆 86。Android 則要看廠商選擇的輸入法合作方,有的時候五筆支持會被去除,至于我最喜歡的 Gboard,則完全沒有支持五筆輸入法,我選用替代的是基于 Rime 的同文輸入法,體驗隻能算是一般。Windows 這邊,為了五筆 98,我使用 wubilex 五筆助手替換了原生的碼表,又重新安裝了 Rime 小狼毫配置方案。

原本我是希望自己可以在電腦上用五筆,手機繼續雙拼的,可是實際操作後,我就開始輸混編碼了,隻能統一到五筆練習。

高度依賴碼表與詞庫

所有的形碼輸入法,或者說所有的輸入法,都是基于碼表的輸入方案。而形碼這種基于漢字的方案即使支持了詞語的輸入,也隻是作為單字輸入的一種輔助。能輸入的詞取決于碼表,而大部分的五筆輸入法并沒有自定義詞的功能,隻遵從那套之前寫死的碼表,或是直接導入寫好的外部碼表。至少在我目前的測試中,隻有 Rime 能在輸入中自動學習用戶詞。

還有一項,說不上好壞,但我覺得相當有意義。

提筆忘字的啟示

其實輸入速度上,經過三個星期的日常使用,五筆已經基本在日常使用上逐漸跟上了我的思考速度,需要為了提高速度而換回雙拼的次數越來越少(,我的雙拼輸入也越發不熟練)。

真正能讓我卡殼的,就是突然遇到不常用的詞,或是突然發現怎麼也拆不對字時,前者我需要重新過一篇把讀音轉化成漢字,在腦海中具象再拆出來的過程,後者則往往是我把字的筆順搞錯,或是幹脆把同音字弄錯了。如果不是強制自己用形碼輸入法,我恐怕還一直堅信自己能把所有字形一次寫對,比如瓦的筆順是最後寫點,龍字的右半的筆順是橫、豎折折、橫、豎彎鈎、三橫。

在我的理解中,如果不是像我一樣對這些工具與方案本身就帶有極大的興趣,顯然是沒必要多學一種如今用起來已經不算方便的輸入法的。如果學了,大概率也就是和我之前一樣,會一個額外的輸入方式,在網上遇到不認識的字查字典時有一個擡手就打的方法。若是論速度和便利程度,尤其是對需要大量創作文字的使用者,恐怕沒幾個輸入法比得過帶有動态詞頻和智能詞庫的現代音碼輸入法。

于我而言,形碼輸入法是一個很好的複習漢字的方式。一旦當我們把目光集中在單個的漢字上,就會發現自己之前對這些美麗的符号到底有多大的忽視。我還會繼續使用五筆輸入法,看看能不能讓自己的輸入速度逐漸趕上之前雙拼的水平,至于未來可不可以繼續堅持,就要看會不會有輸入法能把五筆 98 的支持做得更好了。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关圖文资讯推荐

热门圖文资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved