空白隐形字符-tft每日頭條

空白隐形字符

科技更新时间:2026-07-23 05:15:51

作為一名程序員，無論是前端開發還是後端開發，都可能和正則表達式打交道，有時候明明肉眼可見是符合正則的，為何總是過不去呢？下面先貼一個例子，最近遇到的坑，有興趣可以先試一下複制到記事本和IDE工具内看下。

空白隐形字符（扒一扒史上最坑的空白字符）1

程序員在線找BUG

如下是一個手機号，我們需要通過正則校驗手機号合法性，看起來是完全符合手機号規則的

‭13666668888‬

不使用複雜的的正則校驗，就校驗數字11位，測試複制和手動輸入的結果：

public static void main(String[] args) { System.out.println(ReUtil.isMatch ("(1){1}[0-9]{10}", "\u202D13666668888\u202C")); System.out.println(ReUtil.isMatch ("(1){1}[0-9]{10}", "13666668888")); }

這是什麼奇奇怪怪的東西，為什麼複制到IDE工具内就多了些奇奇怪怪的，\u202D和\u202C顯然是Unicode編碼，具體不在做多解釋，查閱Unicode編碼範圍可知：

2000-206F：常用标點(General Punctuation)

這是标點範圍内的，又是不可見的标點，一般人很難察覺。

遇到這個問題的場景是：我方使用聯系方式請求第三方接口，報聯系方式格式錯誤，第一反應就是對方接口出問題了，截圖和使用文本文檔複制報文給對方（見下圖），對方也認為是自身問題，因為報文看起來有問題，對方表示他們打出的日志也是這樣，不存在編碼格式不統一問題，直到對方說他手打報文發送就沒問題，我才意識到，是不是有什麼奇奇怪怪的字符在捉妖，畢竟以前遇到過帶空格，帶tab的情況。

空白隐形字符（扒一扒史上最坑的空白字符）2

問題報文

二話不說,報文複制到IDE看一眼，當初查換行和tab就是這樣做的。

代碼正如之前所發的，有兩個Unicode編碼，再次和錄入聯系方式的人員确認：

空白隐形字符（扒一扒史上最坑的空白字符）3

似乎馬上要破案了，聯系方式是對方微信發的，可能是從哪裡複制過來的，那麼，一般聯系會從通訊錄或者其他地方複制，網上一搜，果然水果機是有這種機制的，那麼為何要引入這些Unicode編碼呢？查到有如下說法

在所有主要的Web浏覽器中内存中的字符順序（邏輯）與它們顯示的順序（可視）是不同的。Unicode 定義了它其中每個字符的方向屬性，浏覽器應用的一組規則（通過這個來進行自動判斷文本Unicode方向屬性應該使用哪種方向）在顯示時産生正确的順序由Unicode雙向算法進行描述，也可簡稱為BIDI算法。控制字符，有時候也稱非打印字符，是出現在特定的信息文本中，表示某一控制功能的字符。這類字符并不顯示，隻包含某種特定的功能。

說人話，就是有些場景，數據庫之類的存儲的是左到右，但是顯示不行，據說阿拉伯文相關的環境是右到左的，中文英文是左到右，那麼要做到國際化就要對對應文本進行處理。

日常我們書寫文字會知道，書寫的方向是決定于所書寫的文字，漢字、拉丁文字是從左至右，阿拉伯文、希伯來文則是從右至左。相應的，Unicode 字符在設計時就考慮了不同文字方向性的問題，因此定義了每個 Unicode 字符的方向屬性。

隻定義每個Unicode字符方向還是不足夠的，很多時候需要将整體字符串左右反轉，那麼控制字符就派上用場了。

U 202A: LEFT-TO-RIGHT EMBEDDING (LRE)

U 202B: RIGHT-TO-LEFT EMBEDDING (RLE)

U 202D: LEFT-TO-RIGHT OVERRIDE (LRO)

U 202E: RIGHT-TO-LEFT OVERRIDE (RLO)

U 202C: POP DIRECTIONAL FORMATTING (PDF)

PDF即是終點，水果機使用LRO和PDF即達到了控制效果，我們可以測試下LRO相反的RLO的作用，從override的意思來看，就是覆蓋了原有排版，上代碼測試：

public static void main(String[] args) { System.out.println("13666668888"); System.out.println("\u202D13666668888\u202C"); System.out.println("\u202E13666668888\u202C"); }

13666668888

‭13666668888‬

‮13666668888‬

有興趣的可以複制最後一個到IDE或者文本編輯工具看下效果。

水果機通過控制字符控制了字符的左右方向和排版方向，但是這可苦了我們這些程序員了，一不小心就找不到問題所在了，所以對于此類問題，最好就是前端或者後端做正則校驗或者替換掉有問題的字符，指望系統操作人員去手打，既容易出錯還不方便。相關示例代碼如下：

public static void main(String[] args) { System.out.println("13666668888"); System.out.println("\u202D13666668888\u202C"); System.out.println("\u202E13666668888\u202C".replaceAll("\\p{Cf}","")); }

13666668888

‭13666668888‬

13666668888

可以看到第三個順序展示了，其中\p{Cf}是不顯示的Uniicode的一個總稱，經測試郵箱内的特殊字符、區号或者分機号和電話相連的-是不會被替換的，不過查閱了下有\p{P}的說明，也有參數為C的說明，但是沒Cf的說明，不知道哪位大神可以補充說明下。

以上就是史上最坑空白字符的發現過程和具體用途，有興趣的可以就裡面具體的點再查閱下相關文檔，此處不再叙述。

更多精彩资讯请关注tft每日頭條，我们将持续为您更新最新资讯!

查看全部

网友关注

科技電容怎麼分正負極
2023-07-03
科技國行官換機是什麼意思
2023-07-03
科技 airpods續航時間
2023-07-03
科技 et200m是什麼模塊
2023-07-03
科技學信網可以重新注冊嗎
2023-07-03
科技 wdzb-byj是什麼電線
2023-07-03
科技華為art-aloox是什麼型号
2023-07-03
科技 5G網絡有什麼特點
1、高速度：網絡速度提升，用戶體驗與感受才會有較大提高，網絡才能面對VR／超高清業務時不受限制，對網絡速度要求很高的業務才能被廣泛推廣和使用，意味着用戶可以每秒鐘下載一部高清電影，也可能支持VR視頻。2、泛在網：随着業務的發展，網絡業務需要無所不包，廣泛存在。隻有這樣才能支持更加豐富的業務，才能在複... 2023-07-03
科技螞蟻集團和阿裡巴巴集團什麼關系
2023-07-03
科技 WIFI密碼忘記了怎麼在手機上找回
2023-07-03
科技淘寶雙12有活動嗎
2023-07-03
科技 140瓦一小時幾度電
2023-07-03
科技電腦鍵盤删除鍵是哪一個
2023-07-03
科技榮耀v9聲音低怎樣解決
1、可能将聲音設置得比較小，可以按音量上鍵，将聲音調節大一些。2、檢查手機喇叭口是否被遮擋，将遮擋物移開，非官方标配的保護殼也可能導緻喇叭口被堵住。3、如果連接上了藍牙設備，聲音從藍牙設備發出，建議關掉藍牙開關後查看。4、更換音源觀察（可使用系統鈴聲測試）。5、第三方應用（如微信等）将音頻系統設置為通話狀态，如果未恢複，會導緻音頻通道混亂，音樂從聽筒發出，揚聲器沒有聲音。建議重啟手機恢複。 2023-07-03
科技直流焊機正接和反接有什麼區别
2023-07-03
科技情侶黃鑽一個人能開嗎
2023-07-03
科技 win10bios怎麼進入
2023-07-03
科技刷梅林固件是什麼意思
演示機型：華為MateBookX&&TPLINK-TL-WR886N系統版本：win10以路由器為例，刷梅林固件是路由器的一種運行固件，路由器支持就是說可以刷新梅林固件，刷以後就可以不使用原廠的官方固件來使用路由器的，主要是梅林固件的設置和使用比較方便，功能也多一些。刷梅林固件能夠釋放路由器的很多功能，比如安裝遊戲加速器，增強網線寬帶，調整發射功率之類等等，将原本路由器單一的功能變得更豐富。梅林路 2023-07-03
科技專賣店和專營店區别
2023-07-03
科技斑鸠怎麼養殖才好
1、斑鸠選種鳥。斑鸠選種是很重要的一隻，一般人選種都是按大小來的，同樣的年齡越大的越受大家的喜愛，年齡在半年左右的為佳。其實一些體型相對較小，看起來很靈動，羽毛有點亂的，喜歡飛撲的雛斑鸠才是大家當種鳥的首選，這樣的斑鸠野性和活力高，後期繁衍的下一代生存率會高很多，其次這樣的病菌抗體也會高很多。2、斑... 2023-07-03
科技烏龍頭怎麼種植
1、通常情況下，每年春天的時候我們就要開始進行種植了，一般是5月份左右。因為這個時候氣溫比較适宜，不高也不低，這種氣溫很适合烏龍頭這種農作物的生長。當我們在這個時間種下了烏龍頭，到了7月份的時候它們就會開花，再過上三個月就會結果了，最後上市的時間就會在10月份左右。這個時間可是有講究的，因為一般來說... 2023-07-03
科技上網費是什麼
2023-07-03
科技 syv-75-5是什麼線
2023-07-03
科技攜号轉網能改變歸屬地嗎
2023-07-03
科技電視平面屏碎了怎麼辦
1、看電視的價格及是多少寸的，價格高的話建議是換屏幕，一般也不會太貴的，可以去家電維修的地方修下。2、看破碎程度，小的話拿膠帶粘下是不是就可以了呢，具體情況具體分析吧，太小的破碎沒啥事。3、根據壞的地方，如果正在電視屏幕的中央壞了的話，确實不好處理，因為這樣不換的話，影響視覺效果。4、看破碎的程度和... 2023-07-03
科技什麼是網絡互連設備
2023-07-03
科技華為新系統emui11新功能
2023-07-03
科技華為mate30epro是什麼
2023-07-03
科技電視機啟動不了怎麼辦
2023-07-03
科技電腦顯示器桌面顯示不全怎麼辦
1、當屏幕顯示不全時，有可能是分辨率的問題。在桌面空白處右鍵單擊，選擇屏幕分辨率選項。2、進入屏幕分辨率中，可以看到現在所顯示的分辨率大小。3、将分辨率下方的下菜單打開，将分辨率調整到最大。4、然後點擊應用，确定。5、保留修改數據，點擊确定按鈕。6、返回桌面中，可以看到四周的黑邊已經消失，現在是全屏... 2023-07-03

tft每日頭條

> 科技

> 空白隐形字符

空白隐形字符

相关科技资讯推荐

热门科技资讯推荐

网友关注