tft每日頭條

 > 生活

 > 輸入法帶來的慘案

輸入法帶來的慘案

生活 更新时间:2024-07-20 05:14:39

輸入法帶來的慘案(輸入法會背叛我們嗎)1

(小塵4x/圖)

2020年1月19日,“微信之父”張小龍現身微信之夜,陳述了微信未來的發展路徑,準備推出自己的輸入法,“至少在安全性方面,我們可以做得足夠好。”

他說經常會收到投訴,在微信裡聊到什麼,在其他App裡就看到這個東西的廣告。但他說微信從不會分析用戶的聊天記錄,即便因此損失了很多廣告收入。

此言一出,把輸入法推向風口浪尖。輸入法是信息洩露的“元兇”嗎?

一位受訪者對南方周末記者描述,幾天前朋友家要換馬桶,她微信回信息說了自家用的牌子,下次打開手機WPS時,開屏廣告就成了京東馬桶。“這種N年不提的話題,不可能這麼巧吧?”她懷疑是輸入法洩密。

根據Mob研究院數據,2020年搜狗、訊飛和百度三家輸入法占據了國内市場九成的活躍用戶,其中搜狗占有率最高,54%。2020年9月,騰訊全資收購了搜狗。

易觀一組數據表明,中國第三方輸入法的活躍用戶在2019年達到7.71億。輸入法已成網民剛需。

輸入法會獲取哪些信息

謝淵今年26歲,在上海一家房企工作,工作中經常需要處理文字。他曾用過三款輸入法,最後選擇了搜狗,因為它能記錄用戶的語言習慣,關聯詞庫與需求更貼合。

使用輸入法軟件需同意隐私政策,南方周末記者比照了三家軟件的隐私政策,都長達萬字,搜狗輸入法的隐私協議最長,有18791字。隐私協議過長,術語繁瑣,謝淵雖然同意了該隐私政策,但從未閱讀過。

登錄搜狗輸入法App的初始界面,提示用戶開啟設備(通話狀态及移動網絡信息)、存儲(訪問照片、媒體内容及文件)、位置、通訊錄權限。拒絕同意這四項授權,也不會影響基本功能使用。

謝淵說,“隻要不是特别冒犯,不會在意軟件要求開通什麼權限。”但看到自己開放了相冊和位置信息時,他依然詫異,并迅速将位置信息改為關閉狀态。

很多時候,大多用戶不了解開放某項權限将帶來何種影響。一位訊飛輸入法的用戶告訴南方周末記者,“不同意就不能用,我屈服了。”

梳理三份隐私政策,輸入法軟件可能收集的用戶信息有11類,涉及調用的手機權限有12項。

輸入法帶來的慘案(輸入法會背叛我們嗎)2

(梁淑怡/圖)

根據隐私政策,輸入法根據産品服務内容,在必要、合理、正當等原則下向用戶申請調用手機權限。比如,為方便用戶快速輸入好友人名而獲取通訊錄,為了加載地方詞庫、定位方言區而獲取地理信息,為了方便用戶下載、存儲表情而獲取存儲權限。

用戶同意隐私政策也不意味着同意企業收集所有類型的個人信息。

百度方面回應南方周末記者。每收集一項信息,輸入法都會彈窗提醒,由用戶選擇是否同意。“是否‘必要’由用戶決定。”

“操作日志”是一項特别的權限,針對參與用戶體驗改進的用戶,即自願提供具體信息,如操作行為記錄等,幫助優化産品。三家中,僅百度輸入法默認勾選該計劃,用戶也可取消勾選。

高遠曾在一家頭部輸入法公司工作十餘年。他透露,輸入法本身不傾向于收集過多數據,也有存儲成本,實際收集到的用戶數據比例僅為3%。因為用戶基數龐大,隻要有1%的人參與用戶體驗計劃,這些數據也夠用了。

一位從事網絡安全相關工作的人士透露,從技術原理上,輸入法的确具備收集用戶隐私的能力。實際上大部分App都具備這一能力。相比之下,輸入法是一個比較集中的口子,因此,很多金融類App會自帶輸入法來降低信息洩露風險。

拿了信息有什麼用

收集的用戶信息,輸入法将如何處理?

三份隐私協議給出了較為一緻的答案:一是為了向用戶提供基本的産品服務,二是為了向用戶推送、展示個性化廣告内容。

蔣青野從事輸入法商業化工作,他告訴南方周末記者,輸入法作為一款用戶剛需産品,活躍度高,調取次數頻繁,在頭部互聯網公司的業務生态中扮演着流量入口和“數據池”的角色。

搜狗CEO王小川曾談到從輸入法到浏覽器到搜索的“三級火箭”産品戰略:依靠輸入法導流,擴大浏覽器市場份額,培養搜狗搜索用戶。

搜索是賺錢的業務。搜狗(股票代碼SOGO.US)2020年三季度,搜索及搜索相關廣告占總營收九成左右,其中競價廣告收入占廣告收入超過八成。

南方周末記者在搜狗輸入法和百度輸入法的移動端界面上,都能看到工具欄右上角的搜索圖标,點擊該圖标可跳轉至相應浏覽器,并在該浏覽器内進行搜索。可見“三級火箭”的思路在手機上也成立。

但一位搜狗輸入法的前員工告訴南方周末記者,“‘三級火箭’是PC端時代的戰略了。”在實際工作中,感覺這一傳導路線并不如理想般通暢,輸入法商業化路徑不夠清晰,反而運營維護需要支出高昂成本。

搜狗書面回複南方周末記者,否認其自身依賴廣告和流量進行變現,但未回應盈利模式的問題。

目前,手機廠商幾乎都會預裝頭部輸入法的定制版産品。借此,各家輸入法在占據手機終端時把握主動。預裝軟件收集的信息沒有讓用戶事先同意的流程。

蔣青野介紹,輸入法廠商獲取的數據中最關鍵的是用戶行為數據和用戶安裝App的分析數據。前者為其關聯産品的智能化、大數據處理提供基礎,後者有助于為用戶的行為數據準确找到應用場景,比如,用戶需要買化妝品,會去搜索這個化妝品名稱,當她打開電商App時,就會被精準推薦該化妝品。

百度回應南方周末記者稱,百度輸入法的首要目标是為用戶在各場景各設備下提供準确、智能的輸入體驗。輸入法作為百度AI的重要落地場景,對百度的主要價值是讓用戶體驗到百度AI的實力。百度輸入法AI功能包括語音輸入、手寫輸入、整句預測等。

高遠說,百度希望輸出自己的語音識别能力,就需要獲取相關用戶數據做語音模型訓練,提升識别的準确率。百度大腦AI開放平台上,其語音識别技術在手機輸入、機器人對話、語音分析和轉寫等領域均有應用。

“頭部輸入法變現場景相對靠後。”對比了幾家頭部輸入法公司的商業化路徑後,蔣青野選擇進入商業模式較清晰的輸入法公司,它将廣告植入輸入法,用戶觀看廣告視頻後可獲得輸入法皮膚。

用戶個人信息是否會被“共享”

在A平台交流某些話題,卻在B平台出現相關資訊或廣告推送的情況,是輸入法的一種“變現方式”嗎?

南方周末記者随機咨詢了十三位輸入法用戶,1/3曾經曆上述情況,但隻有兩三個用戶能清楚回憶起具體場景,受訪者多認為是通訊軟件或手機在“竊聽”。

蔣青野解釋,一些輸入法嵌入的廣告SDK(軟件開發工具包),可以讓服務商獲取用戶畫像及标簽,以便展開個性化的廣告推薦。這也是為什麼我們在聊天場景中提到的信息會出現在其他平台。

但他補充,正規的App都會經過用戶同意獲取信息,不會作過分解讀。即使是個性化廣告,第三方SDK獲取的用戶信息也會經過脫敏、匿名處理。輸入法對接入的第三方SDK獲取的信息、調動的權限披露在隐私政策裡。

高遠舉例,通常情況下,大家用的手機或App,在能夠獲取用戶數據的前提下,會給數據打上标簽。用戶輸入的是具體的關鍵詞,輸出的是這些标簽。“用戶信息脫敏的原則就是不能被回溯到這個人是誰,否則對企業也是一個隐患。”

在前一家頭部輸入法公司工作期間,高遠曾聽到内部有人提出将脫敏後的數據轉售給第三方,用作商業活動。“公司态度還是保守的,沒有做到這一步。”

關于第三方SDK獲取用戶數據的規定,三份隐私協議表述不盡相同。

訊飛輸入法将所有SDK及其所需用戶權限及信息全數列入,同意隐私政策即視作同意第三方SDK收集并處理個人信息。搜狗、百度輸入法僅列出第三方SDK及其可能調用用戶信息權限的範圍,同時提醒還需參考第三方SDK隐私政策了解其具體如何收集、處理用戶信息。

輸入法帶來的慘案(輸入法會背叛我們嗎)3

(梁淑怡/圖)

三家隐私協議表示,用戶信息共享方主要為輸入法服務商的關聯公司、合作夥伴。合作夥伴包括廣告、分析、信息推廣服務類的授權合作夥伴,供應商、服務提供商和其他合作夥伴如第三方SDK,以及提供風控服務的合作方。

搜狗書面回應南方周末記者,搜狗不會與任何關聯方及合作方共享用戶個人信息,也從未進行過用戶交流内容的“共享”“轉售”等行為。目前接入的第三方SDK主要用于授權登錄、支付服務(針對輸入法内所涉及的付費項目)以及統計用戶規模。

百度表示,接入第三方 SDK主要為滿足産品功能需求。百度輸入法不會主動給第三方共享用戶個人信息數據。

北京厚大合川律師事務所企業法律顧問中心主任羅思翔告訴南方周末記者,用戶點擊确認同意隐私條款的所有内容,不意味着輸入法公司有權将相關用戶個人信息與其第三方共享。尤其在不明确列出信息共享主體,不能明确、具體說明用戶個人信息與第三方共享的目的、方式、範圍時,即使獲取了用戶的同意,這一“共享”行為也是違法的。

輸入法曾涉洩密風波

此前,輸入法個人信息洩露案件就曾多次發生。

2013年6月,網絡信息安全問題反饋平台烏雲在微博發布消息,指出搜狗輸入法存在導緻大量用戶敏感信息洩露的設計缺陷,在信息發送過程中相應信息被存儲到雲端,又由于相應配置和其他原因造成會話信息洩露。烏雲同時引用了三名被曝光用戶信息截圖,其中包含用戶個人敏感信息。

烏雲指出,這一漏洞出自搜狗輸入法中的“多媒體輸入”功能,用戶直接分享的圖片、語音、文字上傳搜狗服務器後,都會形成一個可點擊查看的鍊接。

風波中,搜狗将多媒體信息洩露歸咎于搜索引擎違反robots.txt,該協議是搜索引擎訪問網站時查看的第一個文件,裡頭明确規定服務器上什麼文件可以被查看。涉事搜索引擎否認了這一說法。

事後,搜狗輸入法表态将設置更嚴格的訪問限制,在robots.txt協議之外,防止搜索引擎抓取和收錄。

他發現搜狗輸入法和百度輸入法明文傳輸(即不加密)用戶輸入的内容到服務器,即使用戶未加入用戶體驗改進計劃。

不僅國内如此,國外也有一款輸入法軟件因數據庫配置錯誤而導緻3100萬用戶的個人數據暴露在網上。其曝光的信息類型從用戶身份信息到社交媒體資料不一而足。

上述案件中,輸入法洩露的原因主要為平台本身的信息安全問題,“尤其是數據庫配置錯誤,是比較低級的錯誤。”蔣青野提到,有時,輸入法信息洩露是來自外部的風險,諸如黑客反編譯、第三方程序惡意獲取數據等。

百度方面書面回複南方周末記者,為保護用戶個人信息安全,凡涉及用戶聯網通信的功能,都采用加密方式傳輸,對用戶個性化數據也進行加密、隔離,防止第三方軟件盜取。

截至發稿,科大訊飛未回應南方周末記者采訪請求。

(應受訪者要求,高遠、蔣青野為化名。)

南方周末記者 周小鈴 南方周末實習生 張坤

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved