8 月 24 日,在誇克“Meet AI”開放日上,誇克 AI 視覺團隊分享了誇克在 AI 視覺技術上的研發理念和實力。
數據顯示,目前超過一半的誇克用戶使用相機來提升學習、工作效率。今年 5 月,誇克的 Slogan 由“新生代智能搜索”升級為“你的高效拍檔”。在搜索引擎之外,誇克 App 定位為「智能工具 内容 服務」的新模式,圍繞用戶的交互體驗與使用場景叠代創新,滿足用戶主動獲取信息、解決實際問題的需求。
手機掃描正在超越傳統掃描儀随着居家學習、移動工作的需求爆發,大學生和職場人對掃描的需求也發生了全新變化。誇克掃描王數據顯示,學習是排名第一的使用場景,工作需求緊随其後,用戶不僅需要清晰度更好的掃描内容,他們對後期的編輯、分享、存儲甚至創作都有了更加個性化的需求,而傳統的掃描儀已經很難滿足這一變化。
誇克視覺技術負責人黃銳華表示,誇克的用戶群體大多數是年輕用戶群體,超過一半用戶小于 25 歲,這部分用戶群體的典型職業是學生和初入職場的工作者,這些年輕人善于挖掘和使用各種工具為學習和工作提效,而簡單的搜索無法滿足用戶需求,因此誇克圍繞搜索提供了一些智能工具的能力,希望以智能為核心,滿足用戶在辦公、學習場景中的工具需求。
經過多年的技術沉澱和探索,誇克 AI 視覺技術加持的智能搜索、智能工具成為用戶獲取信息的重要入口之一,通過手機硬件與雲端強大算力結合,誇克采用業界最新的深度學習算法,構建了一套完整的訓練模型和技術能力,并且已經應用在日常學習、辦公、生活等領域中,給用戶提供智能化解決方案 。
其中,誇克掃描王就是以 AI 視覺技術為核心的智能工具,從識别、錄入、編輯、管理、個性化創意等方面,滿足不同場景下的用戶需求,幫助他們處理各類掃描問題。支持高清掃描、文字提取、格式轉換、照片修複、魔法擦除、自拍證件照等十餘項功能,把手機變成了一台智能掃描儀。
黃銳華表示,手機掃描正在超越傳統掃描儀,給大學生和職場人帶來更高效、更便捷的信息服務體驗。在基于手機相機功能的搜索行為中,大學生的學習場景占比超過一半。
誇克掃描王在雲端算力和視覺技術上的突破,幫助用戶完成從傳統圖片、文件到數字化資産的進化,提升掃描效率。
尤其在面對一些複雜場景時,誇克掃描王也針對性的提出了多項技術解決方案。當被掃描内容模糊或有污漬時,誇克掃描王可以實現自動修複并提升清晰度;針對手機掃描容易出現的角度不正、遮擋等常見問題,誇克掃描王通過智能算法和圖像識别進行擺正、校對;針對個性化的信息處理需求,誇克加大了在識别文字和版式上的技術投入,實現了提取文字、拍黑闆、加密以及擦除等實用功能。
自研多項 AI 技術,攻克掃描難題在提升手機掃描的能力方面,誇克 AI 自研了多項 AI 技術。
誇克突破了傳統光學字符識别的技術瓶頸,首次将多模算法引入文字識别領域,讓公式識别、手寫識别的效果得到了大幅度提升,印刷文字識别精度達到 99.99%,手寫文字識别精度達到 98.5% 。就算面對複雜的 Word、Excel、PPT 等闆式和結構時,誇克掃描王也能像人一樣進行深入理解,并通過自然語言處理和計算機視覺技術的深度融合,幫助用戶精準、快速的解決複雜問題。
誇克 App 視覺算法工程師顧添錦詳細介紹了多模态算法,多模态包括兩種模态,一種是圖像(視覺)數據,另一種是文本數據。在傳統的深度學習領域,圖像和文本兩個模型一般是不搭界,“井水不犯河水”的狀态。但在兩年前,業界開始用這兩種模态的數據進行混合訓練,誇克視覺 AI 團隊也進行了一些探索,把文字和圖像和文字本身進行連接,這樣就可以替代傳統的 OCR 識别算法。
這種方法的好處一方面是,在做模型訓練時,圖像特征跟文本特征可以相互驗證,提升各自的準确率。同時,降低了數據的标注成本,文本數據可以有幾十億、上百億的數據供使用,可以對大量的文本數據進行預訓練,語義部分可以輸出一些常用的文字組合的能力,再把圖像輸入進去時,對一些模糊場景有一定的文本腦補能力,這樣能大幅度提升識别的能力。
同時,誇克也把遊戲引擎數據模拟方法與半監督模型訓練方法引入到了文件掃描的模型開發中,通過深度模拟和還原快速提升文件矯正、字迹清晰度、背景雜質擦除的實際效果, 進一步拓展了手機掃描的能力和應用場景,提升用戶的滿意度、導出率。
此外,誇克還研發出了手機掃描的“離線模式”,無需網絡也可以完成高質量的掃描,能在未知的環境中進一步保護用戶數據隐私和安全。誇克也成為第一個将掃描 AI 算法上端的 App。
誇克掃描王還研發了魔法擦除、記錄屏幕、照片修複等實用功能,讓圖片更具美感和真實感。去雜質、擦除、植發等特色使用方法可以輔助用戶創作。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!