tft每日頭條

 > 科技

 > 人工智能十大技術突破

人工智能十大技術突破

科技 更新时间:2025-01-23 22:39:27

導讀:我國《人工智能标準化白皮書(2018年)》中也給出了人工智能的定義:“人工智能是利用數字計算機或者由數字計算機控制的機器,模拟、延伸和擴展人類的智能,感知環境、獲取知識并使用知識獲得最佳結果的理論、方法、技術和應用系統。”

人工智能的核心思想在于構造智能的人工系統。人工智能是一項知識工程,利用機器模仿人類完成一系列的動作。根據是否能夠實現理解、思考、推理、解決問題等高級行為。

在未來,人工智能應用主要會體現如下幾大核心技術特點。

作者:達觀數據

來源:華章科技

人工智能十大技術突破(6大人工智能應用關鍵技術)1

01 機器人流程自動化(Robotic Process Automation,RPA)

RPA(Robotic Process Automation,機器人流程自動化)的定義:通過特定的、可模拟人類在計算機界面上進行操作的技術,按規則自動執行相應的流程任務,代替或輔助人類完成相關的計算機操作。

與大家通常所認為的具備機械實體的“機器人”不同,RPA本質上是一種能按特定指令完成工作的軟件,這種軟件安裝在個人計算機或大型服務器上,通過模拟鍵盤、鼠标等人工操作來實現辦公操作的自動化。

人工智能十大技術突破(6大人工智能應用關鍵技術)2

▲圖1-1 RPA是未來辦公創新和發展的趨勢

RPA也被形象地稱為數字化勞動力(Digital Labor),是因為其綜合運用了大數據、人工智能、雲計算等技術,通過操縱用戶圖形界面(GUI)中的元素,模拟并增強人與計算機的交互過程,從而能夠輔助執行以往隻有人類才能完成的工作,或者作為人類高強度工作的勞動力補充。

自2015年以來,人工智能技術和RPA在同一時間大幅度發展和進步,恰好相輔相成,彙合在了一起。自然而然地,RPA和AI兩者的結合運用,帶來了一股非常獨特的智能化應用的發展潮流,我們稱之為智能RPA技術,或者IPA技術(Intelligent Processing Automation),即智能流程自動化技術(如圖1-2所示)。

人工智能十大技術突破(6大人工智能應用關鍵技術)3

▲圖1-2 智能RPA的構成:RPA AI=IPA

換句話說就是,RPA是基礎,需要與其他技術手段整合在一起,方能實現IPA及其優勢。

商業社會對流程自動化的功能的期望将與日俱增,将機器學習等AI技術運用到RPA中,将人工智能功能集成到産品套件中,以提供更多類型的自動化功能,已經成為未來RPA發展的主流趨勢。

02 光學字符識别(Optical Character Recognition,OCR)

OCR技術是指利用電子設備(例如掃描儀或數碼相機)将紙質文檔中的文字轉換成為黑白點陣的圖像文件,并通過識别軟件将圖像中的文字轉換成文本格式,供文字處理軟件進一步編輯加工的技術。通俗地說就是,對文本資料進行掃描,然後對圖像文件進行分析處理,以獲取文字及版面信息的技術。

OCR技術一般可分為如圖3-1所示的5個階段。

人工智能十大技術突破(6大人工智能應用關鍵技術)4

▲圖3-1 OCR技術的5個階段

下面具體說明OCR的識别流程。

1. 圖像處理

針對圖像的成像問題進行修正。常見的圖像預處理過程包括:幾何變換(透視、扭曲、旋轉等)、畸變校正、去除模糊、圖像增強和光線校正、二值化處理等。

2. 文字檢測

檢測文本所在位置、範圍及其布局,通常還包括版面分析和文字行檢測等。文字檢測解決的主要問題是哪裡有文字,文字的範圍有多大。

文字檢測采用的處理算法一般包括:Faster-RCNN、Mask-RCNN、FPN、PANet、Unet、IoUNet、YOLO、SSD。

3. 文字識别

在文本檢測的基礎上,對文本内容進行識别,将圖像中的文本信息轉化為計算機可識别和處理的文本信息。文字識别主要解決的問題是每個文字是什麼。

文字識别常采用的處理算法包括:CRNN、Attention OCR、RNNLM、BERT。

4. 文本抽取

從文字識别結果中抽取出需要的字段或要素。

文本抽取常采用的處理算法包括:CRF、HMM、HAN、DPCNN、BiLSTM CRF、BERT CRF、Regex。

5. 輸出

輸出最終的文字識别結果或者文本抽取結果。

人工智能十大技術突破(6大人工智能應用關鍵技術)5

03 機器學習/大數據分析

機器學習/大數據分析是一種用于設計複雜模型和算法并以此實現預測功能的方法,即計算機有能力去學習,而不是依靠預先編寫的代碼。它能夠基于對現有結構化數據的觀察,自行識别結構化數據中的模型,并以此來輸出對未來結果的預測。

機器學習是一種通過“監督”和“無監督”學習來識别結構化數據中的模式(例如日常性能數據)的算法。監督算法是指在根據自己的輸入做出預測之前,會從輸入和輸出的結構化數據集來進行學習。無監督算法是指觀察結構化數據,并對已識别的模式提供相關見解。

機器學習和高級分析可能會改變保險公司的遊戲規則,例如,在提高合規性、降低成本結構,以及從新的見解中獲得競争優勢。高級分析已經在領先的人力資源部門中得到了廣泛應用,主要用于确定和評估領導者和管理者的核心品質,以便更好地預測行為、規劃職業發展道路和下一任領導崗位歸屬。

人工智能十大技術突破(6大人工智能應用關鍵技術)6

04 自然語言生成(Natural Language Generation,NLG)

計算機具有與人一樣的表達能力和寫作能力,它遵循某種規則,将從數據中觀察到的信息轉換成高質量的自然語言文本。例如,自動識别會議郵件中的主題、數字地名、人名地址并生成行程表備忘錄,或者識别出合同條款的關鍵内容并将摘要的重點生成列表。

關于自然語言生成及自然語言處理的詳細介紹,請閱讀《詳解自然語言處理(NLP)5大語義分析技術及14類應用(建議收藏) 》

05 智能工作流(Smart Workflow)

智能工作流是一種用于流程管理的軟件工具,其中集成了由人和機器共同執行的工作,允許用戶實時啟動和跟蹤端到端流程的狀态,以便于管理不同組之間的切換,包括機器人與人類用戶之間的切換,同時還能提供瓶頸階段的統計數據。

随着社會和科技的不斷進步,各個領域都開始逐步朝着自動化、智能化的方向快速發展。工作流相關技術的研究也越來越受重視,并廣泛地應用于制造業、軟件開發、銀行金融、生物醫學等不同領域。

工作流不但能夠自動化地處理相關的活動和任務,減少人機交互處理過程中帶來的潛在錯誤,而且能夠精确化每一個處理步驟,最大化地提高生成效率,并且将工作流應用到動态、可變且靈活的應用場景當中。

近年來,在大數據、人工智能的背景下,工作流中的業務流程日趨複雜,所面臨的環境和數據也日趨複雜,由需求分析引起的業務過程重新建模或由維護升級引起的過程模式變更和改進也變得越來越頻繁。

在這種動态多變的複雜環境下,如何快速識别出任務,然後快速高效并有針對性地處理工作流問題,已成為目前工作流任務研究的關鍵問題。

RPA軟件機器人在工作過程中,也會遇到很多類似的情況。工作流的複雜多變,會導緻RPA作業流程的複雜多變,使其無法做到自适應,這将會大大影響RPA軟件機器人的作業效率。

因此,需要通過智能工作流的技術,實現動态地調整RPA裡的任務設定,以及RPA業務流程的自動變更和自動升級,在智能工作流的指導下實現自适應作業模式。

實現智能工作流的方法有很多,比如,美國J.H.Holland教授提出的基于遺傳算法的工作流調度,Pandey S等提出的基于粒子群優化算法的啟發式算法(PSO)可用于不同資源的智能調度。除此之外,還有很多基于自然界和仿生學的智能算法,比如,混合蛙跳算法、布谷鳥搜索算法、蝙蝠算法、人工蜂群算法等。

目前比較常見的方法是實現一種基于智能規劃的工作流處理模式,該模式不再是單純地将不同的活動當作對彼此沒有影響的單獨事件,而是有針對性地考慮多個事件的共同影響。

該模式充分考慮了工作流和智能規劃之間的相似之處,通過智能規劃推導出不同工作流任務之間的内在邏輯關系,并從其他的渠道和外部信息中充分挖掘潛在的關系。

逐步改進傳統工作流中的問題,使用全新的智能規劃的手段,從表面動作中挖掘出潛在的信息,過濾噪聲數據,進而實現流程的自動修正,最後,通過前面得出的結論,有針對性地修改之前的RPA作業流程,實現自适應性的作業模式和作業過程。

人工智能十大技術突破(6大人工智能應用關鍵技術)7

06 認知智能體(Cognitive Agent)

認知智能體是一種結合了機器學習和自然語言生成的技術,并在此基礎上加入情感檢測功能以做出判斷和分析,使其能夠執行任務,交流溝通,從數據集中學習,甚至根據情感檢測結果作出決策。換句話說,機器會像人一樣産生“情感共鳴、精神共振”,真正成為一個完全虛拟的勞動力(或者智能體)。

在客服領域,英國某汽車保險公司通過使用認知智能體技術,将客戶轉化率提高了22%,驗證錯誤率降低了40%,整體投資回報率達到了330%。

當然,德勤、安永等咨詢公司也坦然表示,就現階段許多企業的流程管理與系統的基礎能力來看,仍存在着大量的基礎建設工作有待開展。而打造智能流程自動化所需的部分核心技術(例如認知智能體等)也還停留在雛形階段。

智能包含三個方面,分别是計算智能、感知智能和認知智能。

  • 計算智能方面,計算機的速度早已遠遠超過人工的效率。
  • 感知智能方面,随着OCR、NLP等技術的發展,目前也已經能夠實現很多的效果。
  • 但是在認知智能方面,即使在某些特定領域,自然語言的處理也已經可以得到比人工更好的成績,但是在某些領域,特别是知識理解、知識推理、知識判斷等方面,還有很多需要逐步積累、逐步完善的地方。

按照機器能否産生自我認知和機器人的适用範圍,人工智能分為弱人工智能強人工智能,其中弱人工智能裡的機器沒有自我意識,不具備真正的推理和獨立解決問題的能力,通常隻适用于解決特定條件下的某種問題。當前人工智能的研究主要在弱人工智能領域。

而在強人工智能方面,機器具有一定的自我意識,能夠通過學習拓展功能。對于當前不具備的功能或者當前不了解的知識,能通過自行學習獲得。

當前條件下,全面的強人工智能還面臨技術能力、社會倫理等多方面的挑戰,但是在某些領域的特定場景下,具備認知智能能力和學習能力的人工智能軟件,不僅能夠優化作業流程、快速響應、覆蓋更多不同的情況,同時還能夠最大限度地避免技術風險和應用風險,是一個非常有價值的研究方向。

人工智能十大技術突破(6大人工智能應用關鍵技術)8

認知智能有很多種定義,其中,複旦大學肖仰華教授曾經提到過,所謂讓機器具備認知智能是指讓機器能夠像人一樣思考,而這種思考能力具體體現在如下幾個方面。

  • 第一,機器具備能夠理解數據、理解語言進而理解現實世界的能力。
  • 第二,機器具備能夠解釋數據、解釋過程進而解釋現象的能力。
  • 第三,機器具備推理、規劃等一系列人類所獨有的認知能力,也就是說認知智能需要解決推理、規劃、聯想、創作等一系列複雜任務。

智能體是指駐留在某一環境下,能夠持續自主地發揮作用,具備駐留性、反應性、社會性、主動性特征的計算實體。根據著名人工智能學者,美國斯坦福大學Hayes-Roth教授的理論“智能體能夠持續執行三項功能:感知環境中的動态條件、執行動作影響環境、進行推理以解釋感知信息、求解問題和決定動作”。

從前面的定義我們可以看出,認知智能體能夠感知到環境中的動态條件,然後根據這些條件執行相應的動作來影響現有的環境,同時其還能夠用推理來解釋感知信息,求解相關問題,決定後續動作。

将認知智能體與RPA相結合,我們能夠得到一個具備認知智能的機器人,它可以根據所涉及的應用系統和其他環境的變化動态感知下一步需要做的事情,同時執行相應的動作來影響對應的環境信息,實現智能錄入、智能監控、智能文檔處理和輔助判定。

與此同時,認知智能體通過RPA技術在處理業務的同時,還能夠學習到相關的經驗和知識,逐步掌握識别重點的能力。

認知智能體的研究包含了多種不同的方法,近年來,随着分布式人工智能、信息科學和網絡科學的不斷發展,面向動态環境下的分布式協同決策已經成為認知智能體的一個重要的研究方式。這種方式在以多無人機系統、多機器人系統為代表的典型無中心式多智能體系統中得到了廣泛的應用。

與此同時,受限于自身設計,智能體對所在環境和系統常呈現出信息的部分可觀測特征,而有限的智能體之間的交互和外部的約束也使得獲得全局信息需要付出極高的代價。

同時,無中心式的多智能體系統在應用中呈現出了與社會網絡相類似的自組結構和相應的複雜網絡特征,即網絡中單個智能體通常僅能連接/交互所在局部網絡中的小部分智能體,傳統的集中式協同模型則不再适用。

此外,類似于社會網絡中人與人之間的有限信息交換便可大大提升個體的決策效率,同樣的方法能否應用到相應的研究當中,也處于不斷的嘗試過程中。

關于作者:達觀數據,中國智能RPA領域的龍頭企業,獨立開發了全套“RPA AI”系統,擁有核心知識産權。達觀智能RPA産品是業界不依賴微軟底層開發框架、未使用第三方開源框架的RPA産品。

本文摘編自《智能RPA實戰》,經出版方授權發布。

人工智能十大技術突破(6大人工智能應用關鍵技術)9

延伸閱讀《智能RPA實戰》

推薦語:這是一部從實戰角度講解“AI RPA”如何為企業數字化轉型賦能的著作,從基礎知識、平台構成、相關技術、建設指南、項目實施、落地方法論、案例分析、發展趨勢8個維度對智能RPA做了系統解讀,為企業認知和實踐智能RPA提供全面指導。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2025 - www.tftnews.com All Rights Reserved