作者 | Niccolo Mejia
編譯 | CDA數據分析師
What is Predictive Analytics? – An Informed Definition
預測分析可能是金融機構,銀行,保險公司和醫療保健公司使用的最常見的AI應用程序之一。這種類型的軟件使這些行業的業務領導者可以規劃信貸,貸款和患者健康等業務領域中最可能的結果。預測分析軟件可以使用曆史企業數據根據典型的公司經驗對未來的業務事件做出預測。
在本文中,我們定義了預測分析,并展示了該領域專家的其他定義。我們介紹了AI和ML如何幫助預測分析用作商業智能工具的背景。此外,我們還提供了一個示例性預測分析供應商的示例,以及該公司的AI解決方案據稱可以如何幫助各種行業的客戶。我們對預測分析的解釋始于我們自己的定義,以及上下文說明軟件如何從機器學習]算法中受益。
預測分析是一種工具,用于使用企業數據來預測組織所選業務領域中的變化。這使組織可以根據組織過去觀察到的現象計劃最統計上可能的結果。
當預測分析由機器學習模型提供支持時,它就是一類AI軟件,但這在最近幾年才變得越來越普遍。在此之前,術語“預測分析”是指使用多種不同的商業智能技術來确定最可能發生的未來事件。
但是,這些技術并不複雜,無法提供表明最可能結果的置信度得分或統計百分比。取而代之的是,使用企業數據來創建預測模型,該模型僅顯示軟件如何得出結論以及為何可能發生預測結果。
由機器學習提供支持的預測分析應用程序具有利用大量數據并基于該數據做出更準确預測的能力。機器學習能夠處理更大的數據集,因為它需要盡可能清晰地顯示組織業務曆史的圖像才能正常工作。一旦對機器學習模型進行了與組織所選業務領域有關的數據的培訓,它便可以自動化用于進行預測的分析技術。
這些預測通常包括一個最可能的結果列表以及一個置信度分數,該置信度分數指示基于軟件估計的預測的準确性。如果軟件做出的預測得出的置信度分數低于某個特定數字,它将不會将該預測發送給用戶。此置信水平通常設置為很高的間隔,例如90%或92%。重要的是要注意,為預測分析應用程序訓練機器學習模型需要大量的結構化數據以及試用安裝時間。這等于将結構化數據輸入到機器學習模型中,直到能夠識别客戶組織業務中的趨勢和模式為止。
一旦模型可以識别重要的信息類型,例如索賠額或醫院再入院,組織将需要将其集成到其技術堆棧中并允許其在後台運行。在這段時間内,機器學習模型将像使用舊數據一樣進行訓練,除了業務的當前事件。業務主管可以在這段時間内檢查軟件的預測,以觀察其不斷提高的準确性。例如,用于預測客戶流失的預測分析應用程序将需要在大量曆史數據存儲庫上進行培訓。然後,需要将應用程序安裝到客戶公司的網絡中,并允許其運行試用期。試用期結束後,該軟件應能夠在真實的客戶行為與客戶流失的曆史原因之間建立關聯。這樣,它就可以預測單個客戶是否會留在客戶公司。
創建了預測分析應用程序的供應商通常會說明需要進行多長時間的試用,并且如果客戶希望繼續使用該軟件,它将已經部分安裝。
“預測分析是一種從經驗(數據)中學習以預測個人未來行為以做出更好決策的技術。” – 預測分析的作者:埃裡克·西格爾(Eric Siegel):預測誰會點擊,購買,說謊或死亡的力量 預測分析是…不同技術和領域的結合。基本上,目的是根據過去的曆史事件來預測将來的事件。…如果我們将其與Google Analytics(分析)進行比較,那隻是在研究數據。預測分析,有一個自動預測因素“[為其解決問題。 - 德國桑奇斯-Trilles,CEO和聯合創始人Sciling信息技術和服務。 預測分析将高級統計功能結合在一起,包括臨時統計分析,預測建模,數據挖掘,文本分析,優化,實時評分和機器學習。這些工具可幫助組織發現數據模式,而不僅僅是知道發生了什麼,還可以預測接下來可能發生的事情。-–- IBM
Dataiku是一家成立于2013年的紐約創業公司。他們聲稱已創建了機器學習技術,該技術可以分析原始數據以構建多種格式的預測模型。該原始數據可以采取來自客戶交互的單個産品或銷售記錄的曆史交易的形式。Dataiku聲稱他們的AI軟件可以幫助企業識别某些數據點之間的關系,從而可以提高效率和降低公司支出。富國銀行等主要銀行每天都會生成大量原始客戶數據,這些數據可能來自客戶對話,社交媒體帖子,網站活動,營銷活動和交易信息。處理這麼多種不同的數據類型的能力可能為銀行客戶帶來以下好處:
當Dataiku用戶登錄系統時,他們可以上載要由軟件組織的數據。Dataiku聲稱數據以電子表格的形式顯示并自動組織。該軟件會将每個數據點與它在新集成的數據中檢測到的某些共同特征相關聯。因此,當公司表示可以檢測到特定數據是與男性還是女性客戶相關聯時,它們意味着該軟件已經為某些客戶行為建立了性别關聯。此外,每列頂部都有一個比例刻度,以便傳達與該類型數據相關的缺失值的數量。
然後,用戶可以單擊每列的标題以可視化數據,這可以使他們以圖表或圖形的形式查看此數據。據稱,它們還可以生成交叉引用不同列的圖形。如果用戶認為數據中可能存在異常值,則軟件可以提示用戶如何更正它們并進一步培訓軟件。以下4分鐘的視頻是Dataiku的演示。這顯示了企業如何使用此預測分析應用程序來編輯,監視和查看從原始數據中收集的見解。
預測分析在制藥行業中最突出的用途之一是臨床試驗的設計和優化。這樣的應用程序可以分析患者的病史,以确定哪些患者對被測藥物的反應最佳。這有助于公司找到最好的患者來嘗試招募參加臨床試驗。這種類型的軟件解決方案還可以幫助制藥公司以多種其他方式設計和組織臨床試驗。這些研究包括該藥物可能産生的副作用以及哪些患者最有可能經曆這些副作用的研究。另外,一些應用可以允許遺傳聚類,或根據患者對藥物反應良好的可能性進行細分。
以下是供應商Dataiku的演示視頻,展示了他們稱為DSS的軟件平台。該演示将引導觀衆完成用戶使用數據集來預測醫生使用不同藥物處方的過程。盡管視頻長13分鐘,但最重要的部分也列在下面:
醫療保健公司可以使用預測分析應用程序來幫助防止患者再次入院,預測患者健康狀況下降以及預測患者錯過約會的可能性。AI供應商Health Catalyst提供了一種解決方案,他們聲稱可以使用患者的病曆作為數據來完成所有這些任務。
集成後,醫院可以登錄Health Catalyst儀表闆并顯示患者資料。該個人資料将以百分比的形式顯示患者患上重病,錯過約會或以後被重新接納的可能性。這可以使醫療保健提供者密切關注由于忽視健康而處于較高風險中的患者。
預測分析可以幫助金融機構預測與貸款或發行信用卡相關的風險水平,包括客戶違約的可能性。這對于嘗試通過增加活躍貸款的數量以及每筆貸款的數量來進行增長的機構特别有用。當這些貸款以信用卡的形式出現時,機構可能需要一種策略來預測與每個申請相關的風險。
預測性分析應用程序可以使用申請人的信用評分,信用曆史記錄和整體财務曆史記錄(如果有)來計算此結果。此外,這種信用風險評分可以幫助金融機構實時識别不正确的付款金額。這可能會增強機構在完全處理欺詐性付款之前的能力。
在保險業中,支持機器學習的預測模型可以幫助企業防止客戶流失,從而使客戶保持更長的時間。某些應用程序可以根據客戶為保險公司提供的終生價值來對其評分。這種類型的應用程序對于尋找向這些客戶進行營銷并吸引他們提高保險計劃的新方法可能很有用。
保險公司可以不使用客戶的個人金融行業,而可以簡單地利用與客戶的曆史和交易數據來估算他們将來将繼續提供多少價值。可以認為是客戶流失的證據的數據可能是客戶使用保險或與客戶服務進行溝通以更改或改善其計劃的頻率。
掃碼進入CDA官方小程序,解鎖更多新鮮資訊和優質内容,還有免費試聽課程,不要錯過喲!
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!