機器學習與預測分析:未來企業提升競爭優勢的利器/Ronald van Loon
對於想在現今市場上佔一席之地的企業而言,預測資料分析(Predictive data analytics)與機器學習(machine learning)都將是不可或缺的能力;正確的機器學習策略,將有助於企業在競爭中取得領先、降低成本、進而成功達到目標。
在這兩方面取得優勢的前提包括:
大數據
首先是有效的大數據分析;所謂大數據,指的是分析極為大量的相關資料,並從其中找出行為模式或趨勢,以便讓企業改善與顧客之間的關係、並且提升產和效率。
快速的資料分析
以即時方式進行大數據分析,有助於預先鎖定並解決顧客關係、資訊安全、以及其他多種問題。
此外,如果結合大數據方法、快速資料分析、以及人工智慧技術,更將能進一步因應各種挑戰、甚至預測並阻絕可能發生的錯誤。
機器學習
那麼,所謂「機器學習」又是什麼、對企業又有什麼好處呢?
機器學習是人工智慧之中的一門學問,它讓電腦即使沒有大量預先寫好的程式,也能具備學習能力;也就是說,電腦可以透過累積「經驗」、以及自動搜尋資料,來發掘出事物的進行模式與趨勢。過去,電腦只能將這些分析後的資訊提供給人類,由人類來解讀和運用;但現在電腦自己也可以使用這些分析結果,來改變本身的行為。
那麼,這一點對企業有什麼用處?
機器學習可以運用在諸如醫療、汽車、金融服務、雲端運算、以及其他許多產業之中,讓相關的企業和專業人士得以提升下列這些工作的效率和品質:
影像分類與內容偵測
詐騙偵測
臉部偵測與辨識
影像辨識與標示
大數據模式偵測
網路入侵偵測
特定目標廣告
遊戲
支票處理
電腦伺服器監控
在以上這些領域的原始資料中,無論規模大小,其實都隱藏了許多不同的模式與深度資訊;而企業組織如果能善用機器學習功能,就可以更快的找到未來的趨勢和行為模式,並且運用在許多研究上,例如:
基因定序
汽車行車安全
石油礦藏探勘
舉例來說,英特爾(Intel)近年來開發了不少函式庫和參考架構,希望能擴大機器學習的應用、並且讓企業組織從中獲得效益方面的提升。根據最近由由Bain顧問公司進行的研究結果顯示,採用機器學習和分析技術的企業:
以資料分析結果作為基礎的決策,可增加為2倍
決策速度比競爭對手更快的機率,可提升為5倍
上述決策的執行速度,可加快為原來的3倍
獲得理想財務回報的機會,增加為原來的2倍
機器學習能帶給企業更多競爭優勢。
預測資料分析與機器學習的背景
我們可以說,機器學習是資料分析方法的形式之一;但它的起源在哪裡?又是如何發展成現在的樣子?
預測分析能力讓企業不僅可以知道「剛剛發生什麼事」,還可以知道「之後會發生什麼事」。
過去幾十年來,資訊科技有著爆炸性的成長;1995年,資料儲存的成本是每GB高達1,000美元,但2014年已經掉到0.03美元。也因為如此,資料科學家可以用更低的成本,來處理更多的資訊;同時,神經網路科技的發展,也讓資料分析和模型處理的精準度得以更高。
如同前面提到的,資料與分析方法的結合,可以為企業帶來更多機會;目前機器學習技術已經逐漸進入主流,而下一步的發展,則是比過去的分析方法更上一層、也更強大的預測分析能力。
預測分析的發展路徑
預測分析能力讓企業不僅可以知道「剛剛發生什麼事」,還可以知道「之後會發生什麼事」。
機器學習是預測分析的一部分,其中又包含「深度學習」、統計、以及其他的機器學習技術;在深度學習方面,其中有許多不同層次的演算法,讓機器能夠循序學習不同複雜程度的資料處理問題。在統計和其他機器學習技術方面,則有其他的相關演算法,來協助機器經由範例資料來獲得學習和預估的能力。
基本上,機器學習技術是以一組(或多組)資料來建立數學模型,進而用模型來訓練電腦的分析能力;然後這些電腦再藉由分析更多資料來進行預測、並且評估預測的結果。
那麼,有哪些場合是適用機器學習技術的地方呢?
還沒有人類專家的領域,是最適合運用機器學習技術的地方之一。
在許多領域中,機器學習都可以為使用者帶來競爭優勢;明顯的例子如:
還沒有人類專家的領域:例如最近對於冥王星的研究,有很大部分就依賴機器學習的成果;因為目前在這方面還沒有真正的人類專家。
人類無法自己解釋的能力或專長:我們是如何辨識另外一個人的聲音的?聲音辨識是一門很深的學問,但因為辨識聲音牽涉太多因素,連我們自己都說不清楚是怎麼辨認出別人的聲音。
解決方法一直在改變的問題:在高速公路上,前一秒交通順暢,但下一秒就出了車禍,把整條路都塞住;所謂的「最佳路線」隨時都跟著週遭的狀況一直在改變。
每個案例都不同的解決方法:對於醫師來說,每個病例都是獨一無二的;每位病人會過敏的藥物、症狀、家庭病史都不同,治療的方法也都必須依照個別狀況來下判斷。
這些只是機器學習諸多運用方式中的一些案例。
事實上,不僅對機器學習的需求正在增加,甚至已經有了一個以未來機器學習軟體為核心的生態系正在持續發展,讓企業組織可以享受到來自即時預測分析的效益。
正在逐漸演進之中的機器學習軟體生態系。
在這個生態系中,英特爾已經建構了一個最廣為使用的機器學習平台;其中使用的「Xeon」與「Xeon Phi」則是目前在大多數機器學習架構之中,最具成本效益的處理器。
導入機器學習的最大挑戰
企業在導入機器學習工具、以期能享受預測分析優點的過程中,必須克服以下的幾個障礙:
瞭解究竟需要多少資料;
導入並使用目前的資料集;
聘用資料科學家,以訂定最理想的機器學習策略;
瞭解新架構的潛在需求、或是直接使用目前的架構。
如果能訂定適當的機器學習策略,其實導入的障礙並不算太高;而且,如果考慮到它能降低的成本、以及提高的效率,就會發現其實不需要太長的時間就可以回本。
此外,領導廠商也正在協助建立一個容納開發者和資料科學家的社群,以供不同領域的人士交換關於資料分析的觀念。透過這些資訊的交換,企業將能更加瞭解預測分析和機器學習的無窮潛力、並且從運用這些技術之中獲益。