好書導讀:工業大數據
編按:本站自即日起與多家出版社合作,由編輯為您精選最近出版的科技相關書籍內容,經授權後小幅改編為文章形式供您閱覽;希望您在繁忙的日常生活中,能以精簡方式吸收新書精華。
以下內容摘自原書,文中第一人稱為原書作者。如果您有任何討論或意見,歡迎您在這裡留言,原書資訊請參閱文末介紹。
工業4.0的大數據環境
大數據是工業4.0時代的一個重要特徵,為什麼?在美國和德國的工業4.0規劃中都提到了大數據,而大數據在工業領域中的興起主要由以下因素所決定:
設備自動化過程中,控制器產生了大量的資料,然而這些資料所蘊藏的資訊和價值並沒有被充分挖掘。
隨著感測器技術和通訊技術的發展,獲取即時資料的成本已經不再高昂。
嵌入式系統、低耗能半導體、處理器、雲端計算等技術的興起使得設備的運算能力大幅提升,具備了即時處理大數據的能力。
製造流程和商業活動變得越來越複雜,依靠人的經驗和分析已經無法滿足如此複雜的管理和協同優化需求。
這些正是工業大數據的來源,那麼,這樣的大數據環境是如何形成的?工業4.0的基礎特徵在於互聯與高度整合,互聯包括了設備與設備、設備與人、人與人、服務與服務的萬物互聯(Internet of Everything)趨勢,高度整合包括了縱向、橫向的「二維」戰略;這些目標都是能夠將設備資料、活動資料、環境資料、服務資料、公司資料、市場資料和上下游產業鏈資料等等在統一的平台環境中流通,這些資料將原本孤立的系統相互連接,使設備之間可以通信和交流,也使生產過程變得透明化。
從一般意義上講,普遍認可大數據具有「4V」的特徵,即:
量(Volume):即非結構化資料的超大規模和成長速度。
速度(Velocity):即即時分析而非批量式分析,資料的產生與擷取頻繁。
多樣性(Variety):即大數據的異構與多樣。
真實性(Veracity):即資料蒐集和提煉過程中發生的資料品質汙染所導致的「虛假」資訊。
而在工業4.0中,大數據還應該有兩個V。
一是可見性(Visibility),即透過大數據分析使以往未見的重要因素和資訊變得可見;二是價值(Value),即透過大數據分析所得到的資訊應該被轉換成價值。
值得一提的是,前4個V代表了大數據的現象,是工業資訊化和自動化發展到一定程度的必然。而對於工業4.0從設備製造端向使用者服務端的轉型而言,後兩個V則代表了工業界對於大數據所追求的目的與意義,這一點,可能比刻意追求和製造大數據的環境更為重要。同時,對於大數據在當前工業環境中的價值,能夠體現在如下幾個方面:
使原本隱形的問題,透過對資料的挖掘變得顯性,進而使以往未見的風險能夠被避免。
將大數據與先進的分析工具相結合,實現產品的智慧化升級,利用資料擷取產生的資訊為客戶提供全產品生命週期的加值服務。
利用資料尋找顧客價值的GAP,開拓新的商業模式等。
大數據分析主要有三種形式:
Descriptive:基於對資料的統計分析,描述資料表現出的客觀現象與規律。
Prescriptive:利用歷史資料建立分析模型和標準化的分析流程,建立資料到資訊的輸入輸出關係,實現對連續資料流程的即時分析。
Predictive:透過對資料的深層挖掘建立預測模型,實現對未見因素的現況和未來狀態的預測。
工業大數據 vs. 互聯網大數據
在有關工業4.0的規劃中,美國和德國同時強調對於工業大數據進行分析的重要性,實際上,大數據分析技術最早並非興起於工業領域,而是互聯網中產生的社會和媒體大數據,且傳統互聯網大數據的分析手段主要是按照前文所述的4V特性去建置與發展的。然而,僅僅依靠傳統的互聯網大數據分析技術,並無法滿足工業大數據的分析要求,原因在於工業數據具有更強的專業性、關聯性、流程性、時序性和解析性等特點,而這些特點都是傳統的互聯網大數據處理手段所無法滿足的。
因此,有別於互聯網大數據,工業大數據的分析技術核心要解決重要的「3B」問題:
隱匿性(Below Surface):即需要洞悉背後的意義。
工業環境中的大數據與互聯網大數據相比,最重要的不同在於對資料特徵的提取上面,工業大數據注重特徵背後的物理意義以及特徵之間關聯性的學理邏輯;而互聯網大數據則傾向於僅僅依賴統計學工具挖掘屬性之間的相關性。
碎片化(Broken):即需要避免斷續、注重時效性。相對於互聯網大數據的「量」,工業大數據更注重資料的「全」,即面對應用要求具有盡可能全面的使用樣本,以覆蓋工業過程中的各類變化條件,保證從資料中能夠提取出反應對象真實狀態的全面性資訊。
然而,從大數據環境的產生端來看,感知源的多樣性與相對非同步性或無序性,導致能夠獲得的工業資料儘管量大,但在分析過程中,針對資料特徵或變化要素卻仍然呈現出遺漏、分散、斷續等特點,這也是為什麼大量資料分析師90%以上的工作都會貢獻給不良資料的「清洗」。
因此,工業大數據一方面需要在後端的分析方法上克服資料碎片化帶來的困難,利用特徵擷取等手段將這些資料轉化為有用的資訊;另一方面,更需要從資料獲取的前端設計中以價值需求為導向制定資料標準,進而在資料與資訊流通的平台中建構一致的資料環境。
於此同時,可以說,工業大數據的價值又具有很強的時效性,即當前時刻產生的資料如果不迅速轉變為可以支援決策的資訊,其資料的價值會隨時間迅速衰退。這也就要求工業大數據的處理手段要具有很高的即時性,對資料流程的處理需要按照設定好的邏輯進行流水線式的處理。
低質性(Bad Quality):即需要提高資料品質、滿足低容錯性。資料碎片化缺陷來源的另一方面也顯示出對於資料品質的擔憂,即資料的數量並無法保障資料的品質,這可能導致資料的低可用率,因為低品質的資料可能直接影響到分析過程而導致結果無法利用;但互聯網大數據則不同,其可以只針對資料本身做挖掘、關聯而不考慮資料本身的意義,即挖掘到什麼結果就是什麼結果,最典型的就是經過超市購物習慣的資料採擷後,啤酒貨架就可以擺放在尿布貨架的對面,而不用考慮他們之間有什麼學理性的邏輯關係。
換句話說,相較於互聯網大數據通常並不要求有多麼精準的結果推論,工業大數據對預測和分析結果的容錯率遠遠比互聯網大數據低得多。
互聯網大數據在進行預測和決策時,僅僅考慮的是兩個屬性之間的關聯是否具有統計顯著性,其中的雜訊和個體之間的差異在樣本量足夠大時都可以被忽略,這樣給出的預測結果準確性就會大打折扣。比如當我覺得有70%的顯著性應該給某個用戶推薦A類電影,即使用戶並非真正喜歡這類電影也不會造成太嚴重的後果。但是在工業環境中,如果僅僅透過統計的顯著性給出分析結果,哪怕僅僅一次的失誤都可能造成嚴重的後果。
因此,簡單地照搬互聯網大數據的分析手段,或是僅僅依靠資料工程師,解決的只是演算法工具和模型的建立,還無法滿足工業大數據的分析要求,工業大數據分析並不僅僅依靠演算法工具,更加注重邏輯清晰的分析流程和與分析流程相匹配的技術體系。
這就好比一個很聰明的年輕人如果沒有完整體系的思想和邏輯思維方式的培養,很難成功完成一件複雜度很高的工作。然而很多專業領域的技術人員,雖然智商可能僅僅達到普通人的水準,但接受了大量與其工作相關的思維流程訓練,具備很清晰和條理的思考能力及執行流程,往往更能勝任複雜度較高的工作。
工業大數據的價值
雖然美、德兩國對工業4.0的定義和實施重點方面有所差異,但相同的是對基於工業大數據的創值體系目標和價值的認同。
從技術端來看,工業大數據的分析價值在於它能夠解決什麼樣的問題,和為使用者提供什麼樣的服務。同時,這個過程強調的是,工業大數據能夠在橫向與縱向環節的互聯與在統一平台的資訊共用,由此將資源利用與分析維度規模化、價值最大化,進而能夠最大範圍地提供各環節的使用者進行應用服務的客製化,由此又可衍生出持續性服務共贏的模式。
從應用端來看,大數據環境能夠為工業界帶來的價值主要體現在以下幾個方面:
以較低成本滿足用戶客製化的需求。
使製造過程的資訊透明化、提高效率、提升品質、降低成本和資源消耗和更有效的管理。
提供設備全生命週期的資訊管理和服務,使設備的使用更具效率、節能、持久;減少營運、維護環節中的浪費和成本,提高設備的可用率。
使人的工作更加簡單,甚至部分代替人的工作,在提高生產效率的同時降低工作量。
實現全產業鏈的資訊整合,使整個生產系統達到協同優化,讓生產系統變得更加動態和靈活,進一步提高生產效率和降低生產成本。
對於工業4.0的智慧製造轉型而言,工業大數據的核心價值目標,正是在於將:
客製化與規模化結合。
個性化與大眾化結合。
微觀與宏觀結合。
現在與未來結合。
(本文節錄自天下雜誌出版《工業大數據》第二章「工業4.0環境下的大數據創值體系」第90頁至99頁)。
《工業大數據》
工業4.0時代的智慧轉型與價值創新
物聯網X服務聯網X工業大數據分析
是製造業轉型的強力引擎
挖掘消費者尚未察覺的需求,
以新商業模式與智慧體系服務打開新藍海!
物聯網超連結,翻轉產業,任何優勢都擋不住升級換代的浪潮,
從製造強權德國、生產大國美國、到精密的日本、新興的中國,都向工業4.0靠攏,重塑生產力。
到底什麼是工業4.0?臺灣如何在全球新競賽中找到自己的優勢與定位?
出版:天下雜誌
作者:李傑