數據架構將業(yè)務需求轉化為數據和系統(tǒng)要求,并尋求管理數據及其在企業(yè)中的流動。數據架構在制造業(yè)中具有廣泛的應用前景,可以幫助企業(yè)提高生產效率、降低成本、優(yōu)化運營、提升競爭力。構建合理的數據架構是制造業(yè)企業(yè)實現數字化轉型和智能制造的重要基礎。

來源:Brandon Mowinkel
一、數據架構定義
根據開放群組架構框架(TOGAF)?,數據架構描述了組織的邏輯和物理數據資產以及數據管理資源的結構。它是企業(yè)架構的一個分支,包括管理組織中數據收集、存儲、整理、集成和使用的模型、政策、規(guī)則和標準。組織的數據架構是數據架構師的職權范圍。
二、數據架構目標
數據架構的目標是將業(yè)務需求轉化為數據和系統(tǒng)要求,并管理數據及其在企業(yè)中的流動。如今,許多組織都希望實現數據架構的現代化,以此作為充分利用人工智能和實現數字化轉型的基礎。咨詢公司麥肯錫數字指出,許多組織未能實現數字化和人工智能轉型目標,是因為流程復雜,而不是技術復雜。
三、數據架構原則
語義層平臺AtScale?創(chuàng)始人兼首席技術官David Mariani?認為,現代數據架構的基礎由六項原則組成:
1、將數據視為共享資產?,F代數據架構需要消除部門數據孤島,讓所有利益相關者全面了解公司:全方位的客戶洞察,以及關聯來自制造和物流等所有業(yè)務職能的寶貴數據信號的能力。
2、提供使用數據的用戶界面。除了打破數據孤島之外,現代數據架構還需要提供界面,讓用戶能夠使用適合其工作的工具輕松使用數據。數據必須能夠自由地在數據倉庫、數據湖和數據集市之間移動,并且界面必須讓用戶能夠輕松地使用這些數據。
3、確保安全性和訪問控制?,F代數據架構必須以安全性為設計目標,并且必須直接在原始數據上支持數據策略和訪問控制,而不是在下游數據存儲和應用程序的網絡中。
4、建立通用詞匯表。共享數據資產(例如產品目錄、財務日歷維度和?KPI?定義)需要通用詞匯表,以幫助避免分析過程中出現爭議。
5、管理數據。投資執(zhí)行數據管理的核心功能,例如建立重要關系模型、清理原始數據以及管理關鍵維度和指標。
6、優(yōu)化數據流以提高敏捷性。限制必須移動數據的次數,以降低成本、提高數據新鮮度并優(yōu)化企業(yè)敏捷性。
三、數據架構組件
根據IT?咨詢公司?BMC?的說法,現代數據架構由以下組件組成:
1、數據管道。數據管道是收集、移動和提煉數據的過程。它包括數據收集、提煉、存儲、分析和交付。
2、云存儲。并非所有數據架構都利用云存儲,但許多現代數據架構都使用公共云、私有云或混合云來提供靈活性。
3、云計算。除了使用云進行存儲之外,許多現代數據架構還利用云計算來分析和管理數據。
4、應用程序編程接口?,F代數據架構使用API?來輕松公開和共享數據。
5、人工智能和機器學習模型。人工智能和機器學習用于自動化系統(tǒng),以完成數據收集和標記等任務。同時,現代數據架構可以幫助組織釋放大規(guī)模利用人工智能和機器學習的能力。
6、數據流。數據流是數據從源頭連續(xù)流向目的地,以進行實時或近實時的處理和分析。
7、容器編排。容器編排系統(tǒng)(例如開源?Kubernetes)通常用于自動化軟件部署、擴展和管理。
8、實時分析。許多現代數據架構的目標是提供實時分析,即在新數據到達環(huán)境時對其進行分析的能力。
四、數據架構與數據建模
根據《數據管理知識手冊》(DMBOK 2),數據架構將管理數據資產的藍圖定義為與組織戰(zhàn)略保持一致,以建立戰(zhàn)略數據需求和設計來滿足這些需求。另一方面,DMBOK 2將數據建模定義為“以精確的形式(稱為數據模型)發(fā)現、分析、表示和傳達數據需求的過程”。
雖然數據架構和數據建模都試圖彌合業(yè)務目標和技術之間的差距,但數據架構是一種宏觀視角,旨在理解和支持組織的功能、技術和數據類型之間的關系。數據建模則更側重于特定系統(tǒng)或業(yè)務案例。
五、數據架構框架
有幾種企業(yè)架構框架通常作為構建組織數據架構框架的基礎。
DAMA-DMBOK 2 .?DAMA International的數據管理知識體系是專門針對數據管理的框架。它為數據管理功能、可交付成果、角色和其他術語提供了標準定義,并提出了數據管理的指導原則。
Zachman企業(yè)架構框架。Zachman框架是IBM?的?John Zachman?于?20?世紀?80?年代創(chuàng)建的企業(yè)本體。Zachman?框架的數據列包含多個層,包括對業(yè)務很重要的架構標準、語義模型或概念/企業(yè)數據模型、企業(yè)/邏輯數據模型、物理數據模型和實際數據庫。
開放群組架構框架。TOGAF是一種企業(yè)架構方法,為企業(yè)軟件開發(fā)提供高級框架。TOGAF的?C?階段涵蓋開發(fā)數據架構和構建數據架構路線圖。
六、現代數據架構最佳實踐
數據架構是一個模板,它控制著數據在公司內的流動、存儲和訪問方式?,F代數據架構必須設計為利用人工智能、自動化和物聯網(IoT)?等技術。根據數據平臺?Acceldata?的說法,數據架構有三個核心原則:
1、可擴展性。現代數據架構必須具有可擴展性,才能在不影響性能的情況下處理不斷增長的數據量??蓴U展的數據架構應該能夠縱向擴展(向單個機器添加更多資源或處理能力)和橫向擴展(添加更多機器以分配數據庫負載)。
2、靈活性。靈活的數據架構可以集成新的數據源、采用新技術并隨著業(yè)務需求而發(fā)展。
3、數據完整性?,F代數據架構必須確保數據在其生命周期內保持準確、一致和不變,以保持其分析和決策的可靠性。它們必須防止數據損壞、重復或丟失等問題。
七、現代數據架構還應遵循以下最佳實踐:
1、與業(yè)務需求保持一致。有效的企業(yè)數據架構應與業(yè)務目標保持一致。為此,組織應根據戰(zhàn)略目標確定需要收集、分析和存儲的數據。
2、確保數據治理和合規(guī)性。強大的數據架構需要確保數據治理和合規(guī)性,以建立明確的政策來管理整個數據生命周期內的數據訪問、質量和安全。
3、選擇正確的工具和技術。選擇適合您的企業(yè)數據架構的工具至關重要,包括關系數據庫和?NoSQL?數據庫、基于云的存儲解決方案和處理工具。
咨詢公司Protiviti?的技術咨詢高級總監(jiān)?Dan Sutherland為現代數據架構添加了更多最佳實踐:
1、云原生。現代數據架構應設計為支持彈性擴展、高可用性、動態(tài)數據和靜態(tài)數據的端到端安全性以及成本和性能可擴展性。
2、可擴展的數據管道。為了利用新興技術,數據架構應該支持實時數據流和微批量數據突發(fā)。
3、無縫數據集成。數據架構應使用標準?API?接口與舊式應用程序集成。它們還應進行優(yōu)化,以便跨系統(tǒng)、跨地區(qū)和跨組織共享數據。
4、實時數據支持?,F代數據架構應支持部署自動化和主動數據驗證、分類、管理和治理的能力。
5、解耦且可擴展?,F代數據架構應設計為松散耦合,使服務能夠獨立于其他服務執(zhí)行最少的任務。
八、數據架構角色
根據Indeed的數據,以下是一些與數據架構相關的最受歡迎的職位以及每個職位的平均薪資:
數據架構師:67,000-173,000美元
項目經理:57,000-142,000美元
數據工程師:83,000-195,000美元
數據分析師:50,000-128,000美元
數據科學家:76,000-195,000美元
【睿觀:制造業(yè)場景應用的三個案例展示了數據架構如何在制造業(yè)中發(fā)揮關鍵作用:
1. 智能制造和預測性維護:
業(yè)務需求:?提高設備利用率,減少意外停機時間,降低維護成本。
數據架構應用:?通過在生產設備上部署傳感器,實時采集溫度、壓力、振動等數據。利用數據管道將數據傳輸到云平臺進行存儲和分析。構建機器學習模型,根據歷史數據和實時數據預測設備故障,提前進行維護,避免生產中斷。
關鍵組件:?數據管道、云存儲、云計算、人工智能和機器學習模型、數據流。
帶來的益處:?提高設備運行效率,降低維護成本,提高產品質量。
2. 供應鏈優(yōu)化:
業(yè)務需求:?提高供應鏈效率,降低庫存成本,優(yōu)化物流。
數據架構應用:?集成來自供應商、生產、物流、銷售等環(huán)節(jié)的數據,構建統(tǒng)一的數據視圖。利用數據分析工具,分析供應鏈瓶頸,優(yōu)化庫存管理,提高物流效率,實現供應鏈的協同運作。
關鍵組件:?數據管道、API、數據流。
帶來的益處:?降低庫存積壓,縮短交貨周期,提高客戶滿意度。
3. 產品質量追溯:
業(yè)務需求:?實現產品質量的全程追溯,快速定位質量問題,提高產品質量。
數據架構應用:?在生產過程中記錄每個產品的生產參數、原材料信息、檢驗結果等數據。構建數據平臺,將這些數據關聯起來,形成完整的產品追溯鏈。一旦出現質量問題,可以快速追溯到問題的根源。
關鍵組件:?數據管道、數據存儲、數據流。
帶來的益處:?提高產品質量,降低召回風險,增強品牌信譽。
通過以上案例可以看出,數據架構在制造業(yè)中具有廣泛的應用前景,可以幫助企業(yè)提高生產效率、降低成本、優(yōu)化運營、提升競爭力。構建合理的數據架構是制造業(yè)企業(yè)實現數字化轉型和智能制造的重要基礎。】