新聞中心
專業(yè)的數(shù)據(jù)管理基礎(chǔ)設(shè)施及服務(wù)供應(yīng)商
行業(yè)優(yōu)秀案例分享丨華陽(yáng)集團(tuán)數(shù)據(jù)管理體系建設(shè)與應(yīng)用實(shí)踐
發(fā)布日期:
2024-01-23

隨著數(shù)字化時(shí)代的到來(lái),數(shù)據(jù)管理對(duì)于企業(yè)的發(fā)展越來(lái)越重要。作為專業(yè)的數(shù)據(jù)管理基礎(chǔ)設(shè)施及服務(wù)供應(yīng)商,希嘉始終關(guān)注各行業(yè)在數(shù)據(jù)管理方面的最佳實(shí)踐和經(jīng)驗(yàn),持續(xù)分享各行業(yè)領(lǐng)域的優(yōu)秀實(shí)踐案例,希望能給大家?guī)?lái)更多啟發(fā)。


華陽(yáng)集團(tuán)全稱為惠州市華陽(yáng)集團(tuán)股份有限公司,成立于1993年1月16日,總部位于廣東省惠州市。華陽(yáng)集團(tuán)是一家涉及汽車電子、精密壓鑄、精密電子部件以及LED照明等業(yè)務(wù)的企業(yè),重點(diǎn)圍繞汽車電動(dòng)化、智能化、網(wǎng)聯(lián)化、輕量化進(jìn)行產(chǎn)品布局。


在信息技術(shù)變革大潮中,華陽(yáng)集團(tuán)緊跟時(shí)代步伐。隨著管理系統(tǒng)建設(shè),數(shù)據(jù)量規(guī)模不斷攀升,數(shù)據(jù)的類型也呈現(xiàn)多樣化。目前,數(shù)據(jù)庫(kù)根據(jù)業(yè)務(wù)需求的不同,研究和應(yīng)用背景的不同,從語(yǔ)法、語(yǔ)義、模式等具有異構(gòu)性的方向,進(jìn)行獨(dú)立設(shè)計(jì)開發(fā),使集團(tuán)級(jí)數(shù)據(jù)共享、整合與集成應(yīng)用面臨巨大挑戰(zhàn)。


行業(yè)優(yōu)秀案例分享丨華陽(yáng)集團(tuán)數(shù)據(jù)管理體系建設(shè)與應(yīng)用實(shí)踐


數(shù)據(jù)管理平臺(tái)為實(shí)現(xiàn)企業(yè)的智能檢索、智能推薦、智能協(xié)同、智能問(wèn)答和用戶畫像應(yīng)用提供了標(biāo)準(zhǔn)化的數(shù)據(jù)接口和高精度的數(shù)學(xué)算法服務(wù),實(shí)現(xiàn)了企業(yè)數(shù)字化、數(shù)字資產(chǎn)化的歷史性蛻變。


01?系統(tǒng)開發(fā)設(shè)計(jì)


建設(shè)目標(biāo)

華陽(yáng)集團(tuán)企業(yè)級(jí)數(shù)據(jù)管理體系建設(shè)主要目標(biāo)是實(shí)現(xiàn)“一個(gè)平臺(tái)、兩個(gè)體系、三個(gè)特征、四個(gè)統(tǒng)一、五個(gè)服務(wù)”的一體化數(shù)據(jù)管理全景圖。

一個(gè)平臺(tái):搭建一個(gè)一體化的數(shù)據(jù)管理平臺(tái);

兩個(gè)體系:建立數(shù)據(jù)治理體系和數(shù)據(jù)管理體系;

三個(gè)特征:確保數(shù)據(jù)的準(zhǔn)確性、唯一性、共享性;

四個(gè)統(tǒng)一:達(dá)到數(shù)據(jù)的統(tǒng)一標(biāo)準(zhǔn)、統(tǒng)一來(lái)源、統(tǒng)一接口、統(tǒng)一服務(wù);

五個(gè)服務(wù):提供數(shù)據(jù)查詢、數(shù)據(jù)調(diào)用、數(shù)據(jù)分發(fā)、公共數(shù)據(jù)資源、數(shù)據(jù)即時(shí)服務(wù)。


構(gòu)建企業(yè)數(shù)據(jù)治理體系,依托數(shù)據(jù)管理平臺(tái),對(duì)企業(yè)各業(yè)務(wù)系統(tǒng)數(shù)據(jù)進(jìn)行數(shù)據(jù)綜合治理,最終形成企業(yè)數(shù)據(jù)資產(chǎn)。搭建數(shù)據(jù)管理平臺(tái),研發(fā)智能算法,利用企業(yè)數(shù)據(jù)資產(chǎn),生成數(shù)據(jù)模型和業(yè)務(wù)需求模型,實(shí)現(xiàn)企業(yè)數(shù)據(jù)智能檢索、智能協(xié)同、智能問(wèn)答機(jī)器人和用戶畫像等AI智能業(yè)務(wù)場(chǎng)景應(yīng)用。


建設(shè)內(nèi)容

涉及數(shù)據(jù)范圍:根據(jù)企業(yè)智能應(yīng)用場(chǎng)景將數(shù)據(jù)分為感知數(shù)據(jù)、監(jiān)測(cè)監(jiān)控?cái)?shù)據(jù)、經(jīng)營(yíng)管控?cái)?shù)據(jù)、外部數(shù)據(jù)、歷史數(shù)據(jù)。


涉及應(yīng)用場(chǎng)景:基于數(shù)據(jù)治理體系框架和數(shù)據(jù)管理平臺(tái),優(yōu)先建設(shè)生產(chǎn)管理、設(shè)備管理、安全管理、經(jīng)營(yíng)管理等業(yè)務(wù)智能應(yīng)用場(chǎng)景,將數(shù)字化業(yè)務(wù)場(chǎng)景應(yīng)用納入數(shù)據(jù)管理體系中,建立統(tǒng)一的數(shù)據(jù)應(yīng)用標(biāo)準(zhǔn)規(guī)范,實(shí)現(xiàn)數(shù)據(jù)統(tǒng)一性、復(fù)用性和共享性。智能應(yīng)用場(chǎng)景包括智能檢索、智能推薦、智能協(xié)同(合同履約)、智能問(wèn)答、用戶畫像等應(yīng)用。


集團(tuán)企業(yè)級(jí)數(shù)據(jù)管理體系主要通過(guò)數(shù)據(jù)匯聚整合、萃取加工、服務(wù)可現(xiàn)及價(jià)值變現(xiàn),建立貫穿數(shù)據(jù)接入、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)匯聚層、數(shù)據(jù)開發(fā)和數(shù)據(jù)服務(wù)的運(yùn)行管理機(jī)制;提供標(biāo)準(zhǔn)的數(shù)據(jù)規(guī)范制度和管控流程,實(shí)現(xiàn)數(shù)據(jù)變資產(chǎn)并服務(wù)于應(yīng)用的總體目標(biāo)。華陽(yáng)集團(tuán)企業(yè)級(jí)數(shù)據(jù)管理體系建設(shè)思路如圖2所示。


行業(yè)優(yōu)秀案例分享丨華陽(yáng)集團(tuán)數(shù)據(jù)管理體系建設(shè)與應(yīng)用實(shí)踐

圖2 華陽(yáng)集團(tuán)企業(yè)級(jí)數(shù)據(jù)管理體系建設(shè)思路


數(shù)據(jù)治理體系:集團(tuán)數(shù)據(jù)治理體系實(shí)施以DCMM數(shù)據(jù)治理體系為指導(dǎo),結(jié)合行業(yè)實(shí)踐,形成了“盤、規(guī)、治、用”的實(shí)施方法論,搭建了一個(gè)合理高效的業(yè)務(wù)數(shù)據(jù)監(jiān)管體系,降低了企業(yè)業(yè)務(wù)運(yùn)營(yíng)成本,依托數(shù)據(jù)管理平臺(tái),提升了業(yè)務(wù)處理效率,改善了數(shù)據(jù)質(zhì)量,為企業(yè)管理決策進(jìn)行賦能。數(shù)據(jù)治理體系主要內(nèi)容包括元數(shù)據(jù)管理、主數(shù)據(jù)管理、數(shù)據(jù)標(biāo)準(zhǔn)管理、數(shù)據(jù)資產(chǎn)管理、數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)安全管理等。DCMM 數(shù)據(jù)治理體系框架如圖3所示。


行業(yè)優(yōu)秀案例分享丨華陽(yáng)集團(tuán)數(shù)據(jù)管理體系建設(shè)與應(yīng)用實(shí)踐

圖3 DCMM 數(shù)據(jù)治理體系框架


02?關(guān)鍵技術(shù)分析


丨數(shù)據(jù)采集技術(shù)

本系統(tǒng)用到的數(shù)據(jù)采集技術(shù)主要有抓取技術(shù)、日志采集技術(shù)、數(shù)據(jù)連接技術(shù)和文件導(dǎo)入技術(shù)。

(1)抓取技術(shù)主要通過(guò)網(wǎng)絡(luò)爬蟲程序?qū)W(wǎng)頁(yè)、API等進(jìn)行數(shù)據(jù)抓取,實(shí)現(xiàn)互聯(lián)網(wǎng)上所有供應(yīng)商和客戶的企業(yè)信息及行業(yè)關(guān)注焦點(diǎn)新聞。

(2)日志采集技術(shù)主要對(duì)各應(yīng)用程序的日志進(jìn)行采集,實(shí)現(xiàn)數(shù)據(jù)使用的跟蹤。

(3)數(shù)據(jù)庫(kù)連接技術(shù)是使用標(biāo)準(zhǔn)的數(shù)據(jù)接口協(xié)議和數(shù)據(jù)接口,從企業(yè)內(nèi)部各業(yè)務(wù)系統(tǒng)中,收集非結(jié)構(gòu)化、半結(jié)構(gòu)化和結(jié)構(gòu)化的數(shù)據(jù),且將這些數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)中心。

(4)文件導(dǎo)入技術(shù),是通過(guò)文件導(dǎo)入器將各種格式的文件導(dǎo)入數(shù)據(jù)中心。


丨元數(shù)據(jù)管理設(shè)計(jì)

元數(shù)據(jù)管理是數(shù)據(jù)治理工作的重要組成部分。以元數(shù)據(jù)為抓手進(jìn)行數(shù)據(jù)治理,可以幫助企業(yè)更好地對(duì)數(shù)據(jù)資產(chǎn)進(jìn)行管理,理清數(shù)據(jù)之間的關(guān)系,實(shí)現(xiàn)精準(zhǔn)高效的分析和決策;可以為數(shù)據(jù)集成、數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)加工整合、日常運(yùn)行維護(hù)、數(shù)據(jù)安全管理和業(yè)務(wù)應(yīng)用提供基礎(chǔ)能力支持。元數(shù)據(jù)管理通過(guò)建立元數(shù)據(jù)模塊、元數(shù)據(jù)表、元數(shù)據(jù)視圖實(shí)現(xiàn)機(jī)器自動(dòng)寫代碼功能。元數(shù)據(jù)管理如圖4所示。


行業(yè)優(yōu)秀案例分享丨華陽(yáng)集團(tuán)數(shù)據(jù)管理體系建設(shè)與應(yīng)用實(shí)踐

圖4 元數(shù)據(jù)管理


丨數(shù)據(jù)標(biāo)準(zhǔn)設(shè)計(jì)

數(shù)據(jù)標(biāo)準(zhǔn)是為企業(yè)建立的一套符合自身實(shí)際,涵蓋定義、操作、應(yīng)用多層次數(shù)據(jù)的標(biāo)準(zhǔn)。數(shù)據(jù)標(biāo)準(zhǔn)可以劃分為兩類,即基礎(chǔ)性標(biāo)準(zhǔn)和應(yīng)用性標(biāo)準(zhǔn)。前者主要用于在不同系統(tǒng)間,形成信息的一致理解和統(tǒng)一的坐標(biāo)參照系統(tǒng),是信息匯集、交換以及應(yīng)用的基礎(chǔ),包括數(shù)據(jù)分類與編碼、數(shù)據(jù)字典;后者是為平臺(tái)功能發(fā)揮所涉及的各個(gè)環(huán)節(jié),提供一定的標(biāo)準(zhǔn)規(guī)范,以保證信息的高效匯集和交換,包括數(shù)據(jù)采集方法、數(shù)據(jù)清洗、數(shù)據(jù)資產(chǎn)管理、數(shù)據(jù)生命周期管理、數(shù)據(jù)安全管理等。


丨數(shù)據(jù)質(zhì)量控制

主要關(guān)注數(shù)據(jù)記錄、關(guān)鍵字段和業(yè)務(wù)規(guī)則三個(gè)方面的數(shù)據(jù)質(zhì)量控制。

系統(tǒng)核對(duì)記錄數(shù)據(jù)主要在數(shù)據(jù)采集、數(shù)據(jù)清理、數(shù)據(jù)轉(zhuǎn)化三個(gè)階段,將取得的數(shù)據(jù)記錄和數(shù)據(jù)總量與系統(tǒng)中反映的數(shù)據(jù)進(jìn)行核對(duì),確保電子數(shù)據(jù)完整性。對(duì)于非結(jié)構(gòu)化的數(shù)據(jù),系統(tǒng)將用文件數(shù)據(jù)量和大小與數(shù)據(jù)提供清單進(jìn)行對(duì)比,核實(shí)數(shù)據(jù)的可用性和完整性。對(duì)于結(jié)構(gòu)化的數(shù)據(jù),系統(tǒng)將核對(duì)總數(shù)量和分類匯總項(xiàng)數(shù)量。


系統(tǒng)驗(yàn)證關(guān)鍵字段采用字段長(zhǎng)度核對(duì)、最大和最小值審核、孤立點(diǎn)檢測(cè)、真實(shí)性核對(duì)、范圍核對(duì)、空值替換等驗(yàn)證方法對(duì)表字段的完整性和亂碼進(jìn)行檢驗(yàn)。系統(tǒng)業(yè)務(wù)規(guī)則驗(yàn)證是指利用業(yè)務(wù)專業(yè)標(biāo)準(zhǔn)和業(yè)務(wù)邏輯,設(shè)計(jì)一套有效的勾稽檢查算法,對(duì)系統(tǒng)收集的業(yè)務(wù)數(shù)據(jù)進(jìn)行邏輯校驗(yàn)的過(guò)程。


丨數(shù)據(jù)資產(chǎn)管理

數(shù)據(jù)資產(chǎn)管理數(shù)據(jù)提供方通過(guò)數(shù)據(jù)資產(chǎn)管理進(jìn)行數(shù)據(jù)資產(chǎn)的信息錄入,對(duì)資產(chǎn)進(jìn)行分類產(chǎn)生主題數(shù)據(jù)。在交換任務(wù)的事前、事中和事后都提供實(shí)時(shí)數(shù)據(jù)資源管理來(lái)保證數(shù)據(jù)交換的質(zhì)量。以元數(shù)據(jù)為核心,通過(guò)共享、使用、管理和開發(fā)實(shí)現(xiàn)數(shù)據(jù)資產(chǎn)的閉環(huán)管理,全面支撐大數(shù)據(jù)應(yīng)用。


丨數(shù)據(jù)模型設(shè)計(jì)

數(shù)據(jù)模型設(shè)計(jì)是指從企業(yè)業(yè)務(wù)的視角,對(duì)企業(yè)業(yè)務(wù)活動(dòng)相關(guān)數(shù)據(jù)采用統(tǒng)一、規(guī)范的定義和數(shù)據(jù)建模方法構(gòu)造模型。數(shù)據(jù)倉(cāng)庫(kù):主要存儲(chǔ)來(lái)自源數(shù)據(jù)系統(tǒng)的明細(xì)數(shù)據(jù),基本不做數(shù)據(jù)加工,設(shè)置字段命名注釋等,均需要跟源數(shù)據(jù)系統(tǒng)保持一致。


03?效果展示


華陽(yáng)集團(tuán)企業(yè)級(jí)數(shù)據(jù)管理體系確保了業(yè)務(wù)數(shù)據(jù)的唯一性、準(zhǔn)確性和共享性,為企業(yè)業(yè)務(wù)應(yīng)用系統(tǒng)和AI智能應(yīng)用服務(wù)提供了來(lái)源統(tǒng)一、接口統(tǒng)一和標(biāo)準(zhǔn)統(tǒng)一的業(yè)務(wù)數(shù)據(jù)。


產(chǎn)品定位:通過(guò)用戶畫像可以了解目標(biāo)用戶的需求、行為和特征,從而幫助產(chǎn)品定位,確定產(chǎn)品的功能和目標(biāo)用戶群體。


用戶需求挖掘:通過(guò)用戶畫像可以挖掘用戶的潛在需求和行為特征,從而幫助產(chǎn)品開發(fā)團(tuán)隊(duì)更好地了解用戶需求,改進(jìn)和完善產(chǎn)品。


產(chǎn)品優(yōu)化和改進(jìn):通過(guò)用戶畫像可以了解產(chǎn)品的缺陷和不足,從而幫助產(chǎn)品團(tuán)隊(duì)發(fā)現(xiàn)問(wèn)題并進(jìn)行優(yōu)化和改進(jìn),提升用戶體驗(yàn)和產(chǎn)品質(zhì)量。


本文基于企業(yè)級(jí)數(shù)據(jù)管理體系建設(shè)及應(yīng)用實(shí)踐,分析了數(shù)據(jù)管理體系建設(shè)對(duì)于企業(yè)生產(chǎn)經(jīng)營(yíng)的重要意義,闡述了構(gòu)建企業(yè)數(shù)據(jù)管理體系的整體技術(shù)架構(gòu)和實(shí)施方案,總結(jié)了集團(tuán)數(shù)據(jù)資產(chǎn)應(yīng)用到AI智能服務(wù)最前沿的實(shí)踐經(jīng)驗(yàn)。