“五步、雙線、十環”是迪塔維始終貫徹的數據治理實施方法論,“當AI遇上數據治理”第一期給大家介紹了智能語義識別和非結構文檔的智能化集成能力,實現了在“摸家底”步驟中數據調研和識別的自動化輔助。本期迪小數將繼續為您帶來V5方案系列介紹——智能定標建模和代碼對標轉標的自動化能力,助力“定標準”步驟的科學、高效落地,讓AI輔助實現“快速定標、精準轉碼、提效減負”!
智能定標建模,讓規范落地更高效!
數據標準作為數據采集、存儲、共享和應用的基礎,為數據治理各個環節提供統一的信息規范,是高校數字化建設的重要基礎工作之一。廣義的數據標準涵蓋了元數據標準、數據分類標準、數據編碼標準、數據元素標準、統一代碼標準、數據交換技術規范等,上述內容在迪塔維數據中臺產品中都有明確的管理口徑。傳統數據定標工作需要人工參考各類國標、部標及業務上報標準,再結合學校的實際情況,從龐雜的數據中逐條梳理出數據類型、指標定義、格式要求等,不僅占用大量工作時間,還可能出現關鍵信息遺漏等問題,影響后續治理工作。

圖1 ?數據執行標準規范
迪塔維V5解決方案中的定標智能體以教育部發布的多項數據規范、建設標準為基線,結合學校自身業務特征,通過標準特征分析,建立數據體系間的邏輯關系,形成符合國家要求和學校自身特性的執行標準“規范庫”。

圖2 ?智能定標

圖3 ?智能定標結果呈現
采用智能定標的方式可以將定標環節從傳統的“部門訪談、數據調研、標準梳理、方案評審”數月級的時間跨度縮短至數日,在保證定標結果準確性和落地效果的基礎上,大幅降低了人工成本和時間成本!
智能對標轉碼,告別“人工對標”,讓數據流通更順暢!
數據治理的核心目標之一是建設數據倉庫、匯聚全量數據,而高校的數據通常分散在人事、學工、教務、科研、財務等多個業務系統中,因此數據采集時需要將“代碼標準”作為系統間互認的核心“語言”。但在實際建設過程中,往往會出現由代碼不一致引起的數據整合失效、數據質量降低、業務流程卡頓、管理決策失準等問題,無法發揮數據資產價值。

圖4 ?數據中臺檢測到的代碼差異
迪塔維V5解決方案升級了數據標準語義的“一鍵映射”能力,提供基于語義分析和機器學習算法的“智能對標轉碼進階版”智能體。通過對源數據(業務代碼)和目標數據(標準代碼)的字段屬性、業務屬性的結構化解析,提取代碼核心特征,并對代碼語義進行深度挖掘匹配,實現自動對標。同時智能體內置了行業公認的代碼對應關系規則庫和迪塔維沉淀多年的轉碼經驗庫,可對匹配結果進行批量校驗和修改,完成最優代碼映射。
智能對標轉碼映射執行時會持續記錄每次轉碼的過程和結果,結合人工干預的反饋數據,不斷更新規則庫和機器學習模型,持續提升算法的自適應能力和代碼映射準確率。

圖5 ?對標轉碼智能映射結果

圖6 智能對標轉碼映射算法設置
傳統的轉碼映射工作需要人工逐條核對和處理,而迪塔維V5解決方案可一鍵自動識別映射關系并完善自校驗過程,同時為人工干預提供了更加便捷的批量編輯頁面,讓轉碼業務處理效率實現質的飛躍。
結語
數據標準制定是數據治理的“核心”,代碼標準一致是數據治理的“基石”,智能定標建模與對標轉碼服務融匯AI大模型能力,從處理效率、準確度、適應性等維度創新式重構了數據治理的業務處理方式,將傳統人工處理轉變為智能化實施能力,讓數據治理工作更高效、更智能!更多場景,敬請期待——
