siemens x
云計算

找到數(shù)據(jù)背后的血緣關系 IBM幫助四川稅務局實現(xiàn)“以數(shù)治稅”

2025China.cn   2022年06月15日

  當數(shù)字經濟成為社會發(fā)展的主旋律,數(shù)據(jù)可以說是支撐業(yè)務創(chuàng)新的源動力,能否充分發(fā)揮數(shù)據(jù)價值反映了一家企業(yè)達成數(shù)字化轉型的程度與質量,尤其是隨著越來越多的生產系統(tǒng)和業(yè)務系統(tǒng)走上云端、邁向智能化,如何挖掘數(shù)據(jù)、理解數(shù)據(jù)、管好數(shù)據(jù)就成了重中之重。以數(shù)據(jù)治理為例,從過去的IT為先逐漸向業(yè)務層面滲透,讓數(shù)據(jù)治理項目能夠為企業(yè)貢獻可持續(xù)的經濟效益?!皵?shù)據(jù)治理已成為一種剛需,原來出報表的時候沒有數(shù)據(jù)治理工具也能做,但是現(xiàn)在有些數(shù)據(jù)是難以理解的,不知道到哪里去找數(shù)據(jù),不清楚數(shù)據(jù)與業(yè)務有什么關系?!彼拇ㄊ《悇站执髷?shù)據(jù)風險管理局大數(shù)據(jù)平臺技術專家肖斌說。

  去年3月,中共中央辦公廳、國務院辦公廳印發(fā)了《關于進一步深化稅收征管改革的意見》,指出要加快推進智慧稅務建設,充分運用大數(shù)據(jù)、云計算、人工智能、移動互聯(lián)網等現(xiàn)代信息技術,著力推進內外部涉稅數(shù)據(jù)匯聚聯(lián)通、線上線下有機貫通,驅動稅務執(zhí)法、服務、監(jiān)管制度創(chuàng)新和業(yè)務變革,進一步優(yōu)化組織體系和資源配置。在稅收征管數(shù)字化升級和智能化改造的過程中,國家稅務總局四川省稅務局積極響應,并推行了一系列舉措。

打破數(shù)據(jù)的煙囪化壁壘

  不過,要想全面實現(xiàn)“以數(shù)治稅”并不容易。傳統(tǒng)的稅務系統(tǒng)業(yè)務模式較為固化,分散式、手工式、信息化程度低,缺乏系統(tǒng)性的建設思路和科學的服務工具。此外,還要構建起總局、省局兩級數(shù)據(jù)管理體系,建立系統(tǒng)化的數(shù)據(jù)應用體系,打造多層級的數(shù)據(jù)服務體系,實施一體化數(shù)據(jù)調度和統(tǒng)一的標準規(guī)范體系,用“互聯(lián)網+”大數(shù)據(jù)加強稅收風險管理,建立統(tǒng)一的數(shù)據(jù)應用平臺,實現(xiàn)數(shù)據(jù)高效共享服務。

  肖斌所在的稅收大數(shù)據(jù)風險管理局,是國家稅務總局主管組織指導全國稅收大數(shù)據(jù)和風險管理相關工作的機構。過去,四川稅務局的各單位機構自建系統(tǒng)沒有統(tǒng)一數(shù)據(jù)標準,數(shù)據(jù)質量參差不齊,盡管用戶擁有海量數(shù)據(jù),但數(shù)據(jù)和業(yè)務知識之間的關聯(lián)還比較弱,沒有把數(shù)據(jù)和業(yè)務知識體系關聯(lián)起來,難以做到數(shù)據(jù)與業(yè)務知識之間的快速轉換,不能對數(shù)據(jù)進行自主的探索和挖掘,數(shù)據(jù)的深層價值難以體現(xiàn),沒有形成知識圖譜。

  在國家稅務總局金稅四期的背景下,四川省稅務局大數(shù)據(jù)風險管理局對省級數(shù)據(jù)進行了管理,涉及分散各處、不同時期的70 多個數(shù)據(jù)庫。起初,大數(shù)據(jù)風險管理局花了兩年時間把這些數(shù)據(jù)分門別類的匯聚到大數(shù)據(jù)平臺上,所遇到的問題之一就是一部分歷史數(shù)據(jù)的內容和業(yè)務含義已經無從辨別,有些數(shù)據(jù)甚至要追溯到七、八年前。同時,此前合作的數(shù)據(jù)公司并未給出系統(tǒng)的要求和規(guī)范,導致該局的數(shù)據(jù)平臺缺少必要的邏輯模型、物理模型,難以形成一套完整的數(shù)據(jù)知識體系。

  “我們的職責除了匯聚數(shù)據(jù),還要為各個業(yè)務處室、基層提供一些數(shù)據(jù)服務,當對方提出一個數(shù)據(jù)需求時,我們就要去找這個數(shù)據(jù)放在什么地方,如果是在一張表上,那么各個表之間的關系是什么,有什么邏輯,字段有什么特殊含義,都要提取出來。”肖斌談到,“我們的數(shù)據(jù)治理以前就是‘口口相傳’,大概問一下以前運維的公司,看看數(shù)據(jù)在哪個地方,在系統(tǒng)里面的功能,功能里面有哪個表等等,主要是通過員工來慢慢積累數(shù)據(jù)。但如果換了一批員工就又不知道了,會反復出現(xiàn)這樣的問題?!?/FONT>

建立數(shù)據(jù)與業(yè)務知識的聯(lián)系

  據(jù)悉,四川省稅務局希望實現(xiàn)元數(shù)據(jù)標準化體系,集成現(xiàn)有的元數(shù)據(jù)管理系統(tǒng),建立統(tǒng)一的數(shù)據(jù)資產目錄,持續(xù)提升數(shù)據(jù)質量,對數(shù)據(jù)消費實現(xiàn)自服務,提升效率。此外,建立完整的數(shù)據(jù)治理體系,掌握資產之間關系,了解數(shù)據(jù)的來源和去向。借助IBM Watson Knowledge Catalog(IBM WKC),四川省稅務局構建了數(shù)據(jù)知識體系,把表、證、單、書等數(shù)據(jù)與業(yè)務進行關聯(lián),在征管規(guī)范之下幫助業(yè)務人員和IT人員看懂數(shù)據(jù)的含義,掌握了元數(shù)據(jù)的關聯(lián)和管理能力。

  對于大量的歷史業(yè)務系統(tǒng)和持續(xù)增長的生產業(yè)務系統(tǒng),四川省稅務局建立了統(tǒng)一的數(shù)字資產目錄,對每個系統(tǒng)進行統(tǒng)一管理。同時,根據(jù)定義的業(yè)務規(guī)則提升數(shù)據(jù)質量,對有問題的數(shù)據(jù)進行生產評估或進行標記。通過數(shù)據(jù)知識體系指導數(shù)據(jù)消費,四川省稅務局對數(shù)據(jù)安全有了更明確的分級管理,利用數(shù)據(jù)治理工具對數(shù)據(jù)進行高、中、低的敏感度定義,為其他系統(tǒng)調用該數(shù)據(jù)時提供參考和權限設置。IBM WKC內置了豐富的數(shù)字資產類型,可以快速表達業(yè)務數(shù)據(jù)之間的關系,通過可視化的方式進行展現(xiàn)。

  “我們使用了Apache Atlas,在Hadoop架構中,Atlas在創(chuàng)建復雜的表時會自動記錄血緣關系,IBM WKC則會讀取這些關系。在選型的過程中,我們使用了一些產品,發(fā)現(xiàn)IBM WKC自動形成的數(shù)據(jù)知識圖譜,可以把表、證、單、書和征管規(guī)范等信息的關系進行圖形展示,包括物理模型、邏輯模型、血緣關系等等?!毙け蟊硎?,“現(xiàn)在整個數(shù)據(jù)治理環(huán)節(jié)已經打通了,后續(xù)還會有進一步的規(guī)劃,把更多的系統(tǒng)和平臺納入管理范圍,由IBM WKC來承載?!?/FONT>

  四川省稅務局使用IBM WKC實現(xiàn)了企業(yè)級數(shù)據(jù)治理系統(tǒng)平臺建設,賦能了稅務登記、稅務申報、發(fā)票類、國際稅收業(yè)務類,稅務行政、出口退免稅等業(yè)務系統(tǒng)。借助IBM WKC解決方案,采用AI技術提升了自動化治理數(shù)據(jù)效率,減低運營成本,為用戶數(shù)據(jù)提供可信賴的信息、開展新業(yè)務。目前,該項目處于建成數(shù)據(jù)知識體系階段,下一步將是更大規(guī)模的應用。

與客戶共建的專業(yè)團隊

  可以說,IBM專家團隊與四川省稅務局的緊密合作確保了項目成功實施。2021年1月,肖斌所在的四川省稅務局大數(shù)據(jù)風險管理局開始推進數(shù)據(jù)治理工作,與IBM專家多次交流后確定了對IBM軟件測試的場景,在春節(jié)前開展了PoC測試,節(jié)后完成了可行性方案調研和軟件產品測試。期間,IBM團隊積極爭取 IBM不同部門和渠道的資源,制定了對四川省稅務局最有價值的策略。2021年7月到2022年5月,IBM客戶成功管理團隊和IBM中國開發(fā)中心介入項目,分別負責生產系統(tǒng)安裝和系統(tǒng)上線,以及解決生產系統(tǒng)問題。

  正是有了IBM客戶成功管理團隊的幫助,才讓四川省稅務局對IBM WKC和IBM Cloud Pak for Data的使用更加游刃有余。肖斌稱:“項目落地的過程總會遇到很多問題,IBM中國開發(fā)中心的專家會對IBM WKC做出相應的改變來貼近客戶的實際需求,并且有IBM客戶成功管理團隊這樣可信賴的伙伴來輔助,可以幫助我們梳理業(yè)務,結合IBM WKC的特點做一些嘗試,合作研究如何與業(yè)務關聯(lián)起來?!背薎BM Cloud Pak for Data,四川省稅務局還在測試使用IBM Cloud Pak for Business Automation等產品。IBM中國客戶成功架構師張敏介紹稱:“Cloud Pak for Data內置了很多分析工具,包括SPSS等,還有Cloud Pak for Business Automation的規(guī)則引擎、工作流,近期就會進行測試?!?/FONT>

  據(jù)了解,IBM Cloud Pak for Data是統(tǒng)一和簡化數(shù)據(jù)收集、組織和分析的平臺,構建在Red Hat OpenShfit之上,嵌入了IBM企業(yè)級和產品化的AI技術(Watson AI)與功能,企業(yè)可以通過集成的云原生架構將數(shù)據(jù)轉化為洞察力,IBM Watson Knowledge Catalog則是其中用于數(shù)據(jù)治理的重要工具,可以接入客戶的數(shù)倉、Hadoop集群的元數(shù)據(jù)、Apache Atlas的數(shù)據(jù)等,將其變成數(shù)據(jù)資產進行分析。

  IBM WKC可以提供數(shù)據(jù)可視化,自動化數(shù)據(jù)質量分析和打分,從多維度評估數(shù)據(jù),給出全面的質量檔案信息、趨勢分析、遵循業(yè)務規(guī)則的評估信息。通過讓數(shù)據(jù)資產與業(yè)務信息建立映射關系,實現(xiàn)端-到-端的數(shù)據(jù)世襲關系分析,建立跨業(yè)務類別、跨系統(tǒng)的數(shù)據(jù)治理策略和流程管理,推進業(yè)務部門對其數(shù)據(jù)歸屬管理。IBM WKC提供了與業(yè)務集成的數(shù)據(jù)治理流程管理,大量應用機器學習能力提高獲取數(shù)據(jù)能力和分析數(shù)據(jù)的準確率。同時,利用關鍵字圖形化搜索,快速獲取相關信息和數(shù)據(jù)圖譜,讓企業(yè)不同角色人員都能掌握業(yè)務策略、治理規(guī)則和業(yè)務術語,了解數(shù)據(jù)資產結構、數(shù)據(jù)治理邏輯表達式、規(guī)則定義、數(shù)據(jù)治理流程等信息。

結束語

  在Cloud Pak for Data的幫助下,IBM幫助四川省稅務局邁出了“以數(shù)治稅”的重要一步,隨著雙方合作的持續(xù)深入,相信會看到更多的稅務數(shù)字化實踐,為全面推進稅收征管的數(shù)字化升級和智能化改造貢獻更大的力量。

(轉載)

標簽:IBM 稅務數(shù)字化 我要反饋 
2024世界人工智能大會專題
即刻點擊并下載ABB資料,好禮贏不停~
優(yōu)傲機器人下載中心
西克
2024全景工博會
專題報道
2024 工博會 | 直播探館 · 全景解讀
2024 工博會 | 直播探館 · 全景解讀

第二十四屆中國工博會于9月24日至28日在國家會展中心(上海)舉行,展會以“工業(yè)聚能 新質領航”為全新主題。 [更多]

2024世界人工智能大會
2024世界人工智能大會

WAIC 2024將于7月在上海舉行,論壇時間7月4日-6日,展覽時間7月4日-7日。WAIC 2024將圍繞“以共商促... [更多]

2024漢諾威工業(yè)博覽會專題
2024漢諾威工業(yè)博覽會專題

2024 漢諾威工業(yè)博覽會將于4月22 - 26日在德國漢諾威展覽中心舉行。作為全球首屈一指的工業(yè)貿易展覽會,本屆展覽會... [更多]