siemens x
大數(shù)據(jù)

美國如何實現(xiàn)大數(shù)據(jù)的第一步?

2025China.cn   2015年12月07日

  針對我國提出的大數(shù)據(jù)戰(zhàn)略,各行各業(yè)都躍躍欲試,就環(huán)境信息化來說,環(huán)保大數(shù)據(jù)的第一步需要怎么走?這是我國環(huán)保行業(yè)目前面臨最迫切的問題。

  面臨同樣的問題,美國環(huán)保局(EPA)已經開始探索大數(shù)據(jù)的第一步——數(shù)據(jù)整合。對于EPA來說,內部業(yè)務應用階段(即辦公自動化和管理信息系統(tǒng))早已經實現(xiàn),EPA的信息化已經走向更加復雜的與各聯(lián)邦政府間數(shù)據(jù)共享、業(yè)務協(xié)同的高級應用階段,將各個業(yè)務系統(tǒng)的數(shù)據(jù)整合集成到一起,成為EPA和聯(lián)邦政府履職的必要組成部分。

  那么,美國通過哪些信息化手段將數(shù)據(jù)整合起來呢?

  第一招——建立設施登記系統(tǒng)

  實現(xiàn)EPA內部和聯(lián)邦政府的數(shù)據(jù)集成,是數(shù)據(jù)整合的基石

  為解決不同系統(tǒng)、數(shù)據(jù)庫之間的標準化和數(shù)據(jù)語意沖突的問題,方便數(shù)據(jù)的整合、共享,EPA建立了環(huán)境資料注冊(Environment Data Registry, EDR)機制,提供信息系統(tǒng)和數(shù)據(jù)的標準信息(包括名稱、格式、來源、位置等)。EDR分為系統(tǒng)程序及數(shù)據(jù)庫注冊、數(shù)據(jù)集合注冊、數(shù)據(jù)(元素)注冊、環(huán)境詞匯注冊、開發(fā)組件注冊、化學物質注冊及設施登記(注冊)等。

  其中,設施登記系統(tǒng)(Facility Registry System,F(xiàn)RS)是對包括企業(yè)、污水處理廠、民用設施、甚至采礦作業(yè)等享有排污權的設施進行登記,為每個排污設施創(chuàng)建唯一、綜合的設施識別信息,形成排污設施登記數(shù)據(jù)庫。通過為每個排污設施賦予唯一的“設施標識碼”,使不同業(yè)務系統(tǒng)數(shù)據(jù)之間的關系得以明確,實現(xiàn)跨業(yè)務系統(tǒng)和跨庫檢索。通過設施標識碼建立排污設施與EPA和各州業(yè)務信息系統(tǒng)的鏈接,實現(xiàn)了EPA內部和聯(lián)邦政府范圍內的數(shù)據(jù)集成和共享。

  FRS由OEI(環(huán)境信息化辦公室)集中管理和維護,通過把各業(yè)務系統(tǒng)的設施數(shù)據(jù)鏈接起來, EPA可以做很多事情,比如搜索某一行業(yè)的所有被監(jiān)管設施;設施的準確位置,包括排污口經緯度等;某設施所涉及的各種排污許可和環(huán)境監(jiān)管信息;某企業(yè)的所有排污設施例如某石油公司的所有分廠等。

  自上世紀90年代FRS開始實施以來,已近登記了160萬個設施記錄,整合了28個州的污染設施主數(shù)據(jù);管理超過7800個聯(lián)邦管理的設施,5萬個部落領地設施和超過3000個國家環(huán)境行為跟蹤(NEPT)設施數(shù)據(jù),成為EPA數(shù)據(jù)整合的基石。

  EPA還通過污染設施的信息公開,收集公眾對設施數(shù)據(jù)質量的問題反饋,識別和糾正錯誤數(shù)據(jù)和重復記錄。3年內收到1.3萬個數(shù)據(jù)錯誤的反饋,更正了1.2萬個錯誤,大幅提高了設施信息質量的準確性和有效性。

  第二招——建立環(huán)境數(shù)據(jù)傳輸與交換系統(tǒng)

  使得EPA各部門、各州環(huán)保部門、環(huán)保團體、企業(yè)等快速地交換環(huán)境數(shù)據(jù)

  在信息化建設之初,為滿足各項業(yè)務需求,EPA也分別建設了信息系統(tǒng)和數(shù)據(jù)庫,這些系統(tǒng)大多互不兼容,難于共享。

  對于不同業(yè)務系統(tǒng)的數(shù)據(jù)傳輸和交換需求,EPA沒有分別建立傳輸網絡和系統(tǒng),而是依靠統(tǒng)一的中央數(shù)據(jù)交換系統(tǒng)(Central Data eXchange,CDX)實現(xiàn)。這一平臺提供單一數(shù)據(jù)申報及交換窗口,使EPA各部門、州政府環(huán)保部門、部落或環(huán)保團體、企業(yè)能夠快速傳輸、交換環(huán)境數(shù)據(jù)。CDX目前已經延伸到加拿大及墨西哥,實現(xiàn)了跨境數(shù)據(jù)交換, 是EPA數(shù)據(jù)采集、傳輸和交換重要的基礎設施。

  目前已超過26萬個用戶在CDX上注冊,50個州和9個部落運用CDX所提供的空氣、水等相關環(huán)境數(shù)據(jù),60個系統(tǒng)的數(shù)據(jù)在CDX上交換,每年的交易數(shù)量超過80萬筆,節(jié)省了大量的時間和經費。

  第三招——建設環(huán)境數(shù)據(jù)倉庫

  形成綜合性的環(huán)境信息,并有利于實現(xiàn)數(shù)據(jù)的實時智能分析

  為整合、集成業(yè)務系統(tǒng)和數(shù)據(jù)以獲取綜合性的環(huán)境信息,EPA的OEI還通過從不同業(yè)務系統(tǒng)中抽取數(shù)據(jù),整合形成環(huán)境數(shù)據(jù)倉庫(EnviroFacts)。

  目前,包括大氣環(huán)境質量、有害固體廢棄物、超級基金場地、有毒物質排放清單、飲用水等大部分業(yè)務數(shù)據(jù)已經整合到EnviroFacts中,分為大氣、水、土壤、固廢、有毒物質、設施、輻射、守法等專題。公眾只要登陸EPA網站,就可以方便地查詢到所需要的各類環(huán)境信息。

  ★啟示錄:

  1、建立有唯一標識的排污設施

  我國很多地方都開展了“一企一檔”數(shù)據(jù)庫建設,而對有排污權的設施進行唯一標示,不僅可以直接對污染設施進行更加精細的管理,還建立起了各污染源之間的聯(lián)系,從而建立起全國范圍的“一企一檔”數(shù)據(jù)庫。比如某個集團在某地有分廠,排污設施系統(tǒng)可以直接實現(xiàn)數(shù)據(jù)勾連,這也是未來實現(xiàn)大數(shù)據(jù)的基石。

  2、建立統(tǒng)一的數(shù)據(jù)傳輸、交換系統(tǒng)

  我國目前也存在多系統(tǒng)并存的現(xiàn)象,各系統(tǒng)之間很難“對話”。EPA通過建立唯一通道,暢通了各數(shù)據(jù)系統(tǒng),只要“路”暢通了,就能實現(xiàn)無處不到。我國的信息化建設也可以借鑒此“鋪路”經驗,統(tǒng)一依托環(huán)保專網這一“高速公路”開展數(shù)據(jù)傳輸。

  3、建立數(shù)據(jù)倉庫

  數(shù)據(jù)可交換,已經實現(xiàn)了互通共享,但有些數(shù)據(jù)是關系國計民生的,環(huán)保部門需要根據(jù)這些數(shù)據(jù)做決策。這就需要建設數(shù)據(jù)倉庫,以滿足社會的需求和決策的需求。

(轉載)

標簽:大數(shù)據(jù) 中央數(shù)據(jù)交換系統(tǒng) 我要反饋 
2024世界人工智能大會專題
即刻點擊并下載ABB資料,好禮贏不停~
優(yōu)傲機器人下載中心
西克
2024全景工博會
專題報道
2024 工博會 | 直播探館 · 全景解讀
2024 工博會 | 直播探館 · 全景解讀

第二十四屆中國工博會于9月24日至28日在國家會展中心(上海)舉行,展會以“工業(yè)聚能 新質領航”為全新主題。 [更多]

2024世界人工智能大會
2024世界人工智能大會

WAIC 2024將于7月在上海舉行,論壇時間7月4日-6日,展覽時間7月4日-7日。WAIC 2024將圍繞“以共商促... [更多]

2024漢諾威工業(yè)博覽會專題
2024漢諾威工業(yè)博覽會專題

2024 漢諾威工業(yè)博覽會將于4月22 - 26日在德國漢諾威展覽中心舉行。作為全球首屈一指的工業(yè)貿易展覽會,本屆展覽會... [更多]