siemens x
大數(shù)據(jù)

知識圖譜如何為數(shù)據(jù)分析帶來變革?

2025China.cn   2022年02月11日

  數(shù)據(jù)大爆炸時代,企業(yè)面臨著全面數(shù)字化轉型的挑戰(zhàn)。如何挖掘數(shù)據(jù)之間的內在關聯(lián),并將這些洞察應用于關鍵業(yè)務決策,驅動從數(shù)據(jù)分析到數(shù)據(jù)智能的轉化成為關鍵。

  作為高級數(shù)據(jù)科學的一大趨勢,知識圖譜的應用已經滲透到不同領域的各個細分行業(yè)。根據(jù)Neo4j一項針對100名企業(yè)高管的相關調查揭示,88%的企業(yè)管理者已經認識到知識圖譜的價值,認為知識圖譜可以幫助跨越管理和數(shù)據(jù)治理的瓶頸,在彌合數(shù)據(jù)孤島,改進AI或者機器學習,以及協(xié)助開辟新收入來源等方面發(fā)揮重要作用。

  什么是知識圖譜?阿蘭·圖靈研究所(Alan Turing Institute)將知識圖譜定義為“對知識進行編碼以在開放、不斷發(fā)展、去中心化系統(tǒng)中大規(guī)模使用”的最佳方式。簡而言之,知識圖譜是具有豐富含義、相互關聯(lián)的數(shù)據(jù)集。企業(yè)可以針對基礎數(shù)據(jù)進行推理,并且自信地將其用于復雜的分析和決策中。

Neo4j高級產品市場總監(jiān)Maya Natarajan博士

  Neo4j知識圖譜包含數(shù)據(jù)、顯示動態(tài)內容的圖數(shù)據(jù)及語義在內的三大要素。與關系型數(shù)據(jù)庫的平面結構不同,當數(shù)據(jù)被抽取到Neo4j動態(tài)圖結構中存儲時,節(jié)點和節(jié)點之間的關系就被添加進來,為數(shù)據(jù)提供了動態(tài)的內容,即第一層上下文關系。而隨著信息不斷豐富,圖也會不斷增長。在圖中獲取數(shù)據(jù)并為它添加語義,就獲得一個知識圖。語義為圖添加了第二層上下文關系,圖譜就具備了深入動態(tài)的上下文關系。通過這個步驟將智能引入到數(shù)據(jù)當中,便于系統(tǒng)或者客戶從中推斷出不同的含義。

  根據(jù)數(shù)據(jù)范圍,Neo4j知識圖譜的應用范疇劃分為數(shù)據(jù)管理和數(shù)據(jù)分析。數(shù)據(jù)管理包括匯集、校驗、治理和探索數(shù)據(jù)。而數(shù)據(jù)分析側重推理、預測判定。相對應的,Neo4j提供行為圖和決策圖兩種類型的知識圖譜,協(xié)助客戶從行為知識圖譜過渡到決策知識圖譜,實現(xiàn)數(shù)據(jù)分析到數(shù)據(jù)智能,完成數(shù)據(jù)創(chuàng)新。

  行為知識圖譜

  行為知識圖譜是以數(shù)據(jù)管理為核心的知識圖譜,其主要目的是提供數(shù)據(jù)保障,并通過數(shù)據(jù)洞察來推動決策行動。數(shù)據(jù)保障側重把不同數(shù)據(jù)源的數(shù)據(jù)聚合在一起,進行數(shù)據(jù)交叉驗證從而產生洞察。而數(shù)據(jù)治理包括如何溯源數(shù)據(jù)目錄和結構,數(shù)據(jù)是否存在血緣關系以及是否合規(guī),以甄別存在的風險。數(shù)據(jù)洞察超越了信息存儲的可見性,專注于新知識的探索、演繹和推理。

  行為知識圖譜常見的用例包括耳熟能詳?shù)目蛻?60和患者360、產品360、供應鏈360等在內的X360系列,以及金融行業(yè)身份驗證,訪問管理,欺詐、反洗錢的根本原因分析以及改善建議等。Neo4j行為知識圖譜幫助客戶更加深入了解并精準地劃分用戶,以提供個性化的服務。

  決策知識圖譜

  決策知識圖譜側重于數(shù)據(jù)分析和預測、判定,提供基于圖的分析和基于圖的機器學習。數(shù)據(jù)分析添加不同的語義,幫助客戶從更深層次理解數(shù)據(jù),從而改進決策系統(tǒng)并采取最佳的措施。

  決策知識圖譜的主要用例包括流失分析、欺詐分析、風險分析、假設分析和影響分析以及實體解析和知識圖譜補全和預測模型等。由于數(shù)據(jù)是一個連續(xù)的圖譜,Neo4j客戶典型的數(shù)據(jù)圖都是從行為知識圖譜開始,進而演進到決策知識圖譜。從數(shù)據(jù)洞察到數(shù)據(jù)分析,最后到基于圖的機器學習。以金融行業(yè)反欺詐為例,欺詐識別是一個數(shù)據(jù)洞察用例,Neo4j添加了很多圖算法開展檢測并且進行不同類型的分類和標記。這些算法允許檢測不同的欺詐模式,同時通過算法來提取圖特征進行訓練,通過機器學習來實現(xiàn)建模,預測欺詐。

  知識圖譜如何助力企業(yè)實現(xiàn)數(shù)字化轉型?

  Neo4j知識圖譜解決方案是一個知識圖譜平臺,建立在豐富的產品基礎上,包括負責數(shù)據(jù)存儲的Neo4j圖數(shù)據(jù)庫,幫助建模的知識圖譜工作臺,致力數(shù)據(jù)分析的圖數(shù)據(jù)科學 (GDS) 以及數(shù)據(jù)可視化工具Neo4j Bloom。

  每個企業(yè)或組織都有大量各自為政的數(shù)據(jù),數(shù)據(jù)孤島其實不是一件壞事,由于每個數(shù)據(jù)孤島都較小,用戶可以方便地對其進行數(shù)據(jù)維護和控制,并制定政策。但另一方面,數(shù)據(jù)孤島會降低數(shù)據(jù)質量、分析速度和報告的準確性。Neo4j為知識圖譜添加各種關聯(lián)以及豐富的上下文關系,將數(shù)據(jù)孤島串聯(lián)起來,提供一個完整可見的數(shù)據(jù)查詢視圖。基于查詢視圖,過渡到更深入的數(shù)據(jù)聯(lián)邦,獲得更加豐富的內容。在這個過程當中,知識圖譜描述了整個結構中各個數(shù)據(jù)源之間的關聯(lián)關系,并添加了上下文,提供數(shù)據(jù)的上下文智能。

  企業(yè)管理者越來越將數(shù)據(jù)視為商業(yè)的重要資產,這意味他們現(xiàn)在更加關注怎樣獲取數(shù)據(jù)洞察力、改善決策制定、提高業(yè)務績效。為了確保從數(shù)據(jù)中獲得最大的價值,管理者會關注三個主要領域:側重數(shù)據(jù)管理和數(shù)據(jù)治理的業(yè)務大師、專注數(shù)據(jù)分析和機器學習及人工智能的分析師、數(shù)據(jù)創(chuàng)新者。知識圖譜將幫助企業(yè)在不改變現(xiàn)有數(shù)據(jù)格局和基礎設施的前提下進行數(shù)據(jù)編排和自動化,為管理者提供一個連續(xù)觀察層,優(yōu)化數(shù)據(jù)管理、數(shù)據(jù)預測和數(shù)據(jù)創(chuàng)新,加速企業(yè)數(shù)字化轉型。

  作為圖數(shù)據(jù)平臺的領導者,Neo4j所有的圖數(shù)據(jù)科學項目都始于知識圖譜,其67%的客戶已經成功地實施了知識圖譜,包括美國航空航天局(NASA)、易貝(eBay),UBS,思科(Cisco),卡特彼勒公司(Caterpillar)以及阿斯利康(AstraZeneca)等。

  作者:Neo4j高級產品市場總監(jiān)Maya Natarajan博士

(轉載)

標簽:Neo4j 知識圖譜 我要反饋 
2024世界人工智能大會專題
即刻點擊并下載ABB資料,好禮贏不停~
優(yōu)傲機器人下載中心
西克
2024全景工博會
專題報道
2024 工博會 | 直播探館 · 全景解讀
2024 工博會 | 直播探館 · 全景解讀

第二十四屆中國工博會于9月24日至28日在國家會展中心(上海)舉行,展會以“工業(yè)聚能 新質領航”為全新主題。 [更多]

2024世界人工智能大會
2024世界人工智能大會

WAIC 2024將于7月在上海舉行,論壇時間7月4日-6日,展覽時間7月4日-7日。WAIC 2024將圍繞“以共商促... [更多]

2024漢諾威工業(yè)博覽會專題
2024漢諾威工業(yè)博覽會專題

2024 漢諾威工業(yè)博覽會將于4月22 - 26日在德國漢諾威展覽中心舉行。作為全球首屈一指的工業(yè)貿易展覽會,本屆展覽會... [更多]