siemens x
大數(shù)據(jù)

政府開放共享大數(shù)據(jù) 才能關(guān)聯(lián)聚合產(chǎn)生更大價值

2025China.cn   2018年02月09日

  “大家以為數(shù)學(xué)家都像陳景潤一樣,邊走路邊思考數(shù)學(xué)問題,然后撞電線桿上了,其實不是。”2月8日下午,中國科學(xué)院院士、數(shù)學(xué)家徐宗本出席南都報系2017年總結(jié)表彰會暨南都大數(shù)據(jù)研究院揭牌儀式,現(xiàn)場分享了題為《再論大數(shù)據(jù)》的主題演講。

  “畫面中看似混雜無序的小碎片,經(jīng)過成倍數(shù)據(jù)的疊加,最后形成一張大象的圖像。當(dāng)數(shù)據(jù)達(dá)到量變和質(zhì)變的臨界點時,人們可以清晰看到數(shù)據(jù)背后的故事,這就是大數(shù)據(jù)。而數(shù)據(jù)如果不相關(guān)聯(lián)和分析,就無法創(chuàng)造更大的價值,好比有人只看到大象的鼻子,有人只琢磨大象的尾巴,但是怎么也看不到大象的整體?!眹@大數(shù)據(jù)原理,與其它信息技術(shù)的關(guān)系及盈利模式等問題,徐宗本借形象比喻與案例,將原本深奧的內(nèi)容生動化。在他看來,目前國內(nèi)大數(shù)據(jù)產(chǎn)業(yè)鏈條存在缺乏健壯性、完整性的問題。在國家大數(shù)據(jù)戰(zhàn)略推動下,各地建立數(shù)據(jù)中心的積極性非常高。但在大數(shù)據(jù)產(chǎn)業(yè)價值鏈上,存儲只是一部分,如果缺乏分析挖掘能力,并形成數(shù)據(jù)產(chǎn)品,就好比只買米不做飯。

  徐宗本總結(jié),做大數(shù)據(jù)首先要明確目標(biāo),“數(shù)據(jù)是基礎(chǔ),平臺是支撐,分析是核心,賺錢是王道。于大數(shù)據(jù)產(chǎn)業(yè)而言,數(shù)據(jù)就是基本的生產(chǎn)資料,而平臺為收集存儲數(shù)據(jù)提供支撐,最為核心的是分析,通過對數(shù)據(jù)的具體加工解決實際問題,進(jìn)而變現(xiàn)創(chuàng)造價值?!?/FONT>

  ◎談大數(shù)據(jù)產(chǎn)業(yè)

  國內(nèi)大數(shù)據(jù)產(chǎn)業(yè)處在初步階段 紅利未得到充分釋放

  南都:人們常有一個疑惑,多少數(shù)量級的數(shù)據(jù)才能被定義為“大數(shù)據(jù)”?

  徐宗本:大數(shù)據(jù)需要有很大空間才能存儲,如果這樣理解大數(shù)據(jù),就是比較低級的認(rèn)識。首先,我們需要認(rèn)清幾個概念。資料是指記錄日常生活、經(jīng)營、管理、生產(chǎn)過程的載體,比如一張報告,一份視頻等。如果這些資料放在計算機(jī)上,那就是數(shù)據(jù)。數(shù)據(jù)是資料的數(shù)字化,以編碼形成存在的信息載體。大數(shù)據(jù)則是大而復(fù)雜的數(shù)據(jù),具有海量性、時變性、異構(gòu)性、分布性的特征。數(shù)據(jù)從量變到質(zhì)變會產(chǎn)生一個臨界點,嚴(yán)格上超過這個臨界點才達(dá)到“大”的含義,所以大數(shù)據(jù)是個相對概念,與特定的決策問題相關(guān)聯(lián)。

  南都:在你看來,目前國內(nèi)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展處于什么階段?

  徐宗本:與國外相比,我認(rèn)為基本處于同一水平。現(xiàn)在大數(shù)據(jù)上升為國家戰(zhàn)略,政府在積極推動,這是一個制度優(yōu)勢。同時,我們還有一個天然優(yōu)勢,就是人多市場大,數(shù)據(jù)資源豐富,而且目前國內(nèi)互聯(lián)網(wǎng)發(fā)展也走在前頭。但總體而言,大數(shù)據(jù)產(chǎn)業(yè)還處在初步階段。產(chǎn)業(yè)鏈條缺乏健壯性和完整性,未支持形成穩(wěn)定的價值鏈。數(shù)據(jù)開放共享發(fā)展也較為落后,大數(shù)據(jù)的紅利未得到充分釋放。此外,地方政府還只滿足于規(guī)劃和戰(zhàn)略層面,尚未具體落實。更重要的是對需求的認(rèn)知模糊。企業(yè)的大數(shù)據(jù)盈利模式并不清晰,核心技術(shù)也有待突破。最后一些政策法規(guī)跟進(jìn)不及時,數(shù)據(jù)壟斷、數(shù)據(jù)安全事件多發(fā)。對于大數(shù)據(jù)產(chǎn)業(yè),人們在觀望,也存在盲目性。

  ◎談大數(shù)據(jù)價值

  數(shù)據(jù)只存儲不分析變不了現(xiàn) 創(chuàng)造價值關(guān)鍵在于模式

  南都:為什么大數(shù)據(jù)能產(chǎn)生價值?

  徐宗本:我認(rèn)為與四個大數(shù)據(jù)原理有關(guān)。首先是量變質(zhì)變原理,積累的數(shù)據(jù)量足夠充分后,可以解決具體問題。第二個是關(guān)聯(lián)聚合原理,比如研究大象,如果一個人只盯著大象的鼻子、尾巴,你觀察20年,積累再多數(shù)據(jù),也不能反映原來的面貌。數(shù)據(jù)只有聚合才能產(chǎn)生價值,共享則能放大價值。另外還有“分析出價值”原理,目前各地建立了太多數(shù)據(jù)中心,甚至出現(xiàn)產(chǎn)能過剩的問題。如果數(shù)據(jù)只存儲不加以分析,則變不了現(xiàn)。最后,數(shù)據(jù)本身擁有的可復(fù)制、可重用、可加工的特點,使得數(shù)據(jù)的價值能夠隨著擴(kuò)散的范圍而增大。這就是效用倍增原理。

  南都:你曾提到大數(shù)據(jù)如果只存儲不分析,就好比只買米不做飯,是這樣嗎?

  徐宗本:是的。大數(shù)據(jù)產(chǎn)業(yè)的本質(zhì)在于分析數(shù)據(jù)。很多人不知道,這個比喻其實出自南方報業(yè)記者一篇報道。當(dāng)時,我在廣東參加一場活動,分享關(guān)于大數(shù)據(jù)的一些看法,記者用這個比喻做標(biāo)題,解讀得非常準(zhǔn)確。這也是為什么你們一邀請我來參加活動,我就來了。因為我相信你們的水平。

  南都:大數(shù)據(jù)的盈利模式有哪些?

  徐宗本:很多人很關(guān)心大數(shù)據(jù)怎么賺錢。大數(shù)據(jù)產(chǎn)業(yè)鏈上,包括數(shù)據(jù)資源獲取與管理;數(shù)據(jù)傳輸、存儲和處理;數(shù)據(jù)分析、挖掘與理解;結(jié)合領(lǐng)域的大數(shù)據(jù)應(yīng)用?;趦r值鏈條的不同,可分為全鏈條模式和節(jié)點聚焦模式兩種。前者關(guān)注聚焦全部環(huán)節(jié),后者是做精中間產(chǎn)品,專注于某一環(huán)。第三種模式是垂直行業(yè)的合作共建模式,行業(yè)公司和技術(shù)公司合資成立公司,這樣既可以保護(hù)數(shù)據(jù)源,又能增強(qiáng)服務(wù)。第四種模式是產(chǎn)研共生,一個公司和一個研究院合作,可保證產(chǎn)品質(zhì)量的可持續(xù)性。最后是推動產(chǎn)業(yè)的平臺模式,這種更適用于政府,由政府搭建平臺提供公共服務(wù),企業(yè)在其中孵化產(chǎn)品。其實大數(shù)據(jù)可以做很多事情,關(guān)鍵在于模式要對。

  ◎談大數(shù)據(jù)應(yīng)用

  大數(shù)據(jù)帶來思維的改變 利用不同數(shù)據(jù)能提高效率服務(wù)

  南都:現(xiàn)在人工智能、物聯(lián)網(wǎng)等技術(shù)發(fā)展迅速,人工智能的核心是大數(shù)據(jù)的分析,物聯(lián)網(wǎng)的發(fā)展也離不開大數(shù)據(jù)。如何看待大數(shù)據(jù)的應(yīng)用問題?

  徐宗本:現(xiàn)在大數(shù)據(jù)的實際應(yīng)用案例已經(jīng)不少,比如對醫(yī)療數(shù)據(jù)的應(yīng)用,通過對大量的影像和病例數(shù)據(jù)分析,進(jìn)而作出醫(yī)療診斷,有些技術(shù)水平已經(jīng)達(dá)到能與醫(yī)生相匹敵的程度。當(dāng)然,目前大數(shù)據(jù)的應(yīng)用水平仍處于低位水平,數(shù)據(jù)開放共享進(jìn)展滯后,大數(shù)據(jù)的活力還未得到充分釋放?,F(xiàn)在80%的數(shù)據(jù)掌握在政府手中,很多人在呼吁政府開放共享數(shù)據(jù),這樣才能讓數(shù)據(jù)產(chǎn)生關(guān)聯(lián)聚合產(chǎn)生更大的價值。

  南都:在大數(shù)據(jù)應(yīng)用過程中,一些企業(yè)有時并不知道自身需要什么樣的數(shù)據(jù),并且拿到數(shù)據(jù)后,也可能不清楚這個數(shù)據(jù)可實現(xiàn)多大價值。這是為什么?

  徐宗本:我覺得是缺乏大數(shù)據(jù)思維的原因。在我看來,大數(shù)據(jù)帶來的是思維的改變,能夠為我們提供社會科學(xué)方法論?,F(xiàn)在企業(yè)做商業(yè)分析更多的還是基于業(yè)內(nèi)數(shù)據(jù)分析。舉個例子,比如我開了一家火鍋店,目的是提高營業(yè)額。大數(shù)據(jù)怎么來幫忙呢?如果只是分析一天有多少顧客量,點了什么菜,消費額多少,這并不足為奇。需要注意的是,人們吃火鍋跟天氣、地域、小區(qū)周圍有關(guān)。如果你收集和分析了天氣數(shù)據(jù)、人口分布數(shù)據(jù)等,你就可以知道天馬上冷了,人們想吃火鍋了,哪里的人最喜歡吃麻辣火鍋,店鋪周圍的小區(qū)住戶是什么人,這樣利用不同數(shù)據(jù)能夠提高我們的效率和服務(wù)。

  ◎談數(shù)據(jù)安全

  必須采用技術(shù)手段保護(hù)用戶隱私

  南都:數(shù)據(jù)流通才能創(chuàng)造價值。但數(shù)據(jù)流通過程中,可能涉及個人隱私和數(shù)據(jù)安全的問題?

  徐宗本:掌握大數(shù)據(jù)的政府部門、企業(yè)都負(fù)有不可推卸的責(zé)任,那就是必須采用技術(shù)手段,保護(hù)用戶的隱私。比如將數(shù)據(jù)抽象化,進(jìn)行脫敏和匿名化處理,同時還要承諾不能泄露和非法買賣數(shù)據(jù)。

  可以看到,現(xiàn)在公眾對于個人隱私尤為關(guān)注。但另一方面,數(shù)據(jù)不流通不使用就無法創(chuàng)造價值,不要認(rèn)為我所有的數(shù)據(jù)都不能讓別人知道。舉個例子,你的病例信息,誰來看比較好?如果大家都不提供病例信息,醫(yī)生就無法通過大量醫(yī)療數(shù)據(jù),發(fā)現(xiàn)疾病規(guī)律和作出預(yù)測。而且,在數(shù)據(jù)分析過程中,醫(yī)生并不需要知道甲乙丙丁具體是誰。另外,還涉及到承諾和默契的問題。比如遇上婦產(chǎn)科醫(yī)生是男的,產(chǎn)婦讓不讓他接生?所以,我認(rèn)為企業(yè)應(yīng)該主動擔(dān)起保護(hù)責(zé)任,通過用戶協(xié)議、隱私政策等方式,告訴用戶是怎么收集和使用數(shù)據(jù)的,作出相應(yīng)的承諾。

  南都:當(dāng)被掌握的信息越來越多,一個直觀的感受是針對你的營銷越來越精準(zhǔn)。如果有一天機(jī)器比你更了解你自己,這是一件值得擔(dān)心的事嗎?

  徐宗本:互聯(lián)網(wǎng)或大數(shù)據(jù)來了以后,改變最大的是客戶關(guān)系,客戶在生產(chǎn)地位不一樣,過去用戶是上帝,現(xiàn)在叫做生產(chǎn)資料的一部分。隨著數(shù)據(jù)的積累,機(jī)器對你的行為習(xí)慣、購買力、價值觀愛好等,作出的預(yù)測當(dāng)然會越來越精準(zhǔn),但不可能做到百分百。因為一旦意識到某個問題,人可以突然改變主意,就讓你預(yù)測不出來。人和機(jī)器的不同在于,人可以產(chǎn)生意識、情感和頓悟。我認(rèn)為不用擔(dān)心,機(jī)器代替不了人。

(轉(zhuǎn)載)

標(biāo)簽:大數(shù)據(jù) 我要反饋 
2024世界人工智能大會專題
即刻點擊并下載ABB資料,好禮贏不停~
優(yōu)傲機(jī)器人下載中心
西克
2024全景工博會
專題報道
2024 工博會 | 直播探館 · 全景解讀
2024 工博會 | 直播探館 · 全景解讀

第二十四屆中國工博會于9月24日至28日在國家會展中心(上海)舉行,展會以“工業(yè)聚能 新質(zhì)領(lǐng)航”為全新主題。 [更多]

2024世界人工智能大會
2024世界人工智能大會

WAIC 2024將于7月在上海舉行,論壇時間7月4日-6日,展覽時間7月4日-7日。WAIC 2024將圍繞“以共商促... [更多]

2024漢諾威工業(yè)博覽會專題
2024漢諾威工業(yè)博覽會專題

2024 漢諾威工業(yè)博覽會將于4月22 - 26日在德國漢諾威展覽中心舉行。作為全球首屈一指的工業(yè)貿(mào)易展覽會,本屆展覽會... [更多]