siemens x
大數(shù)據(jù)

大數(shù)據(jù)≠“大”的數(shù)據(jù)

2025China.cn   2017年09月11日

  “多大的數(shù)據(jù)才叫大數(shù)據(jù)?”

  中國南京軟博會(huì)的重頭戲——大數(shù)據(jù)產(chǎn)業(yè)互聯(lián)網(wǎng)融合創(chuàng)新發(fā)展高峰論壇開講在即,記者在會(huì)場門口“抓”到加拿大工程院院士凌曉峰。問及大數(shù)據(jù)產(chǎn)業(yè)如何“驅(qū)動(dòng)未來”,這位國際權(quán)威專家以一句反問作答。

  作為第一位登臺(tái)演講嘉賓,凌曉峰院士正式拋出自己的新觀點(diǎn):大數(shù)據(jù)≠“大”的數(shù)據(jù)。

  “你可以去問任何一個(gè)專家,到底什么叫‘大數(shù)據(jù)’?多大的數(shù)據(jù)才能叫‘大數(shù)據(jù)’?他肯定回答不出來嘛?!绷钑苑逭f,數(shù)據(jù)的“大”或“小”并不是關(guān)鍵,重要的是從數(shù)據(jù)中挖掘價(jià)值,創(chuàng)造價(jià)值。

  舉例而言,醫(yī)學(xué)應(yīng)用上研究心臟疾病,想知道病人怎么做才能更加健康,于是搜集大數(shù)據(jù)。但一個(gè)人每天產(chǎn)生的各類數(shù)據(jù)是海量的,大量的數(shù)據(jù)跟病理反應(yīng)本質(zhì)上毫無關(guān)系,你去搜集、去分析,不但做了無用功,還可能得出錯(cuò)誤的分析結(jié)論。一個(gè)反面案例是,在美國拉斯維加斯的賭場,紅黑轉(zhuǎn)盤邊都用一個(gè)大屏幕顯示之前的開獎(jiǎng)信息。很多人看著前面出現(xiàn)“紅色”次數(shù)較多就下注“黑色”,這就是典型的“數(shù)據(jù)噪聲”——搞統(tǒng)計(jì)的都知道,這完全是隨機(jī)的,這些所謂的“大數(shù)據(jù)”是無效的甚至干擾的。

  “開展大數(shù)據(jù)分析一定要有‘應(yīng)用場景’,講求數(shù)據(jù)的精準(zhǔn)性和關(guān)聯(lián)度,數(shù)據(jù)本身的‘大’或‘小’并不是關(guān)鍵。” 凌曉峰說,盲目追求數(shù)據(jù)之大,產(chǎn)生不了“有用的結(jié)果”,反而容易“自我迷惑”,這也是當(dāng)下大數(shù)據(jù)產(chǎn)業(yè)存在的普遍誤區(qū)。

  這一觀點(diǎn)有極強(qiáng)的現(xiàn)實(shí)針對(duì)性。當(dāng)下,不少制造企業(yè)言必稱“大數(shù)據(jù)”,無論搞什么產(chǎn)品,都接入光纖,加上傳感器,每時(shí)每刻產(chǎn)生一大堆“數(shù)據(jù)”。問題在于,數(shù)據(jù)有了,但哪些有效哪些無效,無從辨別。不但造成硬件設(shè)備和統(tǒng)計(jì)計(jì)算資源的浪費(fèi),還可能因“數(shù)據(jù)噪音”的干擾得出錯(cuò)誤結(jié)論,反而削弱市場競爭力。

  “我們把大而無當(dāng)?shù)臄?shù)據(jù)稱作‘低價(jià)值密度’的數(shù)據(jù)?!敝袊こ淘涸菏孔T建榮告訴記者,以前專業(yè)術(shù)語就叫“數(shù)據(jù)挖掘”“數(shù)據(jù)分析”,現(xiàn)在為何要給數(shù)據(jù)加上“大”的前綴?在他看來,所謂的大,一是強(qiáng)調(diào)數(shù)據(jù)的時(shí)效性,以前數(shù)據(jù)報(bào)表都是延時(shí)的,新的物聯(lián)傳感技術(shù)手段提供的數(shù)據(jù)更實(shí)時(shí),也更有價(jià)值。二是強(qiáng)調(diào)關(guān)聯(lián)化。他調(diào)研發(fā)現(xiàn),長三角企業(yè)推進(jìn)信息化,普遍采用生產(chǎn)管理軟件。但這些通用軟件數(shù)量多達(dá)幾十上百種,不同軟件產(chǎn)生的數(shù)據(jù)是不共享的。如果產(chǎn)生不了關(guān)聯(lián)效應(yīng),再多的數(shù)據(jù)都只能算是“小數(shù)據(jù)”。三是要強(qiáng)調(diào)“個(gè)性化”。數(shù)據(jù)模型越大,越能得到個(gè)性化的特征,如何將客戶模糊的個(gè)性化需求數(shù)據(jù)轉(zhuǎn)化為設(shè)計(jì)技術(shù)指標(biāo),將是工業(yè)大數(shù)據(jù)應(yīng)用的下一個(gè)“風(fēng)口”。

  “大數(shù)據(jù)真正要義不在于大,而在于多元?!贝髷?shù)據(jù)產(chǎn)業(yè)大咖、零點(diǎn)研究咨詢集團(tuán)董事袁岳說,如何使多元數(shù)據(jù)在匯聚的過程中,通過軟件處理最終得到科學(xué)的分析結(jié)果,變成有用的數(shù)據(jù)源,這才是生產(chǎn)制造和社會(huì)管理領(lǐng)域建立大數(shù)據(jù)決策系統(tǒng)的意義?!熬拖裢诘V過程中,大數(shù)據(jù)是其中的原油,只有經(jīng)過精細(xì)的提煉變成精數(shù)據(jù)才有價(jià)值。”

  一場“頭腦風(fēng)暴”,歷時(shí)三四個(gè)小時(shí)。唇槍舌劍中,一項(xiàng)項(xiàng)共識(shí)逐漸成型——大數(shù)據(jù)≠“大”的數(shù)據(jù);大數(shù)據(jù)產(chǎn)業(yè)發(fā)展要“應(yīng)用導(dǎo)向”;數(shù)據(jù)將是未來發(fā)展最重要的資源,甚至“驅(qū)動(dòng)未來”……

  “去年8月《江蘇省大數(shù)據(jù)發(fā)展行動(dòng)計(jì)劃》發(fā)布后,大數(shù)據(jù)產(chǎn)業(yè)在全省蓬勃發(fā)展,應(yīng)用日新月異,產(chǎn)業(yè)園遍地開花?!蹦暇┐髷?shù)據(jù)產(chǎn)業(yè)協(xié)會(huì)負(fù)責(zé)人說,《第三次浪潮》里早把大數(shù)據(jù)看作是繼計(jì)算機(jī)、互聯(lián)網(wǎng)之后的信息時(shí)代的第三次技術(shù)革命。但時(shí)至今日,還有人認(rèn)為“不過是IT、互聯(lián)網(wǎng)業(yè)界的又一次概念炒作”。此次高峰論壇厘清大數(shù)據(jù)本質(zhì),直指當(dāng)前產(chǎn)業(yè)發(fā)展誤區(qū),既契合“數(shù)據(jù)驅(qū)動(dòng)未來”的軟博會(huì)主題,又對(duì)國內(nèi)大數(shù)據(jù)產(chǎn)業(yè)今后發(fā)展有“里程碑”意義。

(轉(zhuǎn)載)

標(biāo)簽:大數(shù)據(jù) 我要反饋 
2024世界人工智能大會(huì)專題
即刻點(diǎn)擊并下載ABB資料,好禮贏不停~
優(yōu)傲機(jī)器人下載中心
西克
2024全景工博會(huì)
專題報(bào)道
2024 工博會(huì) | 直播探館 · 全景解讀
2024 工博會(huì) | 直播探館 · 全景解讀

第二十四屆中國工博會(huì)于9月24日至28日在國家會(huì)展中心(上海)舉行,展會(huì)以“工業(yè)聚能 新質(zhì)領(lǐng)航”為全新主題。 [更多]

2024世界人工智能大會(huì)
2024世界人工智能大會(huì)

WAIC 2024將于7月在上海舉行,論壇時(shí)間7月4日-6日,展覽時(shí)間7月4日-7日。WAIC 2024將圍繞“以共商促... [更多]

2024漢諾威工業(yè)博覽會(huì)專題
2024漢諾威工業(yè)博覽會(huì)專題

2024 漢諾威工業(yè)博覽會(huì)將于4月22 - 26日在德國漢諾威展覽中心舉行。作為全球首屈一指的工業(yè)貿(mào)易展覽會(huì),本屆展覽會(huì)... [更多]