如今,在企業(yè)界,大數(shù)據(jù)已不再是新奇的事物??v觀整個商業(yè)市場,大數(shù)據(jù)早已成為董事會會議的經(jīng)常性議程項目,越來越多的C級高管們希望成為以洞察力驅動的組織掌舵人——利用數(shù)據(jù)分析和信息處理,了解市場及經(jīng)營業(yè)務。
市場研究機構IDC日前發(fā)布報告預測,全球大數(shù)據(jù)技術與服務市場至2019年的復合年均增長率將達到23.1%。
目前,利用大數(shù)據(jù)技術了解客戶需求和各項技術信息,從而使其經(jīng)營和管理日益高效和智能化已成為一種新常態(tài)。
然而,現(xiàn)存的商業(yè)環(huán)境中還存在一種對大數(shù)據(jù)概念的誤解——很多人認為數(shù)據(jù)分析僅可通過精準的數(shù)據(jù)收集來實現(xiàn)。事實恰恰相反,“大數(shù)據(jù)”是指以多元形式,自許多來源搜集而來的龐大數(shù)據(jù)組,往往具有實時性。在企業(yè)對企業(yè)銷售的情況下,這些數(shù)據(jù)可能得自社交網(wǎng)絡、電子商務網(wǎng)站、顧客來訪紀錄,還有許多其他來源。這些數(shù)據(jù)并非公司顧客關系管理數(shù)據(jù)庫的常態(tài)數(shù)據(jù)組,而是從海量數(shù)據(jù)中提取和獲得。大數(shù)據(jù)(big data,mega data)一般需要新處理模式才能具有更強的決策力、洞察力和流程優(yōu)化能力,以便取得海量、高增長率和多樣化的信息資產(chǎn)。因此,大數(shù)據(jù)并非來源于各項精準的數(shù)據(jù)信息,而是對海量數(shù)據(jù)的中有效信息的提取和分析。簡言之,從各種各樣類型的數(shù)據(jù)中,快速獲得有價值信息的能力,就是大數(shù)據(jù)技術。
有時,最全面的見解可能是通過分析大量不同來源的的異構數(shù)據(jù)而創(chuàng)建。當今大數(shù)據(jù)世界,想要確定一種產(chǎn)品或行業(yè)的發(fā)展趨勢,或證明一個假設的成立與否,完全可以通過“重數(shù)量而非質量”的方式來實現(xiàn)。
操作過程需精準
隨著數(shù)據(jù)集的不斷增長和開放,信息源日益增多,企業(yè)不得不以各種各樣的方式應對各類信息。這些數(shù)據(jù)表面看去可能原始、簡單、非結構化,但很多冗雜繁瑣的信息中可能隱藏著巨大商機和行業(yè)潛在發(fā)展趨勢,企業(yè)需培養(yǎng)其較強的洞察力用以接受和處理“數(shù)以億計”的數(shù)據(jù)集,大數(shù)據(jù)技術則是從這些“雜亂不堪”的數(shù)據(jù)中提取可用信息,并進一步使其“智能化”。
換句話說,大數(shù)據(jù)的核心在于為客戶挖掘數(shù)據(jù)中蘊藏的價值,而非軟硬件的堆砌。因此,針對不同領域的大數(shù)據(jù)應用模式、商業(yè)模式研究將是大數(shù)據(jù)產(chǎn)業(yè)健康發(fā)展的關鍵。微軟公司公共政策事務負責人兼首席法律顧問Smith先生稱,“數(shù)據(jù)資源對各行各業(yè)都非常重要,給我提供一些數(shù)據(jù),我就能做一些改變。如果給我提供所有數(shù)據(jù),我就能拯救世界。”
負責數(shù)據(jù)處理工作的統(tǒng)計學家和分析師們可能會對凌亂的數(shù)據(jù)集感到頭痛,他們需要從不同方式呈現(xiàn)的信息中提取可用信息,該過程要求及時準確,因為操作失誤和異常信息將導致整個分析結果產(chǎn)生偏差。
成功評價結論的不確定性和定量方法的有效性是合理利用大數(shù)據(jù)的一個關鍵技能,輸入數(shù)據(jù)不完善時,需及時洞察并進一步實施確認操作。
允許錯誤和不完美(缺陷)的存在
大數(shù)據(jù)就是互聯(lián)網(wǎng)發(fā)展到現(xiàn)今階段的一種表象,沒有必要對其神話或保持敬畏之心,在以云計算為代表的技術創(chuàng)新大幕襯托下,這些原本很難收集和使用的數(shù)據(jù)開始容易被利用起來,通過各行各業(yè)的不斷創(chuàng)新,大數(shù)據(jù)會逐步為人類創(chuàng)造更多價值。從技術上看,大數(shù)據(jù)與云計算的關系就像一枚硬幣的正反面。大數(shù)據(jù)無法用單臺計算機進行處理,必須采用分布式計算架構,其特色在于對海量數(shù)據(jù)的挖掘,但必須依托云計算的分布式處理、分布式數(shù)據(jù)庫、云存儲和/或虛擬化技術。
從根本上說,你處理數(shù)據(jù)的方式?jīng)Q定了該數(shù)據(jù)所具有的價值,因此,數(shù)據(jù)處理和分析的前提就是接受錯誤和不完美的存在,我們必須承認缺陷也是該數(shù)據(jù)集的一個組成部分,并相信相較于如此龐大的信息集,幾個簡單的錯誤數(shù)字不足以導致該分析結果產(chǎn)生明顯偏差。
另一方面,大數(shù)據(jù)的不精確和相對不完美在某種程度上可以幫助專業(yè)人士進行更切合實際的產(chǎn)品和行業(yè)預測,對于某些特定行業(yè),數(shù)據(jù)的不精準更可能促使較為完備的準備工作。實際上,接受凌亂的數(shù)據(jù)集還可減輕對有關數(shù)據(jù)輸入問題的偏見,對團隊合作也具有一定的積極意義。
如何撥亂反正?
如今的各種數(shù)據(jù)集可能會比以往任何時候都混亂復雜,認知分析將為大數(shù)據(jù)和實際決策參考數(shù)值之間的差距提供一種較為有效的彌補方式。
通過認知分析和深入研究,分析師研發(fā)出了從冗雜的數(shù)據(jù)中提取有效信息的各種算法,經(jīng)過分析、推導和演練,將熟練操縱高級抽象信息成為可能。
企業(yè)則可通過利用上述研究成果,分析和處理包括圖像、語言和視頻文件在內的各類復雜數(shù)據(jù)模型。面對大數(shù)據(jù)帶來的空間機遇,越來越多的企業(yè)將目光轉向該市場。當前,如何挖掘大數(shù)據(jù)金礦,實現(xiàn)數(shù)據(jù)變現(xiàn),正成為企業(yè)實現(xiàn)轉型發(fā)展的新機遇,各大網(wǎng)絡運營商也面臨著突破自身約束,應對外部競爭的重大挑戰(zhàn)。如今,數(shù)據(jù)已經(jīng)成為寶貴生產(chǎn)力,誰掌握了數(shù)據(jù)誰就可能擁有未來。
(轉載)