進入21世紀以來,人類在信息存儲和處理能力方面不斷涌現技術性的突破,目前被人們熱議和關注的大數據即代表著最新潮流。互聯網上每天產生的數據如潮水般涌現并被保存,當數據量達到一定規模的時候,就會從量變到質變,對人們的日常生活產生巨大影響,進而改變組織和社會的管理方式。
事實上,對海量數據的成功應用早已有之。2009年全球爆發甲型H1N1流感,美國公共衛生機構的工作效率輸給了商業企業谷歌公司。原因是公共衛生機構的官員在統計疫情傳播的起源和渠道時,使用的是傳統的數據反饋方式,獲得的信息比疫情的真實傳播速度整整滯后了兩周;而谷歌公司通過美國人在網上檢索的海量詞條,迅速且成功地運用數字模型判斷出甲流傳播的途徑和趨勢,為官方提供了及時有效的數據。當人們為這個案例驚嘆的同時,也不得不承認,《大數據時代:生活、工作和思維的改變》的作者、英國牛津大學教授維克托·舍恩伯格所斷言的大數據時代已經來臨了!
提到大數據時代,人們的第一反應就是數據量大。誠然,人類的信息存量正在以幾何倍數增加。據統計,一分鐘內,僅微博網站推特上新發的信息條數就超過10萬條;社交網絡臉譜上的瀏覽量則超過600萬;到2013年,全世界儲存的信息如果記錄在光盤上,這些光盤疊加起來,高度等于從地球到月球走一趟。用信息爆炸來形容今天的社會和時代毫不為過。
然而,在舍恩伯格看來,大數據的“大”,并不是指數據本身絕對數量大,而是指處理數據所使用的“大”模式:盡可能地收集全面數據、完整數據和綜合數據,同時使用數學算法對其進行分析和建模,挖掘出背后的關系,從而預測某一事件發生的概率。美國計算機專家迪博德說過,在信息時代,通過信息加總和數據整合,對個人信息進行分析的穿透力要遠遠大于1+1的效果,它不需要對每個抽樣樣本進行精確提取,卻能獲得比抽樣調查更加精準的結果。通過全數據模式推演事物發展規律的成功案例已不在少數。
目前,人們已越來越多地認識到互聯網數據背后蘊涵的科學、經濟和社會價值,把大數據模型系統地應用到公共商業服務中,為政府、企業或個人提供服務:對沖基金通過剖析推特上的數據來預測股市的走勢;亞馬遜公司根據用戶的查詢記錄來推薦產品;紐約政府使用犯罪數據和地圖進行城市管理……在中國,數據的挖掘也已經起步:2012年,阿里巴巴提出大數據戰略,旨在通過資源共享與數據互通創造商業價值;去年“雙十一”銷售熱潮中,以云計算為基礎的聚石塔服務,對數以億萬計的消費者需求信息進行捕捉匯總,幫助網商隨時調整商品和銷售決策,以提供精準、有效的服務。
盡管我們看到了大數據時代的無限機遇,但人類在互聯網領域不過才走了幾十年。除了要解決個人隱私和信息安全等問題外,整個網絡世界的數據仍然是局部的、碎片化的。如果能把散落在各個國家、各個機構及個人手中的數據集中起來,那么,大數據所能發揮的作用更會超越我們的想象。