由于數(shù)據(jù)采集方式的智能化,萬事萬物都可以映射為數(shù)據(jù),就像柏拉圖的著名洞喻,洞內(nèi)影像是洞外之物的映射,這樣,數(shù)據(jù)與事物之間具有一種對應關系。事物的客觀實在性基本上得到了公認,但是由事物映射而成的數(shù)據(jù)是否也有實在性呢?數(shù)據(jù)是事物屬性的刻畫,反映出事物的信息,就像運動、時空是事物的基本屬性一樣,數(shù)據(jù)作為事物的基本屬性與事物本身具有依隨性,不存在沒有數(shù)據(jù)足跡的事物。因此,事物的數(shù)據(jù)就成為反映事物的一種實在,我們可以稱之為數(shù)據(jù)實在。由反映事物實在的數(shù)據(jù)實在聚集一起而構成了一個虛擬世界,我們可以稱之為數(shù)據(jù)世界。大數(shù)據(jù)時代的來臨以及數(shù)據(jù)世界的形成給科研方式和知識發(fā)現(xiàn)模式帶來了巨大的變革。
首先,科研對象發(fā)生了變化,數(shù)據(jù)世界的形成為科學研究提供了新對象。
以往的科學研究一般都是直接面對自然界或人類社會,直接與研究對象打交道。例如天文學家直接將天文望遠鏡對準太空,觀察星象;物理學家直接與物質(zhì)世界打交道,設計實驗、記錄結果等等。大數(shù)據(jù)時代隨著數(shù)據(jù)量的暴增以及數(shù)據(jù)世界的形成,科學工作者不再把全部精力與物質(zhì)世界打交道,而是開始直接挖掘反映物理實在的數(shù)據(jù)世界。通過數(shù)據(jù)世界的挖掘,科學家們可以發(fā)現(xiàn)數(shù)據(jù)里面所隱藏的各種秘密,找到數(shù)據(jù)規(guī)律并挖掘出所隱含的自然或社會規(guī)律。數(shù)據(jù)是科學研究的基礎,即使在小數(shù)據(jù)時代,科研工作者也是從數(shù)據(jù)中尋找規(guī)律。但是,小數(shù)據(jù)時代的數(shù)據(jù)與物理對象的距離更近,數(shù)據(jù)及其對象不可分離,而大數(shù)據(jù)時代,數(shù)據(jù)及其對象相互分離,獨自形成了自己的世界。在大數(shù)據(jù)時代,“人們事實上并不用望遠鏡來看東西了,取而代之的是通過把數(shù)據(jù)傳遞到數(shù)據(jù)中心的大規(guī)模復雜儀器來‘看’,直到那時他們才開始研究在他們電腦上的信息”[2]xi。
其次,科學發(fā)現(xiàn)的工具發(fā)生了變化,數(shù)據(jù)挖掘成了科學發(fā)現(xiàn)的主要工具。
原來的科學發(fā)現(xiàn)需要科學工作者從最原始的準備工作開始,需要許多專業(yè)的裝備,而且這些昂貴的裝備往往很難共享,占有裝備的往往獨享裝備和數(shù)據(jù)。傳統(tǒng)的獨占式科研方式迫使科學工作者到處建設自己的實驗室,各部門都購置設備,重復建設多,人員和資金浪費嚴重。在大數(shù)據(jù)時代,數(shù)據(jù)采集、存儲、傳輸和處理都成為相互獨立的工作,特別是數(shù)據(jù)可以實現(xiàn)遠程共享,只要具備數(shù)據(jù)挖掘的能力就能夠從事科學發(fā)現(xiàn)的工作。因此,大部分科學工作者不再需要昂貴的裝備,只要具備數(shù)據(jù)挖掘工具和能力?!霸?1世紀,人們通過各種新工具不間斷地采集著海量的科學數(shù)據(jù),也通過計算機模型產(chǎn)生著大量的信息,其中大部分已經(jīng)長期存儲在各種在線的、可以公共獲取的、得到有效管理的系統(tǒng)上,可以支持持續(xù)的分析,這些分析將引發(fā)許許多多新理論的發(fā)現(xiàn)?!盵2]iv“數(shù)里淘金”是大數(shù)據(jù)時代科學工作者最重要的工作,科學工作者幾乎都變成了數(shù)據(jù)挖掘者。大數(shù)據(jù)為科學研究帶來了重大的機遇,“基于對大數(shù)據(jù)的分析,我們能更好地理解世界,解決以前認為難于解決的或甚至認為不可能解決的很多科學問題,產(chǎn)生意料之外的科學發(fā)現(xiàn)”[7]1。
光明日報社概況 | 關于光明網(wǎng) | 報網(wǎng)動態(tài) | 聯(lián)系我們 | 法律聲明 | 光明網(wǎng)郵箱 | 網(wǎng)站地圖
光明網(wǎng)版權所有