傳統(tǒng)的經(jīng)驗(yàn)范式與理論范式所針對(duì)的科學(xué)研究對(duì)象都相對(duì)簡(jiǎn)單,因?yàn)閮H僅憑著個(gè)人的經(jīng)驗(yàn)、觀察或?qū)嶒?yàn),所取得的數(shù)據(jù)是有限的,有限的數(shù)據(jù)能夠刻畫(huà)的對(duì)象也是有限的。好在當(dāng)時(shí)的科學(xué),其所研究的都屬于線性、孤立、靜止的現(xiàn)象,因此少量的數(shù)據(jù)能夠刻畫(huà)出研究對(duì)象的特性和規(guī)律。而對(duì)理論范式來(lái)說(shuō),僅僅憑借人類思想的力量,很難超越當(dāng)時(shí)人們的思想高度,所以理論范式也主要是針對(duì)簡(jiǎn)單現(xiàn)象及其規(guī)律。隨著科學(xué)研究的深入,人類所接觸的現(xiàn)象越來(lái)越復(fù)雜,特別是人們希望將研究對(duì)象置于真實(shí)世界之中,而不再對(duì)研究對(duì)象做線性、孤立和靜止的理想化處理,于是傳統(tǒng)的經(jīng)驗(yàn)范式和理論范式就難于對(duì)付復(fù)雜的科研對(duì)象。這些研究真實(shí)世界的復(fù)雜現(xiàn)象的科學(xué)被稱為復(fù)雜性科學(xué),而過(guò)去做了理想化處理的科學(xué)如今被統(tǒng)稱為簡(jiǎn)單性科學(xué)。為了處理真實(shí)世界的復(fù)雜現(xiàn)象,人們就開(kāi)始利用計(jì)算機(jī)的強(qiáng)大功能,通過(guò)建立科學(xué)模型來(lái)模擬真實(shí)世界的復(fù)雜現(xiàn)象。通過(guò)計(jì)算機(jī)的模擬和計(jì)算來(lái)模擬復(fù)雜研究對(duì)象,并通過(guò)計(jì)算來(lái)發(fā)現(xiàn)規(guī)律的這種知識(shí)發(fā)現(xiàn)新方法就是格雷所說(shuō)的第三種科研范式,即計(jì)算范式。這種范式是最近數(shù)十年隨著計(jì)算機(jī)的出現(xiàn)而興起的。
二、數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)的興起
近年來(lái),隨著智能感知技術(shù)、計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)、云計(jì)算等技術(shù)的發(fā)展,數(shù)據(jù)的采集、傳輸、存儲(chǔ)和處理等環(huán)節(jié)都發(fā)生了重大變化。智能芯片越來(lái)越微小、價(jià)格越來(lái)越低廉而功能則越來(lái)越強(qiáng)大,于是智能芯片被廣泛應(yīng)用于各個(gè)領(lǐng)域,而智能芯片可以自動(dòng)采集和記錄信息,并且可以將信息自動(dòng)以數(shù)字化的方式存儲(chǔ)和傳輸,于是產(chǎn)生了大量數(shù)據(jù)。特別是智能手機(jī)、智能可穿戴設(shè)備、物聯(lián)網(wǎng)以及社交網(wǎng),隨時(shí)隨地都可以產(chǎn)生無(wú)數(shù)的數(shù)據(jù)。如今各種觀測(cè)、實(shí)驗(yàn)設(shè)備(例如天文望遠(yuǎn)鏡、粒子加速器、環(huán)境監(jiān)測(cè)系統(tǒng))都裝備了智能系統(tǒng),實(shí)現(xiàn)了數(shù)據(jù)的智能采集和管理。人們?yōu)g覽網(wǎng)頁(yè)、網(wǎng)上購(gòu)物、視頻音頻播放等一切網(wǎng)上行為也都被自動(dòng)記錄下來(lái),成為人類的行為數(shù)據(jù)。總之,隨著智能技術(shù)和網(wǎng)絡(luò)技術(shù)的發(fā)展,數(shù)據(jù)規(guī)模發(fā)生了爆炸性的增長(zhǎng),人類迅速進(jìn)入了大數(shù)據(jù)時(shí)代。大數(shù)據(jù)時(shí)代的來(lái)臨帶來(lái)了科研方式的巨大變化,帶來(lái)了科學(xué)發(fā)現(xiàn)的新方式,這就是格雷最先提出的數(shù)據(jù)密集型科研范式,即第四科研范式。[7]4-6
大數(shù)據(jù)時(shí)代的來(lái)臨,對(duì)科學(xué)研究帶來(lái)的最大變化是數(shù)據(jù)規(guī)模及其采集方式的不同,并且由此帶來(lái)了數(shù)據(jù)性質(zhì)的變化。過(guò)去所說(shuō)的數(shù)據(jù),是一種狹義的數(shù)據(jù),它是由“數(shù)”和“據(jù)”兩部分構(gòu)成,“數(shù)”就是數(shù)字,而“據(jù)”就是根據(jù),簡(jiǎn)單來(lái)說(shuō)就是表達(dá)具體對(duì)象的數(shù)字,或者說(shuō)具有度量單位的數(shù)字。這種狹義的數(shù)據(jù)主要由我們通過(guò)設(shè)計(jì)觀察儀器,或者通過(guò)理想化的控制實(shí)驗(yàn),來(lái)獲取測(cè)量數(shù)據(jù)。大數(shù)據(jù)時(shí)代的數(shù)據(jù)是一種廣義的數(shù)據(jù),不管它是數(shù)字,還是文字、視頻、音頻、圖片等等,任何信息都可以被看作是數(shù)據(jù)。這樣,我們就大大地拓展了數(shù)據(jù)的來(lái)源和類型。從來(lái)源來(lái)說(shuō),以往的數(shù)據(jù)都是人們主動(dòng)觀測(cè)的結(jié)果,而現(xiàn)在的數(shù)據(jù)主要是智能終端自動(dòng)生成的結(jié)果。除了初始的智能終端是由人研制、安裝外,隨后的數(shù)據(jù)基本上都是由智能終端自動(dòng)記錄、采集而產(chǎn)生的,不再有人的參與。特別是大數(shù)據(jù)時(shí)代的許多數(shù)據(jù)是事物或人類活動(dòng)的軌跡記錄,是人或物的物理軌跡背后的一條數(shù)據(jù)軌跡,有時(shí)也被稱為“數(shù)據(jù)垃圾”或“數(shù)據(jù)塵埃”。用大數(shù)據(jù)的眼光來(lái)看,萬(wàn)事萬(wàn)物都是數(shù)據(jù),即萬(wàn)物皆數(shù)據(jù),“萬(wàn)物皆比特”。[8]由于數(shù)據(jù)類型多樣,數(shù)據(jù)來(lái)源廣泛,因此數(shù)據(jù)規(guī)模急劇增長(zhǎng),大數(shù)據(jù)時(shí)代因此迅速來(lái)臨,并由此也給我們的科學(xué)研究帶來(lái)了極其豐富的數(shù)據(jù)資源。
光明日?qǐng)?bào)社概況 | 關(guān)于光明網(wǎng) | 報(bào)網(wǎng)動(dòng)態(tài) | 聯(lián)系我們 | 法律聲明 | 光明網(wǎng)郵箱 | 網(wǎng)站地圖
光明網(wǎng)版權(quán)所有