精品无码一区二区三区在线,亚洲女优不卡啊啊,国产精品福利网红五月天,无语写真在线

English
?

數據密集型科學發現及其哲學問題

2016-06-20 09:24 來源:《自然辯證法研究》  我有話說
2016-06-20 09:24:47來源:《自然辯證法研究》作者:責任編輯:李萍

  2.挖掘滲透理論

  “觀察滲透理論”是美國科學哲學家漢森提出的著名理論,說的是任何科學觀察都不是純粹的觀察,而是滲透了觀察者的理論預設。[13]波普爾更是用漢森的這個理論來反對邏輯經驗主義“科學始于觀察”的觀點,認為既然觀察已被理論污染,那么觀察就沒有了價值中立性,因此它也就不可能成為科學發現的邏輯起點。[14]

  小數據時代的數據都是在觀察或實驗者精心設計下取得的數據,因此滲透了觀察者或實驗者的理論預設。但在大數據時代,海量的數據大部分都是智能終端、傳感器、物聯網等智能設備或上網瀏覽時無意留下來的副產品,在數據使用前往往并不知道這些數據有什么用途的“數據垃圾”。這就是說,大數據時代的數據大部分沒有被數據生產者污染,因而比較客觀、真實,因此“觀察滲透理論”在數據實在中有可能失去效力,這就是說,數據未必滲透了理論,或者說,原始數據也許并沒有被理論污染。

  在數據密集型科學發現中,數據挖掘工具成了科學發現的重要技術手段。雖然被挖掘的原始海量數據一般比較客觀真實,但是,挖掘工具和數據庫的選擇卻反映了數據挖掘者的偏好。不同的挖掘工具和不同的數據庫,所挖掘出來有價值的數據就可能不同,這就像江河湖海里的魚并沒有反映漁民的主觀性,但漁民使用的漁網以及下網區域的選擇卻反映了漁民的主觀意志,漁網和區域的不同,魚的品種和大小自然也就可能不同。這就是說原始數據是客觀的,但數據挖掘卻滲透了挖掘者的主觀意識,因此,在大數據時代,科學發現被理論污染的階段有所不同。在小數據時代,原始數據就已經滲透了理論;而在大數據時代,原始數據未被污染,但在數據挖掘過程中滲透了理論,因此我們可以說“(數據)挖掘滲透理論”,即數據挖掘的過程有可能被挖掘者或者說理論污染。

  3.科學發現的數據檢驗

  科學檢驗是科學知識生產的重要環節,科學發現只有最終經過檢驗之后才能成為知識,而可重復性是科學性的重要保證。傳統的科學哲學主要是論述科學知識最后成品的觀測或實驗檢驗,對生產過程中的中間環節缺少必要的審核。在小數據時代,由于版面的限制,科學論文發表之時,大部分初始數據都留在作者手中,公開發表的只是其中極少的一部分,甚至是最終的結論部分。這樣,除了極少部分同行在重大疑問面前會重復作者所做的觀測或實驗外,其他大部分人只能姑且相信,甚至不斷被引用而導致以訛傳訛。

  在大數據時代,科學觀測或實驗數據可以使用可視化技術將難讀或難懂的數據進行可視化處理,讓讀者更加清晰明了,而且更容易檢驗。作者發表文章之時,可以像標識參考文獻一樣,同時標明自己所使用的數據庫系統,或者將所使用的數據置于網絡,讓其他人可以下載、查詢和檢驗。“我們很快會進入這樣的時代:數據會像紙本文獻一樣被長期保存,而且能夠通過數據云被人和計算機公開獲取。”[2]iv這樣,“在閱讀某人的一篇論文時查看他們的原始數據,甚至可以重做他們的分析;或者可以在查看某些數據時查出所有關于這一數據的文獻”[2]xviii。

  大數據時代的來臨讓可重復性賦予了新的內涵,大數據留下了發現者發現過程的數據軌跡,我們可以循著其軌跡進行科學檢驗。我們不一定要耗時費力地重復觀測或實驗就可以查詢發現者的原始科學記錄。[15]因此,在大數據時代,“科學記錄應該提供足夠的數據,其中包含足夠的方法信息和操作信息,使得另一位科學家從同樣的數據開始就能夠重復同樣的結果,而且能夠通過新的研究,把初始的研究結果放到更好的情況中,調整假設和分析方法,看看這些變化導致什么新的結果”[2]183。大數據讓我們在不重復觀測或實驗的情況下,可以檢驗發現者的發現過程以及發現結果的可靠性。“在新的世界里,科學家們正在協同工作,期刊正變成包含數據和其他實驗細節的網站。”[2]xxii因此,大數據時代的科學檢驗有可能變得更加便捷、可行。

[責任編輯:李萍]

[值班總編推薦] 高溫津貼關乎底層權利伸張

[值班總編推薦] 還會有多少古城繼續被淹?

[值班總編推薦] 冤冤相報何時了

?

手機光明網

光明網版權所有

光明日報社概況 | 關于光明網 | 報網動態 | 聯系我們 | 法律聲明 | 光明網郵箱 | 網站地圖

光明網版權所有