精品无码一区二区三区在线,亚洲女优不卡啊啊,国产精品福利网红五月天,无语写真在线

English

  “大數據”已成為時下最火熱的IT行業的詞匯,通過大數據,警察可以預測犯罪,商家可以分析消費者行為。而現在,大數據和世界杯發生了聯系。史蒂芬?霍金教授經過科學公式計算,認為英格蘭隊需要在世界杯上采用4-3-3陣型,穿紅色球衣,才能最大限度提高奪得世界杯的概率。霍金的公式并非憑空想象,他是將世界杯以往的比賽作為數據,進行了各方面因素的統計與分析,包括溫度、海拔、球衣顏色、行程以及距離甚至裁判等,推算出了世界杯奪冠的最理想條件。

  大數據將帶來越來越多的應用,大數據究竟為何物?未來它將如何影響社會發展?對此,光明網記者采訪了中國傳媒大學調查統計研究所副所長、新聞學院教授沈浩,以下為文字實錄。

?

  大數據時代到來,創新和變革遠不止目前所見的冰山一角

?

  今天確實是大數據時代了,人們能夠感知到大數據對社會的影響。我曾經寫過一篇文章《大數據時代來了以后,社會科學研究的春天到了》,這個題目就是用來形容大數據與社會的關系。

  到底什么是大數據,不同的人有不同的理解。最典型的是從大數據的4個角度Volume(大量)、Velocity(高速)、Variety(多樣)、veracity(真實性)來闡述大數據。對于大數據,學界或業界是否有統一定義并不重要,重要的是大數據來了以后,我們已經看到越來越多的數據存儲,是數據化而不是數字化。

  首先是人的行為、活動產生了越來越多的數據,被記錄下來。其次是我們的存儲成本越來越低,數據量爆炸性的增長,甚至有人說目前人類社會90%的數據是近2年生成的。

  我對大數據的理解,它主要包括4個領域,分別是數據科學、網絡科學、空間地理科學和可視化技術。大數據這個概念沒有流行前,我們就面臨著海量數據的處理問題,所以在一定程度上大數據概念落地就是早年的數據挖掘(data mining),是指從海量數據中發現知識的過程。數據挖掘(Data Mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。

  為什么現在那么多人在談論大數據呢?說明它很時髦,是社會潮流。我們目前看到只是冰山一角,當它露出來的時候,最先看到的是社會觀察家和人文學者,現在我們更關心的是那一角的下邊到底是什么。

?

  利用大數據可以追蹤本?拉登? 用數據挖掘人背后的社會關系

?

  大數據首先涉及到數據挖掘,深度學習、百度大腦等使得數據產生革命性的變化。一些流行詞也伴隨著這個過程產生,比如說“云計算”、“內存計算”,它們既和IT有關,也和數據挖掘、分析有聯系。當把所有的數據聚集在一起的時候,或許我們會發現很多事先不知道的東西,這就是大數據的特點,可以挖掘個人,分析個人。

  有人說微博就是大數據,它的確具有大數據的特點,也是最容易被看到的。我們所看到的數據以及數據后邊的人,都是大數據,例如從一個人的微博就能看出他(她)的社會關系,并能記錄個人的行為。有人說大數據可以追蹤恐怖分子,只要本?拉登打電話、發郵件,通過數據就會追蹤到他,這也并不算是夸大其詞,是有可能的。

  另外一個方面是,大數據可以幫助我們關注群體,比如說捕捉到某個城市所有發twitter的人用的語言,就可以看到這個城市人們群居的分布。講中文的人住在哪,講英語的人分布在哪些區域,我們可以從數據感知到全貌。

?

  霍金預測世界杯奪冠并非不靠譜 大數據具有預測力  

?

  霍金對于世界杯奪冠的預測是不是真的大數據應用,這是值得商榷的,但他的分析思想偏向于大數據是肯定的。霍金收集了大量的數據,包括歷史記錄、溫度、球場的海拔高度等,把所有數據都集中起來,分析你事先不知道的事情,或許能發現一些規律。它的原理不是傳統的分析,更多的是基于關系的一種預測,大數據具有一種預測力。

  社會情緒也是重要的數據。世界杯預測可以通過收集人們在社交媒體中的談論話題來感知社會的變化,從而預測結果。這種預測可以歸類到“機器學習”之中,就是計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能。具體的模型則不盡相同。同樣,預測健康、預測流行病等都是這樣的原理。。

  像一些網站推出的高考預測、景點預測都是基于大數據的分析。這些網站有大量的數據,有大量的可供分析的因素,通過機器學習的辦法和大量數據的訓練,去尋找到隱藏在數據中的模式、趨勢,從而使得它的結論就有可能具有預見性。

?

  美國把大數據當成國家戰略 未來將影響到整個社會管理

?

  大數據的這個詞最早來自于美國,美國把大數據當成國家戰略。也有人把大數據當成社會資源,作為社會生產要素。美國大數據戰略主要是2點,第一個是能夠從數據中發現更多的知識和價值來支持企業和政府管理;第二是Opendata(開放數據),讓公眾能夠獲取到想要的數據,這也是最核心的。

  大數據影響了社會。過去做研究,研究的是自然人,叫“一方水土養一方人”,有很強的區域性。到了大數據時代,更多的是研究社會人,就是人的關系,這在過去是記錄不下來的。

  大數據對媒體和新聞傳播產生重要影響。大數據與新聞傳播的結合誕生了“數據新聞”這一種從數據中發現事實的最新的報道形式,中國傳媒大學因此第一個開設了“數據新聞報道實驗班”。

  在微博上,所有人的人際關系都呈被現出來,并且被數據化記錄下來。科技改變生活,將來的物聯網、車聯網、可穿戴設備,這些東西都會產生數據。你只要下載一個App,就會要你的位置,人的行為模式被記錄下來。

  這種數據顯然對商業最有價值,所以目前大數據首先應用在商業上,雖然它的理論體系還沒有建構完善。很多的精準營銷、精細化營銷和各種有針對性的推薦都來源于大數據的分析。數據越來越透明,將來“房姐”不會出現,因為一旦犯錯可以追溯到你過去所有的歷史。這些都是大數據可能帶來的影響。

  未來大數據的影響會更普遍,會影響到整個社會管理,所以有打造“智慧城市”、“智慧政府”的說法。

?

  有底線地開放數據是優化大數據服務的前提

?

  政府是最主要的大數據源,在國外很多的數據是開放的,而在國內數據很少開放,我們想做很多分析卻不能做。所以政府應該更好地開放數據,而且這些數據要能夠被計算機讀取。有些國家就做的很好,甚至公布每一個報警電話,每一個刑事案件發生的地理坐標。經過一定的去安全性處理以后,可以被公眾獲取,從而去支持科學研究和商業活動。

  互聯網是今天產生大數據的主要來源,這些數據應該開放并且提供給科學研究。前段時間,twitter公布將會把所有數據向科學研究開放,而我們微博的數據公開卻越來越收緊。

  數據越來越公開,隱私就是一個相對讓渡的過程。具體什么是隱私,每個人的看法不同,有的人什么東西都不希望讓別人知道。但我認為,開放的數據要有開放的技術和手段,包括對隱私的保護,去除敏感的數據等等。對于隱私,政府首先要制定最基本的規則,應有個底線。

  相對來說,大部分的人的隱私還是需要讓渡出來,這樣才能為人們提供更好的大數據服務。至于具體做法,首先就要開放數據,并在隱私方面做到有底線的保證。其次要強化數據的融合,不僅是互聯網的數據,其他來源的數據也要整合在一起。最后,要建立更好的數據中心,進一步強化數據管理,讓數據更好地服務于各項社會活動。

?

  (光明網記者 李爽采訪)

責任編輯:鄧志鳳

往期回顧

欄目簡介

1961年,鄧拓在《北京晚報》的《燕山夜話》專欄陸續發表雜文,這些雜文敢于正視現實,大膽評論各種不正之風, 并融思想性、知識性、趣味性于一爐,發人深省。光明網現推出《新燕山夜話》專欄,承繼《燕山夜話》的品格和精神,聚焦當前社會發展、社會主義核心體系建設中的熱門話題,邀請各領域、各行業的中青年知識分子,以有聲評論的方式進行深入解讀。

如果您對當今社會發展中的熱點問題有深入的思考和獨特的見解,或者在生活、工作中積累了一定的智慧和經驗,并 愿意與網友分享,歡迎將您的個人簡介及聯系方式發送至郵箱xysyh@gmw.cn,我們將及時回復您的來信。

欄目策劃:光明網理論部

?

手機光明網

光明網版權所有

光明日報社概況 | 關于光明網 | 報網動態 | 聯系我們 | 法律聲明 | 光明網郵箱 | 網站地圖

光明網版權所有