- 相關推薦
維克托邁爾舍恩伯格《大數據時代》讀后感范文(精選14篇)
當仔細品讀一部作品后,大家一定都收獲不少,是時候寫一篇讀后感好好記錄一下了。千萬不能認為讀后感隨便應付就可以,以下是小編幫大家整理的維克托邁爾舍恩伯格《大數據時代》讀后感范文,僅供參考,希望能夠幫助到大家。
維克托邁爾舍恩伯格《大數據時代》讀后感 1
對于暢銷書刊、熱點話題、時尚科技,始終不太感興趣。書刊,喜歡有一定年份的。話題,鐘情于務虛的觀點。新奇的產品于我無緣,習慣使用成熟的科技產品。既不清高,也非冷漠,就是要與現實保持一定的距離,給自己留一點思考的空間。這一習慣最近破了例。由于工作的原因,耳濡目染,“大數據”這個新興概念開始頻繁步入我的視野。按捺不住內心的好奇,網購《大數據時代》,手不釋卷,三天讀完,頗有收獲,此書有如下特點。
首先,作者站在理論的制高點上,條理清楚地闡述了大數據對人類的工作、生活、思維帶來的革新,大數據時代的三種典型的商業模式,以及大數據時代對于個人隱私保護、公共安全提出的挑戰。其次,文中的事例貼近現實生活,貼近時代,令讀者既印象深刻,又感同身受。此外,作者沒有使用大量的專業術語,沒有假裝一副專業的面孔?v觀全書,遣詞造句,均通俗易懂。
作者認為大數據時代具有三個顯著特點。
一、人們研究與分析某個現象時,將使用全部數據而非抽樣數據。
二、在大數據時代,不能一味地追求數據的精確性,而要適應數據的多樣性、豐富性、甚至要接受錯誤的數據。
三、了解數據之間的`相關性,勝于對因果關系的探索!笆鞘裁础北取盀槭裁础敝匾。
作者指出,隨著技術的發展,數據的存儲與處理成本顯著降低,人們現在有能力從支離破碎的、看似毫不相干的數據礦渣中抽煉出真知爍見。在大數據時代,三類公司將成為時代的寵兒。一是擁有大數據的公司與組織。如政府、銀行、電信公司、全球性互聯網公司(阿里巴巴、淘寶網)。二是擁有數據分析與處理技術的專業公司,如亞馬遜、谷歌。三是擁有創新思維的公司,他們可能既不掌握大數據,也沒有專業技術,但卻擅長使用大數據,從大數據中找到自己的理想天地。
面對即將來臨的大數據時代,個人將如何應對自如?這是個嚴肅的問題。
維克托邁爾舍恩伯格《大數據時代》讀后感 2
如今說起新媒體和互聯網,必提大數據,似乎不這樣說就OUT了。而且人云亦云的居多,不少談論者甚至還沒有認真讀過這方面的經典著作——舍恩佰格的《大數據時代》。維克托·邁爾舍恩伯格何許人也?他現任牛津大學網絡學院互聯網研究所治理與監管專業教授,曾任哈佛大學肯尼迪學院信息監管科研項目負責人。
他的咨詢客戶包括微軟、惠普和IBM等全球企業,他是歐盟互聯網官方政策背后真正的制定者和參與者,他還先后擔任多國政府高層的智囊。這位被譽為:大數據時代的預言家“的牛津教授真牛!那么,這位大師說的都是金科玉律嗎?并不一定,讀大師的作品一定要做些功課才好讀懂,才能能與之進行一場思想上的對話。
舍恩伯格分三部分來討論大數據,即思維變革、商業變革和管理變革。在第一部分”大數據時代的思維變革“中,舍恩伯格旗幟鮮明的亮出他的三個觀點:
一、更多:不是隨機樣本,而是全體數據。
二、更雜:不是精確性,而是混雜性。
三、更好:不是因果關系,而是相關關系。
對于第一個觀點,我不敢茍同。
一方面是對全體數據進行處理,在技術和設備上有相當高的難度。另一方面是不是都有此必要,對于簡單事實進行判斷的數據分析難道也要采集全體數據嗎?
我曾與香港城市大學的祝建華教授討論過。祝教授是傳播學研究方法和數據分析的專家,他認為一定可以找到一種數理統計方法來進行分析,并不一定需要全部數據。聯系到舍恩伯格第二個觀點中所說的相關關系,我理解他說的全體數據不是指數量而是指范圍,即大數據的.隨機樣本不限于目標數據,還包括目標以外的所有數據。我認為大數據分析不能排除隨機抽樣,只是抽樣的方法和范圍要加以拓展。
我同意舍恩伯格的第二觀點,我認為這是對他第一個觀點很好的補充,這也是對精準傳播和精準營銷的一種反思!贝髷祿暮唵嗡惴ū刃祿膹碗s算法更有效!案哂泻暧^視野和東方哲學思維。對于舍恩伯格的第三個觀點,我也不能完全贊同!辈皇且蚬P系,而是相關關系!安恍枰馈睘槭裁础,只需要知道”是什么“。傳播即數據,數據即關系。在小數據時代人們只關心因果關系,對相關關系認識不足,大數據時代相關關系舉足輕重,如何強調都不為過,但不應該完全排斥它。大數據從何而來?為何而用?如果我們完全忽略因果關系,不知道大數據產生的前因后果,也就消解了大數據的人文價值。如今不少學者為了闡述和傳播其觀點往往語出驚人,對舊有觀念進行徹底的否定。
維克托邁爾舍恩伯格《大數據時代》讀后感 3
讀完《大數據時代》這本書后,我意識到:我們即將或正在迎接由書面到電子的跳躍之后的又一重大變革。
這本書介紹了大數據時代來臨后,接踵而至的三項變革——商業變革、管理變革和思維變革。
其實,這場變革已經打響。商業領域由于大數據時代的到來而推陳出新。前幾年,一家名為Farecast的公司,讓預訂到更優惠的機票價格不再是夢想。公司利用航班售票的數據來預測未來機票價格的走勢,F在,使用這種工具的乘客,平均每張機票可以省大約50美元,這就是大數據給人們帶來的便利。
大家應該都知道2009年出現的H1N1型流感,就拿美國為例,疾控中心每周只進行一次數據統計,而病人一般都是難以忍受病痛的折磨才會去醫院就診,因此也導致了信息的滯后。然而,對于飛速傳播的疾病,Google公司卻能及時地作出判斷,確定流感爆發的'地點,這便是基于龐大的數據資源,可見大數據時代對公共衛生也產生了重大的影響!
在我看來,如果想在在大數據時代里暢游,不僅要學會分析,而且還要能夠大膽地決斷。
在美國,每到七、八月份時,正是臺風肆虐之時,防澇用品也擺上了商品貨架。沃爾瑪公司注意到,每到這時,一種蛋撻的銷售量較其他月份明顯增加。于是,商家作了大膽的推測,出現這樣的結果源于兩種物品的相關性,便將這種蛋撻擺在了防澇用品的旁邊。這樣的舉措大大增加了利潤,這就是屬于世界頭號零售商的大數據頭腦!
大數據時代的到來,可以讓我們的生活更加便利。但是,如果讓大數據主宰一切,也存在一定的風險。
大家應該都知道電子地圖,它可以為人們指引方向。但大家應該還不知道,它會默默地積累人們的行程數據,通過智能分析可以推斷出哪里是自己的家,哪里是工作單位。我們的隱私就這樣被不為人知地收集著。
大數據時代的到來,讓我們的生活更安全,更方便,但與此同時,我們的隱私不再是隱私,數據的收集變得無所不包、無孔不入。世界已經向大數據時代邁進了一小步,一個嶄新的時代正向我們走來。讓我們用知識武裝大腦,做好準備,迎接新時代的到來!
維克托邁爾舍恩伯格《大數據時代》讀后感 4
去年的“云計算”炒得熱火朝天的,今年的“大數據”又突襲而來,讀大數據時代有感。仿佛一夜間,各廠商都紛紛改旗換幟,推起“大數據”來了。于是乎,各企業的CIO也將熱度紛紛轉向關注“大數據”來了。有一張來自《程序員》微博的漫畫很形象。我覺得這張圖,很真實地反映了現實中小企業云計算,大數據的現狀。
不過話又還得說回來,《大數據時代》是本好書。
當然,很多IT知名人士也大力推薦,寫了好多讀后感來表述對這本書的喜歡沒看此書之前,對所謂大數據的概念基本上是一頭霧水,雖則有了解關注過現在也比較火熱的BI,覺得也差不多,可能就是更多的數據,更細致的數據分析與數據挖掘?催^此書后,感覺到之前的想法,只能算是中了一小半吧---巨量的數據,而另一前:著眼于數據關聯性,而非數據精確性,或許才是大數據與現時BI最大的不同,不僅僅是方法,更多的時思想方法。不過坦白講,到底是數據的關聯性重佳,還是數據的精確性更好,還真的需要時間來檢驗一下,至少從現在的數據分析方法來論,更多的傾向于數據的精確性?赐甏藭倚闹械囊恍﹩栴}:
1.什么是大數據
查了查百度百科,是這樣定義的:大數據(bigdata),或稱巨量資料,指的是所涉及的資料量規模巨大到無法透過目前主流軟件工具,在合理時間內達到擷娶管理、處理、并整理成為幫助企業經營決策更積極目的的資訊。大數據的4V特點:Volume、Velocity、Variety、Veracity--這個好像是IBM的定義吧,讀后感《讀大數據時代有感》。
以個人的觀點來看:數據海量,存儲海量都是大數據的基本原型吧。
2.大數據適合什么樣的企業
誠然,大數據的前提是海量的數據,只有擁有巨量的數據資源,方能從中查找出數據的關聯性,才可以讓通過
專業化的處理,讓其為企業產生價值。針對電信運營,互聯網應用這樣海量用戶的數據的大企業,也是在應用大數據的道路上擁有得天獨厚的條件,但是針對中小企業呢?銷售訂單數據?若非百年老店,估計數據也是少得可憐,5,能用的可能只有消費者數據了吧。貌似大多數廠商,用來舉例的也就是消費都購買行為分析為最多。同樣,在公共事業類的政府機構,大數據的作用也許也能很好的發揮。反而感覺在大多數中小型企業應用大數據,似乎有點大題小作。書中說:大數據是企業競爭力。誠然,數據是一個企業的.核心無形資源(利用得好的話),但是否所有的數據,或都換則方式說:所有的企業都以大數據為競爭力,是否真的合適么?是否在中小企業中,會顯示得小題大做呢?
3.大數據帶來的影響
當一波又一波的IT技術熱潮源源不斷地向我們鋪面而來的時候,你甚至都沒有做好準備,你都要開始迎接它所給你帶來的影響了。經過物聯網,云計算的推波助瀾下,大數據開始登場了。但它到底給我們帶來了什么呢?
1)預測未來書中以Google成功預測了未來可能發生流感的案例來開篇,表明通過大數據的應用,可以為我們的生活起一個保駕護航的指向標。實質很簡單,技術改變世界。
2)變革商業大數據所帶來的商機,同時會衍生出一系列與大數據相關的商業機遇與商業模式,數據的潛在價值會源源不斷地發揮作用可以容易想到的是未來有專門的數據收集,數據分析,數據生成的一條數據產業鏈產生。影響最大的,當然是IT公司
3)變革思維書中所說:因為有海量的數據作基礎,未來,我們可能更關注數據的相關,而非精細度。對這條,本人還是持保留意見的。
維克托邁爾舍恩伯格《大數據時代》讀后感 5
這么多年來,看了很多東西,如今回過頭來發現,好像什么都忘了,真是悲劇,所謂讀書破萬卷,下筆如有神或許是不對的,還是需要下筆勤快,所以決定從這里開始。
這些年對于技術的發展,我是沒有跟上,如今發現即便是對于投資,技術對于我們生活的改變太大,而自己身在這個技術浪潮的前沿,還是需要跟上步伐!把
大數據這個概念已經提了很久,我也一直疏忽了對于它的理解。看完《大數據時代》,再結合如果工作上對于大數據的理解,頓時發現數據的重要性,以前在這方面的確沒有足夠的思想意識。
整本書來說,我覺得最關鍵的三個點是前面幾個章節:
1、要總體,不要隨機樣本:從小對于統計學相關的學習,基本都是從樣本出發,理論的基礎在于如何隨機的足夠分散的選取樣本,這可是技術活加直覺。而對于大數據來說,要的就是總體,本質上來說,總體樣本的確更能準確找到結果。但是對于統計來說,總體的分析增加了數據分析的難度,不僅數據核對不好進行,一旦出現數據污染,準確度就會大打折扣,而且進行數據回溯的時候,也無法準確確認問題,而這一點也是后面相關性上問題;
2、要混亂,而不是精確:這里主要想說明的是希望數據的多樣性,盡量將相關數據都收集起來,不管是結構化的還是非結構化的。這樣就不可避免的最終結果的不準確性。大數據更多的是從一個總體數據中說明以后概率事件,既然是概率,也就可以理解無法精確。這里有個點的說明,我覺得需要提一下,大數據算法更傾向于“簡單”,而不是復雜,這個倒是出乎我的意外。
3、要相關性,而不是因果:從我對于知識獲取的過程來說,我是不同意這個觀點,從人體對于知識的理解,還是要從因果論出發,沒有因果論,就會變成瞎子。而作者的觀點上來說,原因可能還是從大數據本身的非準確性,一旦找到合適的算法,找到相關性,向上追述原因本身就很難。但是從舉的示例上看,相關性的確認是一個非常大的工程,基本就是使用排舉法,一個一個試。
所以,對于大數據來說,最重要的.三點是:1、數據——得到更多數據;2、算法——建立更快的算法體系;3、思維——尋找數據間更多的相關性。
對于數據最終的走向,我同意書中所提到的政府管理的觀點,既然都是以“石油”的標準來看待數據,政府統一管理也就是必然的了。而且對于政府來說,掌握更多數據也有利于其管理及維護社會的穩定性。而對于社會道德方面的論述,我不想多說什么,時代發展是不會被道德綁架的。
所以最后,想要建立對于大數據的思維,《大數據時代》還是值得一讀,里面的很多示例也非常不錯。如人際關系這一塊,也是出乎我的意料。
維克托邁爾舍恩伯格《大數據時代》讀后感 6
知道"是什么"就夠了,沒必要知道"為什么"。在大數據時代,我們不必非得知道現象背后的原因,而是讓數據自己"發聲"。這個命題是我讀這本書最大的感觸。
對于大多數人來說,這的確是一場思維變革。對于理科學生來說,會認為這是一個錯誤的觀點,因為這無異于否定了他們對世界客觀物理化學規律探索的重要性;對于一名工科學生,其實這并不是一個多么新穎的觀點,因為工科是講求時用性的,如何能更好地利用基本自然科學規律創造社會財富比探索自然科學知識顯得更重要。
這些天來,在讀大數據這本書的同時,也稍微重溫了一下自動控制原理,認識到控制系統中存在明顯的大數據時代思維方式,借讀書交流會之際,與大家分享。
對系統的有效控制需要對系統理解與建模。以一個日常生活中的例子說明。開車的時候一腳油門下去車就飛出去了,但并不知道這一腳油門下去能給多大車速,這就需要駕駛人員的熟練的駕駛技能了,不然超速被開罰單是很正常的。那么,問題就來了:如何能實現速度的自動控制而不用駕駛人員踩油門?這就是控制系統最關鍵的環節——建立系統數學模型。大白話就是知道車速與燃油量的數學關系式。若是以探索為什么的思維模式,不可避免的要列一大堆能量方程、動量方程等物理化學式子,經過繁雜的計算,還是能得到車速和燃油量的數學關系式的。很明顯這是一個繁瑣的過程,因為得知道現象背后的原因。這僅是對于這種簡單的系統,若是對于航空發動機這種復雜的.系統,結構工藝過于復雜,分析各部分的物理化學過程是十分困難的,這時候可以通過實驗法得到數學模型。
實驗法主要有時域測定法、頻域測定法和統計相關法。與大數據時代思維最接近的是統計相關法,主要過程是對被研究對象施加某種隨機信號,根據被測對象各參數的變化,采用統計相關法確定被測系統或對象的動態特性。這種方法可以在被測系統或生產過程正常運行狀態下進行在線辨識,測試結果精度較高,但要求采集大量測試數據,并需要相關儀和計算機進行數據計算和處理。
若用開車實例來解釋,此時的系統為汽車動力系統,施加的隨機信號為燃油量,被測對象指車轉速,得到的動態特性就是指車速與燃油量函數關系式,從而不用探求背后的物理化學規律就得到了數學模型。
在沈陽黎明航空公司實習時去過試車間,除了發動機點火后震撼的場景動人心魄,控制室屏幕上海量的數據也同樣引人注目,我想這么多數據無非就是驗證數學模型或直接實驗法得到數學模型,結合航空發動機這種復雜的系統,對于搞控制的人來說,得到數學模型就夠了,現象背后的原因交給研發的人來探索更好。
維克托邁爾舍恩伯格《大數據時代》讀后感 7
乍一看題目,最初的想法是數據只不過是人們在日常工作過程中產生的那些數據,而大數據無非就是數據量龐大,在我們日常處理的數據類的基礎上上一個臺階,僅此而已。
我的這個想法無疑是天真的,簡單的就像一個孩童剛剛學會咿呀學語,完全不知道語言的廣博和意義的深刻。讀罷此書,雖說談不上能跟上作者那天馬行空的思想境界,但也簡單地總結一些讀書的心得,以求得一定的學習成果,便于打開自己的眼界,拓展自己的思維方式。
大數據開啟了一次重大的時代轉型。它和望遠鏡、顯微鏡一樣,能客觀上改變我們對世界的認知,并從其他多種角度讓我們了解精彩紛程的世界。在過去十幾二十幾年的時間里,大數據不僅改變著公共衛生、商業,更重要的是正改變著我們的思維,使我們能從全新的思維出發去感知、去洞見未來,這無疑是大數據最有價值所在。
大數據時代的到來,正在改變著我們的思維模式。以下三個部分的應用證據,說明我們正在經歷著這樣的與以往不一樣的變革,這種變革將打破傳統思維的束縛,向著更高更復雜的層面演進。
第一,大數據強調認為,不是隨機樣本,而是全體數據。我們知道,對歷史數據進行研究的初衷,是我們想得出歷史數據之間的運行變化規律,進而能更精確地推測數據未來的走向,以求對未來發展的事項進行能動的控制。那這里所認為的全體數據,到底什么才是全體數據呢?究竟是“我們需要的全體數據”,還是“我們能收集到的全體數據”,亦或是“我們認為的全體數據”,每個人對數據集合的范圍可能存在不同,在某種情況下,個別選定的“全體數據”可能也是局部數據,甚至可能是隨機數據。只是數據的廣度范圍、精細程度可能存在不同而已。因此,大數據選認定的全體數據仍然是一個相對的概念,是相對于傳統的隨機樣本而提出的,但是,其數據量、質都與傳統隨機樣本具有本質區別,這將導致得出與隨機樣本完全不同的結論,F代計算機技術的發展解決了巨大數據運算的各種問題,使我們得出問題的`結論更貼進于事物的本像。
第二,大數據強調認為,不是精確性,而是混雜性。書上講,執迷于精確性是信息缺乏時代和模擬時代的產物。需要加工的數據可能只5%是結構化式的,其他95%部分需要通過加工,或組合、或移動、或裁剪等加工方式,加工成適合我們利用的方向,最終將在加工的數據之上進行分析,得出結論。由此得出待加工的原始數據具有混雜性,而非精確性,以前傳統分析是這樣,現在大數據下更亦如此。另一個層面,指的是加工出來的數據的精確性,這個就需要人為定義了。提出“精確”這個概念,是基于有相對容差數據的,即大數據如何控制或者說評定“輸出品質”。一個東西要出故障,不會是瞬間的,而是慢慢地出問題,通常,我們需要找到問題的幾個關鍵點,進行監控,我們才可能可以預測未來。在這過程之中,設定監控問題越精密,監控的效果越好。如果我們容忍混雜性程度越高,可能效果越不盡理想。
第三,大數據強調認為,不是因果關系,而是相關關系。在大數據時代,知道“是什么”就夠了,沒必要知道“為什么”。我們不必非得知道現象背后的原因,而是要讓數據自己“發聲”。這是區別于以往思維方式的最重要的事項之一,想想過去,言必出,行必果,感覺這個言行必須要因果結果,沒有因,就沒有果,同樣,沒有果,原因也沒有存在的必要和意義。大數據時代拓寬了看待事物的層面,從各個角度去看問題,之前的因果關系被弱化,甚至無關緊要,從相關的角度去度量、預測事物的發展、內源等取向,則會得到無數條通往事物發展方向的道路,勢必將使事物呈現更加立體、更加多源的格局,使我們更清楚地認識事物或現象的本質。那么如何在大數據時代運用相關關系“開發”事物或現象更多層面的發展或內源供人們利用呢?找到關聯物,是運用大數據進行有效預測的關鍵。相關關系的核心是量化兩個數據值之間的數理關系,相關關系強是指當一個數據值增加時,另一個數據值很有可能也會隨之增加,而相關關系弱是指當一個數據值增加時,另一個數據值幾乎不會發生變化。當然,嚴格地講,即使沒有相關性,另一個數據值也可以大幅變化,只是沒有趨勢可循罷了。相關關系是通過識別有用的關聯物來幫助我們分析一個現象,而不是通過揭示內部的動作機制。通過給我們找到一個現象的良好的關聯物,通過計算機的大量運算,相關關系可以幫助我們捕捉現在和預測未來,而且分析數據更加準確、更快,不易受偏見的影響,這點非常重要。因此,建立在相關關系分析法基礎上的預測是大數據的核心。
以上三人方面的“應用證據”在商業變革、管理變革方面普遍運用,百且取得了意想不到的效果,開拓了想象的“藍!、管理更趨多元,手段更加精準和獨到。
但是大數據并不是一個充斥著算法和機器的冰冷世界,人類的作用依然是無法被完全取代的。大數據為我們提供的不是最終答案,只是參考答案,人類在眾多參考答案的基礎上,運用自己對現象的“職業判斷”,得出更靠譜的方法和答案,并在實踐的檢驗下,越趨完善的方法和答案反過來又作為充斥大數據成員的一部分,使大數據構架基礎更加科學并充分展示事物的性質,以方便我們隨時獲取。這是一個沒有終點,循環往復的不斷進化的過程。
維克托邁爾舍恩伯格《大數據時代》讀后感 8
未來的十年,將是大數據引領下的智慧科技時代。不管你是否意識到它的存在,大數據都將越來越快地改變我們這個時代,包括我們的生活方式。
維克托·邁爾-舍恩伯格是最早洞見大數據時代發展趨勢的數據科學家之一。他通過一個大家熟知的事例,來幫助我們理解“大數據”的潛在影響力,那就是四個世紀之前望遠鏡和顯微鏡的發明。望遠鏡能夠讓我們感受宇宙,顯微鏡能夠讓我們觀測微生物,它們都是收集海量數據的新工具,因為這種工具的發明,人們同步更新了分析數據的技術和方法,促進了人們對世界更好的理解。如果說望遠鏡和顯微鏡是測量領域中的一場革命,那么今天的數據測量就相當于是現代版的望遠鏡、顯微鏡。隨著社交網絡的逐漸成熟,移動帶寬迅速提升,云計算、物聯網應用更加豐富,以及更多的傳感設備、移動終端接入到網絡,由此產生的數據及數據的增長速度比歷史上的任何時期都要多、都要快。一個大數據的時代,不經意間順理成章地翩然而至。
一、什么是大數據?
大數據是當前最熱門的話題之一。但什么是大數據,人們尚未給出確切的定義。首先,“大數據”是相對過去小的、局部性的數據而言的;其次,利用大數據進行分析和工作時,所依據的關于此事盡可能完整的數據,從而“一覽眾山小”,而不是采用局部的小數據,從局部推斷整體。
維克托也并未直接給出大數據的定義。不過,他用三大轉變描述了大數據的特性:
轉變之一:在大數據時代,我們可以分析更多的數據,有時候甚至可以處理和某個特別現象相關的所有數據,而不再依賴于隨機采樣。例如一項針對相撲比賽中非法操縱比賽結果的研究對64000場比賽進行了分析,這算不上一個很大的數字,但由于這是過去十年所有的比賽,所以它是大數據。
轉變之二:由于有了更多的數據,我們可以接受更多的混雜、更多數據上的不精確。如果我們對于一個事物只有50個數據點,那么每一個數據點都必須非常精確,因為每個數據點都是有用的;但是如果我們有5000萬個,去掉10個,甚至去掉1000個都沒有太大的問題。
轉變之三:不再探求難以捉摸的因果關系,轉而關注事物的相關關系。分析大數據主要為了預測未來“是什么”,而不是“為什么”。因為很多時候我們以為我們找到了事情背后的原因,實際上卻沒有找到。更多時候知道了“是什么”就足夠了。例如知道流感將會擴散到哪里就足夠了,我不需要知道為什么;知道什么時候在網上購買機票能夠獲得最優惠的價格就足夠了,我不需要知道為什么此時價格最低。
二、大數據帶來的變化
大數據從根本上改變我們認識世界和改變世界的方式。很多傳統的習慣將被顛覆,很多舊的制度將面臨挑戰。舉例來說:
第一,科學探究的思路和方式受到挑戰
探究是新課程改革中的一個熱詞,是促進學校教學與科學研究相融合的實踐舉措?茖W探究的基本路徑是:發現問題,提出假設,制定方案,實踐探究,分析數據,得出結論。之所以會梳理出這樣一個探究的路徑,與我們對問題知曉的信息過少有關。換句話說,對所要研究的事物,我們知道的數據很少,需要從這些很小的數據出發,通過猜想和假設,進行試探性的研究,如果研究得出的結果和自己的假想是一致的,則說明我們的假說是正確的,這些假說會上升為對該事物描述的知識,我們掌握該事物的數據也隨之增加。
利用測量所獲得的點滴數據,從一個局部來推測世界是怎樣的,這是科學探究的基本思路和方式。長期以來,我們總是通過這樣的方式來認識世界,對其有宗教般的信仰。盡管我們知道,決策者總是先有了想法,才會提出假設。如果決策者自身對所研究的事情存在著偏見,所提出的假設就很難得到實證的支持,這往往會導致探究花費了很長的時間、很大的物力和財力,也常常勞而無功。但科學研究者還是堅定不移地沿著這條道路前行,學校在教學中也將其作為科學研究的基本規范來傳授。
在大數據時代,這樣的研究方式收到了極大的挑戰。先舉個事例來說吧。手機輻射是否能夠致癌?關于這個問題,無論我們的假設如何,實驗的設計都很難進行。首先,樣本選擇過少,沒有統計學上的意義;其次,不能拿人做研究對象;第三,短時間的研究很難觀察到變化。有了大數據之后,這樣的難題就可以迎刃而解了。前段時間,丹麥就進行了這樣的研究。丹麥擁有1985年手機推出以來所有手機用戶的數據庫。他們從這個數據庫中分析了1990年至2007年擁有手機的所用用戶的數據,同時,他們還收集了這一期間醫院收集的所有癌癥患者的數據,然后分析手機用戶是否比非手機用戶有更高的癌癥發病率。這兩個數據庫本身是完全獨立的,在作分析之前從來沒有想過可以做這樣的研究。結果表明,使用移動用戶和癌癥風險增加之間不存在任何關系。2011年10月,這一研究的`結果發表在《英國醫學雜志》上。
上述的案例告訴我們,在獲得了大量的數據,能夠對事物的整體進行全面的認識之后,假想就沒有意義了,我們可以直接根據全面的數據做出結論。
第二,傳統的思維習慣受到挑戰
因果關系思維,是人們生活中最為普遍的一種思維方式。既是看上去沒有關系的事情,人們也總是從因果的角度去理解他。比如說,1885年7月6日,巴斯德接診了一個被帶有狂犬病毒的狗咬傷的孩子,他把自己剛研制出來的狂犬疫苗給孩子注射,結果孩子活下來了。巴斯德的這一舉措,使得狂犬疫苗和孩子的生存之間建立起了一個因果關系。但事實上,人被狂犬病狗咬傷后換上狂犬病的概率是只有七分之一,就算沒有狂犬疫苗,這個孩子活下來的幾率還是有85%。
在哲學界,關于因果關系的爭論已經持續了幾個世紀。爭論的焦點在于:如果因果關系是普遍存在的,每一個果都有一個因和他相對應,世界上的所有事情都有因果的話,我們就沒有決定任何事情的自由了。盡管哲學領域的爭論很熱烈,但并不耽誤人們在日常生活中通過因果關系來思考問題。不僅如此,由于掌握的數據過少,人們還容易從線性關系的角度找尋事物之間的因果關系。在物理學中,有一種處理數據的方式之一就是“化曲為直”,設法找到兩個變量之間的線性因果關系,從而進行定量的描述。事實上,由于很多事情之間的關系是很復雜的,簡單的線性處理容易導致人們對事物本質屬性的誤解。
在大數據時代,相關關系比因果關系重要。2009年甲型H1N1流感發生之后,美國的衛生系統極力想從因果關系上來找到流感的源頭,但信息反饋的速度太慢,讓專家們束手無策。谷歌公司做出了快速反應,把5000萬條美國人最頻繁檢索的詞條和美國疾控中心在2003年至2008年間季節性流感傳播時期的數據進行比較,研究特定檢索詞條的頻繁使用與流感在時間和空間上的傳播之間的聯系,很快就確定了流感是從哪個地方傳播出來的。谷歌采取的就是相關關系分析的方法,而不是因果關系分析的方法。這是大數據時代,對數據進行處理的一種典型方法。
第三,數據化比數字化更加重要
數字化是將模擬數據轉化成0和1的二進制碼,以便電腦進行數據處理的過程。過去的很長時間,我們所做的事情,就是對文本進行數字化。很多書籍包括教材,通過PDF等格式,變成了數字形態的資料,存入了電腦或者網路之中。
但是,這些數字化的資料要查詢起來并不方便。首先你要知道所需的資料在那本書中,其次你還要仔細地去翻閱這些數字化的資源,以便找到你所需要的信息。這和到書本里去找沒有本質的區別。
如果這些數字文本能夠被數據化,文本中的字、詞和段落能夠一一被識別,利用搜索殷勤加以檢索就會方便很多。所謂數據化就是將一種現象轉化為可以制表分析的可量化的過程,量化,是數據化的核心。信息只能被數據化,其巨大的潛在價值才有可能被釋放出來。
數字化帶來了數據化,但數字化不能替代數據化。今天,很多學校都在進行“電子書包”的課程教學實踐,但有不少實踐者認為,所為電子書包,就是將紙質的課本和教輔資料數字化,裝入電腦中讓學生上課中使用,這其實是對電子書包最大的誤解。電子書包的核心在于數據化,要通過對學生學習過程所記錄的大數據分析,把握學生的個性化學習特征,以便給予更有針對性的指導。
三、需要關注的一些問題
從教育的角度看,大數據時代的來臨,對教育的變革將帶來巨大的影響。
首先是教育內容要進行革新。大數據使得傳統的因果思維方式、科學研究方式不再是生活、工作起主導地位的方式,這必然要求我們在教學中要將這些變化和學生講清楚,以便他們能夠在今后走上社會的時候有足夠的能力迎接挑戰。
其次是教學方式要進行革新。過去的教學,因為沒有大量數據的支撐,該教什么全憑教師自己跟著感覺走。今天,我們可以將教師的教學視頻掛在晚上,通過深度分析學生在觀看視頻的過程中在哪些地方停頓或者重放的頻次比較高,來找出學生不明確或者課程吸引人的地方,幫助教師改進教學、確定教學重點。這必然導致教師教學方式的變革。
第三是學習路徑會發生變化。在過去,如果你想成為一個優秀的生物學家,一定要認識很多生物學家。今天,要解決一個生物難題,可能與天體物理學家或者數據視圖設計師聯系就可以實現。
第四是要防止對數據的癡迷。一方面,我們要研究學校長期以來儲存下來的大量數據,同時積累學校每天的教育數據,為進入大數據時代做好充分的思想準備;另一方面,要喚醒學校里沉睡的數據,讓其在學校管理和教師教學中發揮更大的作用;再一方面,也要防止出現另一個極端,那就是對數據的癡迷。能僅僅為了收集數據而收集數據,要讓數據在如何全面反映一個學生的能力、全面反映教師的教育質量等方面做出實踐和探索。
維克托邁爾舍恩伯格《大數據時代》讀后感 9
舍恩伯格的《大數據時代》,讓我重新審視了"大數據"這個在信息時代異軍突起的熱點詞匯,作為信息安全專業的我,對大數據這個詞本身有著更多的熱忱。
在百度上搜索到的解釋是:"大數據",或稱巨量資料,指的是所涉及的資料量規模巨大到無法透過目前主流軟件工具工具,在合理時間內達到擷取、管理、處理、并整理成為幫助企業經營決策更積極目的的資訊。特點:數量、速度、品種、真實性。
而舍恩伯格認為,大數據并不能定義一個確切的概念。他提到"大數據是人們獲得新的認知,創造新的價值的源泉;大數據還是改變市場、組織機構,以及政府和公民關系的方法。"這是一種更具有人文色彩和社會意義的詮釋。
本書中,主要從三個方面論述,即思維變革、商業變革和管理變革。而舍恩伯格更是著重闡明三大觀點:
一、更多:不是隨機樣本,而是全體數據。
二、更雜:不是精確性,而是混雜性。
三、更好:不是因果關系,而是相關關系。
對于觀點一,我不敢茍同,畢竟大數據的實現需要一定的技術支持,而顯然,現在這種技術還不夠成熟,同時一些簡單的事情運用大數據反倒是問題更加復雜化,因此這種大叔據的繁雜處理方式更適用于一些特定的情況,比如商業預測,人類dna的研究等。
而對第二種觀點,我是十分贊同舍恩伯格所說的"大數據的簡單算法比小數據的簡單算法有效"。在計算機行業迅速發展中,一種新的簡單可行的算法的出現,遠沒有計算機在運算速度和存儲容量的發展快,而大數據算法似乎更能迎合這種大趨勢。
觀點三中提到的相關關系在大數據中可是重量級的,它能較快找到事物規律和對應的解決措施,當然,也不能完全忽視因果關系,畢竟人們在思維上更能夠接受因果關系分析出的結果,而大數據預測的需要人們慢慢的適應才能接受。當我們完成相關關系的分析而又不滿足于只知道"是什么"的時候,我們就可以轉而研究"為什么"了,畢竟問題的根本在于因果。而舍恩伯格的全體數據和相關關系是大數據時代下的一種捷徑。
但是在信息時代,信息安全問題的日趨凸顯,數據獨裁與隱私保護之間的矛盾更是立于風口浪尖,成為眾矢之的,舍恩伯格在本書的最后章節曾試圖尋找一種解決方式來擺脫這一種困境,但最終沒能做到,但是他提出"大數據并不是一個充斥著算法的'和機器的冰冷世界,人類的作用仍無法被完全代替。"這里表明人在數據時代同樣的重要,數據是為人類服務的,也就該人類驅使下完成相應的目的。
在這樣的大環境下,常引起我更多的思考和擔憂。
大數據時代對于我們同是機遇與挑戰,一些國家已開始步入大數據時代的行列,并在各個領域開始研究和使用。而對于我國龐大的人口,以及較大的領土面積,都可以在大數據時代為我們提供數據的保障,而能否面臨挑戰,在大國之間的新一輪角色角逐間嶄露頭角,我們更需要解決技術等方面的問題,更應在政策上逐步開放各領域的數據,保證數據來源、權限等問題得到解決,不斷學習先進的計算機技術,縮小與其他國家的差距。
工業化、信息化,我們都向世界交出了一份讓世界不能小覷的答案;
大數據時代的數據化我們又將怎樣在新的風暴中所向披靡,如果大數據時代是一種必然趨勢,那這就是我們這一代人的責任,是我們新的戰場!
維克托邁爾舍恩伯格《大數據時代》讀后感 10
“大數據”一詞不知何時在我們的生活悄然出現,為了一探究竟,我便選擇了《大數據時代》一書。
作者先從全局簡單地描述大數據對我們的生活、工作與思維的影響,再從三方面具體地用上百個學術和商業的實例展開寫作。樣本=總體、追求精確性和相關關系等大數據時代具體特點一一現出。在同時,作者也從個人、企業等多角度分析大數據中的隱憂。
書中內容繁多,在此不能各方面概括。此書中雖有許多專有名詞,但作者以其通俗的語言以及許多實例讓我嗅到大數據時代中一抹清新之氣。
為什么是清新的呢?因為書中的內容仿佛向我打開了一個既有點熟悉又有點陌生的世界。我們現在已處于網絡時代,在我們日常簡單的操作中大量數據產生,然而起初我們僅用眾多技術在解決手頭上的問題,那些大數據像沙子中的金子,價值不被發現。到目前,每當我們網上購書時總會看到“猜你喜歡”的欄目、出現谷歌搜索與流感預測、Farecast與飛機票價預測系統等,這些事情的達成全來自于那些曾被忽略的大數據同時也在證明“預測,大數據的核心”這句話,為我們的生活創造了前所未有的可量化的維度?吹綍羞@部分內容時,我不禁感受到自己的生活已在享大數據帶來的福利,就像“猜你喜歡”欄目讓我觸到更多合我口味的書,讓我看到了以前無法發現的細節。擁有大量數據的公司巨頭如谷歌、亞馬遜大力開發有關大數據的新型產業和研究相關項目。借網絡時代的便利大數據成為了如今最有商業價值的事物,使一切可量化的趨勢也開始出現!氨举|上世界是由信息構成的”,面對這句話時,大數據時代仿佛就在眼前。
在感受驚嘆著大數據能為我們做到以往無法想象的事和它巨大的價值時,我認同大數據能極大優化我們的生活,但又不禁為這時代感到擔憂。一旦大數據時代來臨,不僅我們的隱私可能不再是隱私,就如書中所言“我們時刻暴露在‘第三只眼’下:亞馬遜監視著我們的購物習慣,谷歌監視著我們的`購物習慣,而微博似乎什么都知道”,而且利用大數據我們可以預測許多事情并且十分高效,一旦人們依賴大數據極少運用人類自身的創新等能力被數據束縛住,世界只會淪落為一個極少活力的機械環境。而我認為最大的憂患,是大數據時代對人類自身思維、思想、信仰等精神領域的沖擊。如今我們都生活在數據中,大數據時代說不定在幾年后就會逐步來臨,這使我不禁發問:我們一直堅信著信仰著的究竟是什么?我覺得世界說變就變實在令我想不通這個問題。事情都有好壞,我也不知道自己是否杞人憂天。
于是我繼續去探索作者對這問題的思考。“更大的數據在于人本身”,作者還說“我們是在創造更好的未來”,也說“在一個預測的時代里,人類的自由意志不可侵犯,這一點不可輕視。我們在使用大數據時,應當懷有謙恭之心,銘記人性之本”。人類學家克利福德吉爾茲曾說:“努力在可以應用、可以拓展的地方,應用它、拓展它;在不能應用、不能拓展的地方,就停下來!边@些話語仿佛是陽光,驅散我心中對大數據時代的擔憂以及內心對其的恐懼。我認為,在堅守我們內心和自由意志下,大數據才會造福我們人類世界,發揮出它背后對人溫暖的光芒。
面對時代的變革,我會為堅守內心深處的自由意志而努力并“擁抱大數據”。
維克托邁爾舍恩伯格《大數據時代》讀后感 11
我主要讀了第一部分和第三部分。
第一部分是大數據的思維變革,作者舍恩伯格提出了三個觀點,一是"不是隨機樣本,而是全體數據",二是"不是精確性,而是混雜性",三是"不是因果關系,而是相關關系",作者被譽為"大數據時代的預言家",拋出的觀點是擲地有聲的,下面我將談談我對這三點的理解。
對于一,我們必須承認我們以往做的處理抽樣數據得到結果的方法,是省時省力省錢的,而且判斷結果是相對高精準的,如人口普查這一案例,如果采用全體數據進行統計分析的話,工作難度是相當大的,最后的結果也不會很滿意,這是得不償失的。但是隨著數據處理技術的飛速發展,我們已經具備了處理大量數據的能力,如果在數據分析過程中采用全體數據,就能避免抽樣數據可能由于選取偏見帶來的非隨機性,處理全體數據也必將成為一種趨勢。用在國防生管理工作中,就是管理層要對每個個體都給予充分的關心與互動,對于優秀的固然要偏愛,但是對于較差的也要保持"不拋棄不放棄"的態度,讓每一個個體都找到自己的定位與價值。
對于二,作者強調通過掌握更多的數據,暫時犧牲精確性,關注更多容易被忽略的細節,來做更多的事,得到更多的結果,也就是說我們要有一定的.包容錯誤的能力。我們在收集數據時,要主動獲取更多的數據,少加一些限制性條件,然后應用我們處理大數據的能力,或許會獲得意想不到的結果。作者舉了一個谷歌翻譯系統的例子,通過英語作為中轉,進行各語言之間的轉換。此處的啟發就是用我們最擅長的途徑,不拘泥于特定規則,來達到我們的目的,也就是說我們要先認清自己,不去刻意的模仿,找出最適合自己的一套方法。
對于三,作者指出知道"是什么"就夠了,沒必要知道"為什么",乍一看這個觀點覺得有點無腦,但是結合第二點就合理了,降低對精確性及原因結果的要求,通過對相關數據的廣泛分析,進而得到更豐富更多元的結果。如購物時,系統的購物推薦,并不是肯定你會購買,僅僅是你感興趣進而可能會買就足夠了。其實作者對"相關關系"的強調,主要是大數據強大的預測能力,而且這種預測性能還是相當精確的。以上只是我用作者的觀點佐證他自己的觀點,證明其一定的合理性,但是我是不完全認同的,在航天領域,我們對成功率的要求是極高的,尤其是載人航天領域,我們必須做到萬無一失,我們對每一個結果都會深究其根,找出原因。對于國防生體能成績的分析也是如此,結果只是我們的一個評價機制,而最重要的還是產生這一結果的原因及過程。
第三部分是大數據的管理變革,本來以為作者會講點如何通過大數據來改革管理機制和提高管理效率,沒想到作者只是講了大數據其實就是我們的隱私的暴露,提出了要讓數據采集管理公司對數據的使用負起責任的解決途徑。個人感覺,一是我們在平時要意識到個人隱私的保護,而是相關法律政策的完善,真正的讓大數據服務我們的工作生活,而不是一種變相的威脅。
維克托邁爾舍恩伯格《大數據時代》讀后感 12
信息時代的到來,我們感受到的是技術變化日新月異,隨之而來的是生活方式的轉變我們這樣評論著的信息時代已經變為曾經。如今,大數據時代成為炙手可熱的話題。筆者在這說明信息和數據,只是試圖首先說明信息、數據的關系和不同,也試圖說明,為什么信息時代轉變為了大數據時代?大數據時代帶給了我們什么?
信息和數據的定義。維基百科解釋:信息,又稱資訊,是一個高度概括抽象概念,是一個發展中的動態范疇,是進行互相交換的內容和名稱,信息的界定沒有統一的定義,但是信息具備客觀、動態、傳遞、共享、經濟等特性卻是大家的共識。數據:或稱資料,指描述事物的符號記錄,是可定義為意義的實體,它涉及到事物的存在形式。它是關于事件之一組離散且客觀的事實描述,是構成信息和知識的原始材料。數據可分為模擬數據和數字數據兩大類。數據指計算機加工的“原料”,如圖形、聲音、文字、數、字符和符號等。從定義看來,數據是原始的`處女地,需要耕耘。信息則是已經處理過的可以傳播的資訊。信息時代依賴于數據的爆發,只是當數據爆發到無法駕馭的狀態,大數據時代應運而生。這是否是《大數據時代》一書所未曾闡述的背景材料?
在《大數據時代》一書中,大數據時代與小數據時代的區別:
1、思維慣例。大數據時代區別與轉變就是,放棄對因果關系的渴求,而取而代之關注相關關系。也就是說只要知道“是什么”,而不需要知道“為什么”。作者語言絕對,卻反思其本質區別。數據的更多、更雜,導致應用主意只能盡量觀察,而不是傾其所有進行推理?這也是明智之舉。
2、使用用途。小數據停留在說明過去,大數據用驅動過去來預測未來。筆者認為數據的用途意在何為,與數據本身無關,而與數據的解讀者有關,而相關關系更有利于預測未來。
3、結構。大數據更多的體現在海量非結構化數據本身與處理方法的整合。大數據更像是理論與現實齊頭并進,理論來創立處理非結構化數據的方法,處理結果與未來進行驗證。
4、分析基礎。大數據是在互聯網背景下數據從量變到質變的過程。筆者認為,小數據時代也即是信息時代,是大數據時代的前提,大數據時代是升華和進化,本質是相輔相成,而并非相離互斥。
數據未來的故事。數據的發展,給我們帶來什么預期和啟示?銀行業天然有大數據的潛質。客戶數據、交易數據、管理數據等海量數據不斷增長,海量機遇和挑戰也隨之而來,適應變革,適者生存。我們可以有更廣闊的業務發展空間、可以有更精準的決策判斷能力、可以有更優秀的經營管理能力可以這些都基于數據的收集、整理、駕馭、分析能力,基于脫穎而出的創新思維和執行。因此,建設“數據倉庫”,培養“數據思維”,養成“數據治理”,創造“數據融合”,實現“數據應用”才能擁抱“大數據”時代,從數據中攫取價值,笑看風云變換,穩健贏取未來。
維克托邁爾舍恩伯格《大數據時代》讀后感 13
讀了涂子沛先生的《大數據時代》(這是一本社科類書籍,想深入研究大數據原理的可以選擇其他技術類專業書籍)。作者以美國為例,講述了“數據不僅可以治國,還可以強國”的觀點,對中國今后的大數據發展戰略提出了建議。讀完之后,主要有一下幾點感想。
一、美國社會之所以發達高效,引領世界科技的發展,與其尊重數據,收集數據的傳統是分不開的。數據被視為科學的度量、知識的來源。沒有數據,無論是學術研究,還是政策制定,都寸步難行。“數據驅動決策方法”使得政府更有效率、更加開放、更加負責。
數據的積累需要時間,不能一蹴而就,美國在數據的收集方面歷史悠久。美國聯邦政府的取得數據主要有三個來源:業務管理的數據,民意社情數據,物理環境數據。例如1940年羅斯福引進的民意調查、1962年啟動的海浪監測計劃和1973年誕生的最小數據集。而中國取得類似的進步,是進入21世紀之后才發生的事情。2003年,中國開始著手制定醫療系統的最小數據集,創立了第一個全國性的大型社會調查項目,開始對社會的發展和變遷進行全方位、綜合性、縱貫性的問卷訪談調查。2006年中國衛生部才出臺了最小數據集的標準。幾經周折,國家統計局才在2006年9月成立了社情民意調查中心。
中國的落后,根源之一是缺乏以數據為基礎的精確管理,未來中國的進步,需要面對收集數據、使用數據、開放數據的挑戰。
二、大數據是一柄雙刃劍,數據雖然可以造福于民,但是也可能成為控制人民的工具。2013年的“棱鏡門”事件揭露了政府對于人民的監控,引起軒然大波。在未來,每個人都可能存在一份數據檔案,包括一個人的教育、醫療、福利、犯罪和納稅等等一切從搖籃到墳墓的數據記錄,甚至包括電話、郵件等都可能被監聽和記錄。通過數據整合和信息加總,就可以再現一個人生活的軌跡和全景,各個系統之間的數據可以彼此印證、互相解釋,個人隱私就無所遁形。英國作家喬治。奧威爾在其諷刺小說《一九八四》中描述了時刻被“老大哥”監視的零隱私的可怕情形:不論是睡著還是醒著,在工作還是在吃飯,在室內還是在戶外,早浴盆里還是在床上,沒有躲避的地方。除了你腦殼里幾個立方厘米以外,沒有東西是屬于你自己的。
隨著大數據科技的發展,我們的一舉一動,每一通話,每一次上網記錄都被監控、記錄,分析,當這些數據被某一個人或組織掌握,將會是對我們隱私的莫大威脅,因此,對于數據使用的監管需要進一步的立法進行規范,我國目前對于數據的收集、利用處于野蠻生長階段,任何商業組織都可以收集和分析用戶的信息。政府需要立法對技術的'使用進行監管,保障公民的安全。
三、數據是一種公共資源,政府使用納稅人的錢收集了數據信息之后,需要將數據進行公開,這樣既可以集中大眾的智慧,利用數據科學地治理社會;也可以讓大眾對政府的行為進行監督,避免政府的腐敗。因為缺乏競爭,官僚體制與生俱來有一種僵化保守的本性,政府機關也往往固守不前。很多數據都被以機密為借口封存起來,人民就無從得知政府的各項舉措是否合理,因此在黑暗中就滋生了腐敗。
而且,現代社會中,掌握信息多的人,在社會競爭中處于有利的地位,而信息貧乏的人,則處于不利地位,數據不應該被少數人壟斷,應該作為一種公共資源被普通百姓獲取。
四、技術的進步離不開科學技術人員的不懈努力,知識分子應該承擔促進社會進步的責任和使命。正如Linux的開發者所說的:“一個人做事的動機,可以分為三類:一是求生,二是社會生活,三是娛樂。當我們的動機上升到一個更高階段時,我們才會取得進步:不是僅僅為了求生,更是為了改變社會,更理想的是——為了興趣和快樂。
維克托邁爾舍恩伯格《大數據時代》讀后感 14
維基百科說大數據由巨型數據集組成,這些數據集大小常超出常用軟件在可接受時間下的收集、利用、管理和處理能力,或稱巨量數據、海量數據、大資料,大數據的常見特點是3V:Volume、Velocity、Variety。
規模巨大的數據未必是大數據,需滿足她的三個特點。以研究擲硬幣概率的實驗為例,當傳統實驗次數達到一定規模后就能幫助實驗者分析正反面出現的概率,隨著實驗次數的增加,數據大量積累可能越來越支持這一結論,數據達到一定量,它的邊際效應就出現了,數據繼續增加對分析概率還有多少意義呢?按照現代概率學伯努利試驗去帶入函數計算就好了,這僅算是概率學或者是統計學吧。故大數據不是因為單純體積大而大,是因為雜而大,研究硬幣正反面的概率如引入天文學、心理學、材料學、物理學等領域的數據而使之變大,進而研究關聯關系(或因果關系,注:本書不認同因果關系的重要性),從而得出概率的分布,然而大量相關數據的引入,按照傳統分析過程的時間是不可接受的,需利用高效計算資源,迅速把雜而大的處理結果呈現出來,并且實驗者對結果的預期不能要求100%的`精確。大數據并不是數據本身,而是一種思維方式。
大數據令人著迷的地方在于用"科學"的辦法挑戰了"預測學",幫助人們發現未知,幫忙人們進行決策。然而本書作者Viktor Mayer—Schonberger強調"大數據不是因果關系,而是相關關系,相關關系比因果關系更重要",此觀點不能認同,因果關系是宇宙的基本定律,且不說種瓜得瓜、善有善報之類哲學命題,若商家在發現電容器、釘子、高壓鍋有關聯購買關系而去做大量營銷的話豈不是有可能發生更多的波士頓爆炸案。
、訇P聯關系在大數據中被提取出來使用,而不去關心因果關系是一種粗暴的、倒退的處理方式,是作者理解的現代社會浮躁的心里體現。我認為的大數據應該是把看起來不相干的數據放到一起分析,找到某些跨領域的關聯關系,進而推論因果關系,發現其中價值。作者引用了安德森的觀點"現在已經是一個有海量數據的時代,應用數學已經取代了其他的所有學科工具,而且只要數據足夠,就能說明問題",數據和所有科學的關系,我覺得有點像現在互聯網和其他所有行業的關系一樣,互聯網終究還是一個工具。作者舉了沃爾瑪"尿布與啤酒"。
③的故事,這也是大家熟知的一個數據分析的故事,但是沃爾瑪真的是這么做的嗎?大家可以去沃爾瑪的時候留意一下。一家大型的超市,如果為了這種所謂相關關系,所有商品用這種關聯關系去擺放,天哪,這將是一家多么混亂的超市,顧客進去將難以區分食品在哪、生活用品在哪!有人可能說這種關聯關系更適合電子商務,是的,但是我還是比較看好已知原因的關聯關系,比如嬰幼兒智力玩具和孕婦減肥放到一起,比如在線播放器旁邊放衛生紙的廣告(哈哈哈,你懂的)。本書用美國折扣零售店塔吉特與懷孕預測。
②來佐證他的觀點,但恰恰是知道因果關系后商業價值才能更多的體現出來,未知因果關系前顧客的父親生氣并要求賠償,知道因果關系后才使得這種廣告理所應當并讓客戶接受。
互聯網信息時代數據的積累以及BI、數據倉庫、人工智能、HADOOP、NOSQL等技術的流行,使得人們考慮問題的方式已經發生變化,接下來我們要做的只有接受擁抱數據時代、大數據時代。軟件行業程序上線的變更差錯率是一個考核IT水平的指標,為此很多公司引進了CMMI體系,以求他保障軟件的質量,為此也收集了大量的過程數據。若用數據的思維,是否可能根據之前的各種相關數據預測下次投產變更的成功率?若用大數據的思維,是否可以根據CMMI數據以及程序員開發期間上下班考勤數據、工資發放時間、上線當天天氣情況來綜合預測投產變更的成功率?用大數據的思維,訂餐網站不僅根據之前你定的是咸的還是辣的來給你推薦菜單,可能因為你微博上發了一句"每個月總有那么幾天"修改了訂餐的推薦菜單(哈哈)!故在數據時代,提議童鞋們檢查公司的信息系統,是否有定期刪除"垃圾"日志、數據的機制(Viktor說,即使最平凡的信息業可以具有特殊的價值),為了日益廉價的存儲而刪除日益昂貴的數據,請三思后行吧。
【維克托邁爾舍恩伯格《大數據時代》讀后感】相關文章:
亨舍爾和格萊特的童話故事07-16
埃格伯特10-15
飛來伢與女巫德博恩格09-16
關于扎克伯格的經典語錄70句09-07
說大話的維克托閱讀訓練12-26
艾爾和肖恩勇闖賽爾號第十三集09-23
艾爾和肖恩勇闖賽爾號第七集12-03
艾爾和肖恩勇闖賽爾號第八集07-20
艾爾和肖恩勇闖賽爾號第四集10-04
艾爾和肖恩勇闖賽爾號第十集09-20