讀大數據時代心得體會

讀大數據時代心得體會 篇1

讀了《大數據時代》後,感覺到一個大變革的時代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結”或顛覆一些傳統上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強烈震撼,不禁戰慄起來。

“在小數據時代,我們會假象世界是怎樣運作的,然後通過收集和分析數據來驗證這種假想。”“隨著由假想時代到數據時代的過渡,我們也很可能認為我們不在需要理論了。”書中幾乎肯定要顛覆統計學的理論和方法,也試圖通過引用《連線》雜誌主編安德森的話“量子物理學的理論已經脫離實際”來“終結”量子力學。對此我很高興,因為統計學和量子力學都是我在大學學習時學到抽筋都不能及格的課目。但這兩個理論實在太大,太權威,太基本了,我想我不可能靠一本書就能擺脫這兩個讓我頭疼一輩子的東西。作者其實也不敢旗幟鮮明地提出要顛覆它們的論點,畢竟還是在前面加上了“很可能認為”這樣的保護傘。

近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應該做到的就是要破和立,要改變自己的傳統,跟上時代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會被扣上思想僵化甚至阻礙世界發展的大帽子。既然大數據是“通往未來的必然改變”,那我就必須“不受限於傳統的思維模式和特定領域裡隱含的固有偏見”,跟作者一起先把統計學和量子力學否定掉再說。反正我也不喜歡、也學不會它們。

當我們人類的數據收集和處理能力達到拍位元組甚至更大之後,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性後,似乎真的可以拋棄以抽樣調查為基礎的統計學了。但是由統計學和量子力學以及其他很多“我們也很可能認為我們不再需要的”理論上溯,它們幾乎都基於一個共同的基礎——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔心了!

《大數據時代》第16頁“大數據的核心就是預測”。邏輯是——描述時空信息“類”與“類”之間長時間有效不變的先後變化關係規則。兩者似乎是做同一件事。可大數據要的“不是因果關係,而是相關關係”,“知道是什麼就夠了,沒必要知道為什麼”,而邏輯學四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規定”任何事物都有其存在的充足理由。且邏輯推理三部分——歸納邏輯、溯因邏輯和演繹邏輯都是基於因果關係。兩者好像又是對立的。在同一件事上兩種方法對立,應該只有一個結果,就是要否定掉其中之一。這就是讓我很擔心的原因。

可我卻不能拭目以待,像旁觀者一樣等著哪一個“脫穎而出”,因為我身處其中。問題不解決,我就沒法思考和工作,自然就沒法活了!更何況還有兩個更可怕的事情。

其一:量子力學搞了一百多年,為了處理好混雜性問題,把質量和速度結合到能量上去了,為了調和量子力學與相對論的矛盾,又搞出一個量子場論,再七搞八搞又有了蟲洞和羅森橋,最後把四維的時空彎曲成允許時間旅行的樣子,恨不得馬上造成那可怕的時間旅行機器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關係,因為爸爸就是爸爸,兒子就是兒子。那么大數據會不會通過正視混雜性,放棄因果關係最後反而搞出時間機器,讓爸爸不再是爸爸,兒子不再是兒子了呢?其二:人和機器的根本區別在於人有邏輯思維而機器沒有。《大數據時代》也擔心“最後做出決策的將是機器而不是人”。如果真的那一天因為放棄邏輯思維而出現科幻電影上描述的機器主宰世界消滅人類的結果,那我還不如現在就趁早跳樓。

還好我知道自己對什麼統計學、量子力學、邏輯學和大數據來說都是門外漢,也許上面一大篇都是在胡說八道,所謂的擔心根本不存在。但問題出現了,還是解決的好,不然沒法睡著覺。自己解決不了就只能依靠專家來指點迷津。

所以想向《大數據時代》的作者提一個合理化建議:把這本書繼續寫下去,至少加一個第四部分——大數據時代的邏輯思維。

讀大數據時代心得體會 篇2

這本書里主要介紹的是大數據在現代商業運作上的套用,以及它對現代商業運作的影響。

《大數據時代》這本書的結構框架遵從了學術性書籍的普遍方式。也既,從現象入手,繼而通過對現象的解剖提出對這一現象的解釋。然後在通過解釋在對未來進行預測,並對未來可能出現的問題提出自己看法與對策。

下面來重點介紹《大數據時代》這本書的主要內容。

《大數據時代》開篇就講了Google通過人們在搜尋引擎上搜尋關鍵字留下的數據提前成功的預測了20xx年美國的H1N1的爆發地與傳播方向以及可能的潛在患者的事情。Google的預測比政府提前將近一個月,相比之下政府只能夠在流感爆發一兩個周之後才可以弄到相關的數據。同時Google的預測與政府數據的相關性高達97%,這也就意味著Google預測數據的置信區間為3%,這個數字遠遠小於傳統統計學上的常規置信區間5%!而這個數字就是大數據時代預測結果的相對準確性與事件的可預測性的最好證明!通過這一事以及其他的案例,維克托提出了在大數據時代“樣本=總體”的思想。我們都知道當樣本無限趨近於總體的時候,通過計算得到的描述性數據將無限的趨近於事件本身的性質。而之前採取的“樣本<總體”的做法很大程度上無法做到更進一步的描述事物,因為之前的時代數據的獲取與存儲處理本身有很大的難度只導致人們採取抽樣的方式來測量事物。而網際網路終端與計算機的出現使數據的獲取、存儲與處理難度大大降低,因而相對準確性更高的“樣本=總體”的測算方式將成為大數據時代的主流,同時大數據時代本身也是建立在大批量數據的存儲與處理的基礎之上的。

接下來,維克多又通過了IBM追求高精確性的電腦翻譯計畫的失敗與Google只是將所有出現過的相應的文字語句掃描並儲存在詞庫中,所以無論需要翻譯什麼,只要有聯繫Google詞庫就會出現翻譯,雖然有的時候的翻譯很無厘頭,但是大多數時候還是正確的,所以Google的電腦翻譯的計畫的成功,表明大數據時代對準確性的追求並不是特別明顯,但是相反大數據時代是建立在大數據的基礎住上的,所以大數據時代追求的是全方位覆蓋的數字測度而不管其準確性到底有多高,因為大量的數據會湮埋少數有問題的數據所帶來的影響。同時大量的數據也會無限的逼近事物的原貌。

之後,維克托又預測了一個在大數據時代催生的重要職業——數據科學家,這是一群數學家、統計學與編程家的綜合體,這一群人將能夠從獲取的數據中得到任何他們想要的結果。換言之,只要數據充足我們的一切外在的與內在的我們不想讓他人知道的東西都見會在這一群傢伙的面前展現得淋漓盡致。所以為了避免個人隱私在大數據時代被這一群人利用,維克托建議將這一群人分為兩部分,一部分使用數據為商業部門服務,而另一群人則負責審查這一些人是否合法的獲得與套用數據,是否侵犯了個人隱私。

無論如何,大數據時代將會到來,不管我們接受還是不接受!

我覺得《大數據時代》這本書寫的很好,很值得一讀。因為會給我們很多啟發,比如你在相關的社交網站發表的言論或者照片都很有可能被“數據科學家”們利用,從而再將相關數據賣給各大網店。不過,事實就是我們將會成為被預測被引誘的對象。所以說,小心你在網上留下的痕跡。

我喜歡這本書是因為它給我展現了一個新的世界。

讀大數據時代心得體會 篇3

信息和數據的定義。維基百科解釋:信息,又稱資訊,是一個高度概括抽象概念,是一個發展中的動態範疇,是進行互相交換的內容和名稱,信息的界定沒有統一的定義,但是信息具備客觀、動態、傳遞、共享、經濟等特性卻是大家的共識。數據:或稱資料,指描述事物的符號記錄,是可定義為意義的實體,它涉及到事物的存在形式。它是關於事件之一組離散且客觀的事實描述,是構成信息和知識的原始材料。數據可分為模擬數據和數字數據兩大類。數據指計算機加工的“原料”,如圖形、聲音、文字、數、字元和符號等。從定義看來,數據是原始的處女地,需要耕耘。信息則是已經處理過的可以傳播的資訊。資訊時代依賴於數據的爆發,只是當數據爆發到無法駕馭的狀態,大數據時代應運而生。這是否是《大數據時代》一書所未曾闡述的背景材料?

在《大數據時代》一書中,大數據時代與小數據時代的區別:1、思維慣例。大數據時代區別與轉變就是,放棄對因果關係的渴求,而取而代之關注相關關係。也就是說只要知道“是什麼”,而不需要知道“為什麼”。作者語言絕對,卻反思其本質區別。數據的更多、更雜,導致套用主意只能儘量觀察,而不是傾其所有進行推理?這也是明智之舉2、使用用途。小數據停留在說明過去,大數據用驅動過去來預測未來。筆者認為數據的用途意在何為,與數據本身無關,而與數據的解讀者有關,而相關關係更有利於預測未來。3、結構。大數據更多的體現在海量非結構化數據本身與處理方法的整合。大數據更像是理論與現實齊頭並進,理論來創立處理非結構化數據的方法,處理結果與未來進行驗證。4、分析基礎。大數據是在網際網路背景下數據從量變到質變的過程。筆者認為,小數據時代也即是資訊時代,是大數據時代的前提,大數據時代是升華和進化,本質是相輔相成,而並非相離互斥。

數據未來的故事。數據的發展,給我們帶來什麼預期和啟示?銀行業天然有大數據的潛質。客戶數據、交易數據、管理數據等海量數據不斷增長,海量機遇和挑戰也隨之而來,適應變革,適者生存。我們可以有更廣闊的業務發展空間、可以有更精準的決策判斷能力、可以有更優秀的經營管理能力„„可以這些都基於數據的收集、整理、駕馭、分析能力,基於脫穎而出的創新思維和執行。因此,建設“數據倉庫”,培養“數據思維”,養成“數據治理”,創造“數據融合”,實現“數據套用”才能擁抱“大數據”時代,從數據中攫取價值,笑看風雲變換,穩健贏取未來。

讀大數據時代心得體會 篇4

未來的十年,將是大數據引領下的智慧科技時代。不管你是否意識到它的存在,大數據都將越來越快地改變我們這個時代,包括我們的生活方式。

維克托·邁爾-舍恩伯格是最早洞見大數據時代發展趨勢的數據科學家之一。他通過一個大家熟知的事例,來幫助我們理解“大數據”的潛在影響力,那就是四個世紀之前望遠鏡和顯微鏡的發明。望遠鏡能夠讓我們感受宇宙,顯微鏡能夠讓我們觀測微生物,它們都是收集海量數據的新工具,因為這種工具的發明,人們同步更新了分析數據的技術和方法,促進了人們對世界更好的理解。如果說望遠鏡和顯微鏡是測量領域中的一場革命,那么今天的數據測量就相當於是現代版的望遠鏡、顯微鏡。隨著社交網路的逐漸成熟,移動頻寬迅速提升,雲計算、物聯網套用更加豐富,以及更多的感測設備、移動終端接入到網路,由此產生的數據及數據的增長速度比歷史上的任何時期都要多、都要快。一個大數據的時代,不經意間順理成章地翩然而至。

一、什麼是大數據?

大數據是當前最熱門的話題之一。但什麼是大數據,人們尚未給出確切的定義。首先,“大數據”是相對過去小的、局部性的數據而言的;其次,利用大數據進行分析和工作時,所依據的關於此事儘可能完整的數據,從而“一覽眾山小”,而不是採用局部的小數據,從局部推斷整體。

維克托也並未直接給出大數據的定義。不過,他用三大轉變描述了大數據的特性:

轉變之一:在大數據時代,我們可以分析更多的數據,有時候甚至可以處理和某個特別現象相關的所有數據,而不再依賴於隨機採樣。例如一項針對相撲比賽中非法操縱比賽結果的研究對64000場比賽進行了分析,這算不上一個很大的數字,但由於這是過去十年所有的比賽,所以它是大數據。

轉變之二:由於有了更多的數據,我們可以接受更多的混雜、更多數據上的不精確。如果我們對於一個事物只有50個數據點,那么每一個數據點都必須非常精確,因為每個數據點都是有用的;但是如果我們有5000萬個,去掉10個,甚至去掉1000個都沒有太大的問題。

轉變之三:不再探求難以捉摸的因果關係,轉而關注事物的相關關係。分析大數據主要為了預測未來“是什麼”,而不是“為什麼”。因為很多時候我們以為我們找到了事情背後的原因,實際上卻沒有找到。更多時候知道了“是什麼”就足夠了。例如知道流感將會擴散到哪裡就足夠了,我不需要知道為什麼;知道什麼時候在網上購買機票能夠獲得最優惠的價格就足夠了,我不需要知道為什麼此時價格最低。

二、大數據帶來的變化

大數據從根本上改變我們認識世界和改變世界的方式。很多傳統的習慣將被顛覆,很多舊的制度將面臨挑戰。舉例來說:

第一,科學探究的思路和方式受到挑戰

探究是新課程改革中的一個熱詞,是促進學校教學與科學研究相融合的實踐舉措。科學探究的基本路徑是:發現問題,提出假設,制定方案,實踐探究,分析數據,得出結論。之所以會梳理出這樣一個探究的路徑,與我們對問題知曉的信息過少有關。換句話說,對所要研究的事物,我們知道的數據很少,需要從這些很小的數據出發,通過猜想和假設,進行試探性的研究,如果研究得出的結果和自己的假想是一致的,則說明我們的假說是正確的,這些假說會上升為對該事物描述的知識,我們掌握該事物的數據也隨之增加。

利用測量所獲得的點滴數據,從一個局部來推測世界是怎樣的,這是科學探究的基本思路和方式。長期以來,我們總是通過這樣的方式來認識世界,對其有宗教般的信仰。儘管我們知道,決策者總是先有了想法,才會提出假設。如果決策者自身對所研究的事情存在著偏見,所提出的假設就很難得到實證的支持,這往往會導致探究花費了很長的時間、很大的物力和財力,也常常勞而無功。但科學研究者還是堅定不移地沿著這條道路前行,學校在教學中也將其作為科學研究的基本規範來傳授。

在大數據時代,這樣的研究方式收到了極大的挑戰。先舉個事例來說吧。手機輻射是否能夠致癌?關於這個問題,無論我們的假設如何,實驗的設計都很難進行。首先,樣本選擇過少,沒有統計學上的意義;其次,不能拿人做研究對象;第三,短時間的研究很難觀察到變化。有了大數據之後,這樣的難題就可以迎刃而解了。前段時間,丹麥就進行了這樣的研究。丹麥擁有1985年手機推出以來所有手機用戶的資料庫。他們從這個資料庫中分析了1990年至20xx年擁有手機的所用用戶的數據,同時,他們還收集了這一期間醫院收集的所有癌症患者的數據,然後分析手機用戶是否比非手機用戶有更高的癌症發病率。這兩個資料庫本身是完全獨立的,在作分析之前從來沒有想過可以做這樣的研究。結果表明,使用移動用戶和癌症風險增加之間不存在任何關係。20xx年10月,這一研究的結果發表在《英國醫學雜誌》上。

上述的案例告訴我們,在獲得了大量的數據,能夠對事物的整體進行全面的認識之後,假想就沒有意義了,我們可以直接根據全面的數據做出結論。

讀大數據時代心得體會 篇5

4月13日下午,在湖南大學東樓205參加了關於《大數據時代》的讀書交流活動。通過相互交流學習,使我更深層次的理解了大數據時代的利與弊,機遇和挑戰。在寫心得體會前,我想再重新審視一下關於大數據的歷史沿革和現實意義。

首先,最早提出“大數據”時代到來的是全球知名諮詢公司麥肯錫,麥肯錫稱:“數據,已經滲透到當今每一個行業和業務職能領域,成為重要的生產因素。人們對於海量數 據的挖掘和運用,預示著新一波生產率增長和消費者盈餘浪潮的到來。”“大數據”在物理學、生物學、環境生態學等領域以及軍事、金融、通訊等行業存在已有時日,卻因為近年來網際網路和信息行業的發展而引起人們關注。大數據作為雲計算、物聯網之後又IT行業又一大顛覆性的技術革命。雲計算主要為數據資產提供了保管、訪問的場所和渠道,而數據才是真正有價值的資產。企業內部的經營交易信息、物聯網世界中的商品物流信息,網際網路世界中的人與人互動信息、位置信息等,其數量將遠遠超越現有企業IT架構和基礎設施的承載能力,實時性要求也將大大超越現有的計算能力。如何盤活這些數據資產,使其為國家治理、企業決策乃至個人生活服務,是大數據的核心議題,也是雲計算內在的靈魂和必然的升級方向。

其次,進入20xx年,大數據(big data)一詞越來越多地被提及,人們用它來描述和定義信息爆炸時代產生的海量數據,並命名與之相關的技術發展與創新。它已經上過《紐約時報》《華爾街日報》的專欄封面,進入美國白宮官網的新聞,現身在國內一些網際網路主題的講座沙龍中,甚至被嗅覺靈敏的國金證券、國泰君安、銀河證券等寫進了投資推薦報告。數據正在迅速膨脹並變大,它決定著企業的未來發展,雖然很多企業可能並沒有意識到數據爆炸性增長帶來問題的隱患,但是隨著時間的推移,人們將越來越多的意識到數據對企業的重要性。正如《紐約時報》20xx年2月的一篇專欄中所稱,“大數據”時代已經降臨,在商業、經濟及其他領域中,決策將日益基於數據和分析而作出,而並非基於經驗和直覺。哈佛大學社會學教授加里·金說:“這是一場革命,龐大的數據資源使得各個領域開始了量化進程,無論學術界、商界還是政府,所有領域都將開始這種進程。”

最後,隨著雲時代的來臨,大數據(Big data)也吸引了越來越多的關注。著雲台的分析師團隊認為,大數據(Big data)通常用來形容一個公司創造的大量非結構化和半結構化數據,這些數據在下載到關係型資料庫用於分析時會花費過多時間和金錢。大數據分析常和雲計算聯繫到一起,因為實時的大型數據集分析需要像MapReduce一樣的框架來向數十、數百或甚至數千的電腦分配工作。“大數據”在網際網路行業指的是這樣一種現象:網際網路公司在日常運營中生成、累積的用戶網路行為數據。這些數據的規模是如此龐大,以至於不能用G或T來衡量。大數據到底有多大?一組名為“網際網路上一天”的數據告訴我們,一天之中,網際網路產生的全部內容可以刻滿1.68億張DVD;發出的郵件有2940億封之多(相當於美國兩年的紙質信件數量);發出的社區帖子達200萬個(相當於《時代》雜誌770年的文字量);賣出的手機為37.8萬台,高於全球每天出生的嬰兒數量37.1萬……,截止到20xx年,數據量已經從TB(1024GB=1TB)級別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)級別。國際數據公司(IDC)的研究結果表明,20xx年全球產生的數據量為0.49ZB,20xx年的數據量為0.8ZB,20xx年增長為1.2ZB,20xx年的數量更是高達1.82ZB,相當於全球每人產生200GB以上的數據。而到20xx年為止,人類生產的所有印刷材料的數據量是200PB,全人類歷史上說過的所有話的數據量大約是5EB。IBM的研究稱,整個人類文明所獲得的全部數據中,有90%是過去兩年內產生的。而到了20xx年,全世界所產生的數據規模將達到今天的44倍。

首先,談談大數據帶給生活的轉變。大數據已經是信息產業發展的必然趨勢,可以說,大數據現在已經開始慢慢滲透入我們的生活,如:現在流行的打車軟體、三維立體化社區的建立、某些從事生產銷售的行業利用大數據來最佳化規模和實現利益最大化。而我們很多人對大數據還很陌生,只是被動的適應著大數據給生活帶來的改變。大數據時代是以雲計算為基礎的,所以,要實現大數據,相關的很多的硬體設備都要更新換代,信息處理系統、信息傳輸系統、信息反饋系統、信息決策系統都將面臨新的挑戰,相關產業都要重新調整產業結構,在那時,可以誇張的說,信息就是黃金,信息就是石油。大數據時代的到來會解放更多的勞動生產力,勢必將會更加加劇生產力過剩的現狀,社會兩極分化現象會更加明顯,掌握不了信息資源,很難再翻身,要防止信息壟斷帶來的可怕局面。大數據時代的到來會使人們的生活節奏急速加快,信息的時效性決定了它的流通速率,人們的生活節奏要跟上信息流通的速率,就不得不加快自己的節奏,人們會越來越忙,到那時,就像現在的日本,可能想找個人聽你說說話,真的是一件很難的事。

第二,關於數據管理的看法。大數據時代,數據管理是一件很重要的工作,如何才能避免自己的數據被非法竊取、丟失和被盜?我的看法是,人防、技防、物防一體化。人防,即我們要從思想上牢固樹立信息安全防範的意識,不主動泄露信息,要管理好自己身邊的信息設備;技防,就是要運用軟體來管理和處理數據,經常檢查更新資料庫,定時查殺電腦病毒,確保電腦狀況安全;物防,就是重要的數據一定要備份保留,而且應當做到備份與原始檔案是物理隔離,無關的信息應當及時刪除,減輕硬碟的壓力。

三、怎么保護自己的隱私。隱私,顧名思義,就是不願意讓別人看到的東西,所以,在大數據時代,更要管理好自己的隱私,以免對自己和家人造成麻煩和損失。越是隱私的信息,越要遠離網路,不要再公開的社交網路儲存和展示個人圖片、資料等信息,免得被非法人士採用和竊取。建議還是用紙質的日記代替電腦日記,避免信息傳播範圍太大,管理好自己的日記本。研發一種新的硬體連線器,總是以隨機碼來保護自己真實IP位址,提高網路安全的可靠性,加強對聯網信息的管理和保護。

不論我們情不情願,大數據時代都會到來,現實社會是我們高喊著走向大數據時代,其實大數據時代已經向我們走來,所以與其被動接受,不如主動學習,從中找到自己的出路,成為大數據時代的建設者和受益者。

讀大數據時代心得體會 篇6

讀了《大數據時代》後,感覺到一個大變革的時代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結”或顛覆一些傳統上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強烈震撼,不禁戰慄起來。

“在小數據時代,我們會假象世界是怎樣運作的,然後通過收集和分析數據來驗證這種假想。”“隨著由假想時代到數據時代的過渡,我們也很可能認為我們不在需要理論了。”書中幾乎肯定要顛覆統計學的理論和方法,也試圖通過引用《連線》雜誌主編安德森的話“量子物理學的理論已經脫離實際”來“終結”量子力學。對此我很高興,因為統計學和量子力學都是我在大學學習時學到抽筋都不能及格的課目。但這兩個理論實在太大,太權威,太基本了,我想我不可能靠一本書就能擺脫這兩個讓我頭疼一輩子的東西。作者其實也不敢旗幟鮮明地提出要顛覆它們的論點,畢竟還是在前面加上了“很可能認為”這樣的保護傘。

近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應該做到的就是要破和立,要改變自己的傳統,跟上時代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會被扣上思想僵化甚至阻礙世界發展的大帽子。既然大數據是“通往未來的必然改變”,那我就必須“不受限於傳統的思維模式和特定領域裡隱含的固有偏見”,跟作者一起先把統計學和量子力學否定掉再說。反正我也不喜歡、也學不會它們。

當我們人類的數據收集和處理能力達到拍位元組甚至更大之後,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性後,似乎真的可以拋棄以抽樣調查為基礎的統計學了。但是由統計學和量子力學以及其他很多“我們也很可能認為我們不再需要的”理論上溯,它們幾乎都基於一個共同的基礎——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔心了!

《大數據時代》第16頁“大數據的核心就是預測”。邏輯是——描述時空信息“類”與“類”之間長時間有效不變的先後變化關係規則。兩者似乎是做同一件事。可大數據要的“不是因果關係,而是相關關係”,“知道是什麼就夠了,沒必要知道為什麼”,而邏輯學四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規定”任何事物都有其存在的充足理由。且邏輯推理三部分——歸納邏輯、溯因邏輯和演繹邏輯都是基於因果關係。兩者好像又是對立的。在同一件事上兩種方法對立,應該只有一個結果,就是要否定掉其中之一。這就是讓我很擔心的原因。

可我卻不能拭目以待,像旁觀者一樣等著哪一個“脫穎而出”,因為我身處其中。問題不解決,我就沒法思考和工作,自然就沒法活了!更何況還有兩個更可怕的事情。

其一:量子力學搞了一百多年,為了處理好混雜性問題,把質量和速度結合到能量上去了,為了調和量子力學與相對論的矛盾,又搞出一個量子場論,再七搞八搞又有了蟲洞和羅森橋,最後把四維的時空彎曲成允許時間旅行的樣子,恨不得馬上造成那可怕的時間旅行機器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關係,因為爸爸就是爸爸,兒子就是兒子。那么大數據會不會通過正視混雜性,放棄因果關係最後反而搞出時間機器,讓爸爸不再是爸爸,兒子不再是兒子了呢?其二:人和機器的根本區別在於人有邏輯思維而機器沒有。《大數據時代》也擔心“最後做出決策的將是機器而不是人”。如果真的那一天因為放棄邏輯思維而出現科幻電影上描述的機器主宰世界消滅人類的結果,那我還不如現在就趁早跳樓。

還好我知道自己對什麼統計學、量子力學、邏輯學和大數據來說都是門外漢,也許上面一大篇都是在胡說八道,所謂的擔心根本不存在。但問題出現了,還是解決的好,不然沒法睡著覺。自己解決不了就只能依靠專家來指點迷津。

所以想向《大數據時代》的作者提一個合理化建議:把這本書繼續寫下去,至少加一個第四部分——大數據時代的邏輯思維。

讀大數據時代心得體會 篇7

資訊時代的到來,我們感受到的是技術變化日新月異,隨之而來的是生活方式的轉變„„我們這樣評論著的資訊時代已經變為曾經。如今,大數據時代成為炙手可熱的話題。筆者在這說明信息和數據,只是試圖首先說明信息、數據的關係和不同,也試圖說明,為什麼資訊時代轉變為了大數據時代?大數據時代帶給了我們什麼?

信息和數據的定義。維基百科解釋:信息,又稱資訊,是一個高度概括抽象概念,是一個發展中的動態範疇,是進行互相交換的內容和名稱,信息的界定沒有統一的定義,但是信息具備客觀、動態、傳遞、共享、經濟等特性卻是大家的共識。數據:或稱資料,指描述事物的符號記錄,是可定義為意義的實體,它涉及到事物的存在形式。它是關於事件之一組離散且客觀的事實描述,是構成信息和知識的原始材料。數據可分為模擬數據和數字數據兩大類。數據指計算機加工的“原料”,如圖形、聲音、文字、數、字元和符號等。從定義看來,數據是原始的處女地,需要耕耘。信息則是已經處理過的可以傳播的資訊。資訊時代依賴於數據的爆發,只是當數據爆發到無法駕馭的狀態,大數據時代應運而生。這是否是《大數據時代》一書所未曾闡述的背景材料?

在《大數據時代》一書中,大數據時代與小數據時代的區別:1、思維慣例。大數據時代區別與轉變就是,放棄對因果關係的渴求,而取而代之關注相關關係。也就是說只要知道“是什麼”,而不需要知道“為什麼”。作者語言絕對,卻反思其本質區別。數據的更多、更雜,導致套用主意只能儘量觀察,而不是傾其所有進行推理?這也是明智之舉2、使用用途。小數據停留在說明過去,大數據用驅動過去來預測未來。筆者認為數據的用途意在何為,與數據本身無關,而與數據的解讀者有關,而相關關係更有利於預測未來。3、結構。大數據更多的體現在海量非結構化數據本身與處理方法的整合。大數據更像是理論與現實齊頭並進,理論來創立處理非結構化數據的方法,處理結果與未來進行驗證。4、分析基礎。大數據是在網際網路背景下數據從量變到質變的過程。筆者認為,小數據時代也即是資訊時代,是大數據時代的前提,大數據時代是升華和進化,本質是相輔相成,而並非相離互斥。

數據未來的故事。數據的發展,給我們帶來什麼預期和啟示?銀行業天然有大數據的潛質。客戶數據、交易數據、管理數據等海量數據不斷增長,海量機遇和挑戰也隨之而來,適應變革,適者生存。我們可以有更廣闊的業務發展空間、可以有更精準的決策判斷能力、可以有更優秀的經營管理能力„„可以這些都基於數據的收集、整理、駕馭、分析能力,基於脫穎而出的創新思維和執行。因此,建設“數據倉庫”,培養“數據思維”,養成“數據治理”,創造“數據融合”,實現“數據套用”才能擁抱“大數據”時代,從數據中攫取價值,笑看風雲變換,穩健贏取未來。

讀大數據時代心得體會 篇8

《大數據時代》是英國維克托·邁爾-舍恩伯格教授的著作,這本書也被尊為國外大數據研究的先河之作。這本書最大的優點就在於作者利用上百個例子來對大數據的方方面面做了詳細解說,讓外行也很容易理解。結構上,作者通過大數據時代的思維變革、商業變革和管理變革三個角度依次闡述,條理清晰。

所謂"大數據",按作者的說法,就是"所有數據"。隨著計算機運算速度和存儲能力的發展,收集數據變得越來越簡單,儲存數據的成本越來越低。在過去,由於技術限制,人們做統計時只能收集有限的數據做樣本,其中要考慮隨機樣本的選擇,努力減小因樣本問題出現的誤差;統計結果往往不能重複使用,造成數據利用率低。而現在則可以做到"樣本=總體"。數據的增多帶來不可避免的精確性問題。 "小數據"時代,一個樣本的錯誤就可以造成對總體估計的失敗,幸運的是,"大數據"時代對精確性不再那么要求苛刻——也無法要求太嚴格——數據的數量足以彌補這一缺陷。在對思維變革這一部分的闡述中,最重要也是全書的核心觀點就是大數據時代,我們應該從追求"因果關係"的舊思維方式向追求"相關關係"轉變。 在我看來,這實際上是通過大數據來透視一種事物的發展趨勢,而很多精確學科領域依然需要探尋"因果關係"解決更有針對性的問題,所以,這局限了這一轉變只能在特定的領域發生。作者自己也說,"大數據的相關性將人們指向了比探討因果關係更有前景的領域。"

大數據時代的數據獲取方式是多種多樣,數據形式也是千變萬化,任何文字、行為、萬物都可以被數據化後用來分析。對這些數據的利用,不僅要考慮到其初次使用價值,更要放眼它未來可能的用途以提高數據的利用率。當然數據並不是無限使用,時效、環境的變化肯定會對數據提出新的要求,所以數據的折舊也是應當考慮的。這又引出了對數據這一無形資產的估值可能性。對於Facebook, Twitter這樣的公司來說,數據就是他們的核心,如何在資產負債表上給他們一個公正的體現正是我們需要考慮的。

大數據時代的價值鏈由三部分構成,我把它們簡化為"生產—分析—使用"三個環節,這對應書中的三種類型公司: 第一種是基於數據本身的公司,第二種是基於技能,第三種則是基於思維。在大數據早期,技能和思維最有價值,但作者認為,最終,大部分的價值還是必須從數據本身來挖掘。這是假定了一個成熟的市場,人人都了解了大數據的用途。

對於普通人來說,大數據時代最關心的還是隱私問題。不知不覺中,個人的一舉一動都暴露在政府甚至私人企業之下,還面臨潛在的泄露風險。對此,作者提出了使用者承擔責任的解決辦法,而不是過去那種流於形式的使用授權。大數據甚至能預測一個人的犯罪動機,這給監管者帶來的難題是,預測一個人要犯罪,懲罰還是不懲罰?在這點上,社會達成"個人僅需對行為而非動機負責"的共識非常重要。

大數據時代的風險控制靠的是"算法師",類似會計師一樣的職業,對大數據的準確度或有效性進行鑑定。這能在一定程度上防止數據濫用的發生和數據獨裁。當今的法律亦需對大數據監管進行修訂補充。

當代大數據發展主要由科技公司推動,相信在不久的將來更多的傳統領域會意識到大數據的重要性。但我們也應該保持清醒,大數據並不是萬能藥,對某些領域或環節,使用大數據是一種簡單且實用的選擇;但對某些領域,盲目使用大數據只會適得其反。

讀大數據時代心得體會 篇9

這本書里主要介紹的是大數據在現代商業運作上的套用,以及它對現代商業運作的影響。

《大數據時代》這本書的結構框架遵從了學術性書籍的普遍方式。也既,從現象入手,繼而通過對現象的解剖提出對這一現象的解釋。然後在通過解釋在對未來進行預測,並對未來可能出現的問題提出自己看法與對策。

下面來重點介紹《大數據時代》這本書的主要內容。

《大數據時代》開篇就講了Google通過人們在搜尋引擎上搜尋關鍵字留下的數據提前成功的預測了20xx年美國的H1N1的爆發地與傳播方向以及可能的潛在患者的事情。Google的預測比政府提前將近一個月,相比之下政府只能夠在流感爆發一兩個周之後才可以弄到相關的數據。同時Google的預測與政府數據的相關性高達97%,這也就意味著Google預測數據的置信區間為3%,這個數字遠遠小於傳統統計學上的常規置信區間5%!而這個數字就是大數據時代預測結果的相對準確性與事件的可預測性的最好證明!通過這一事以及其他的案例,維克托提出了在大數據時代“樣本=總體”的思想。我們都知道當樣本無限趨近於總體的時候,通過計算得到的描述性數據將無限的趨近於事件本身的性質。而之前採取的“樣本<總體”的做法很大程度上無法做到更進一步的描述事物,因為之前的時代數據的獲取與存儲處理本身有很大的難度只導致人們採取抽樣的方式來測量事物。而網際網路終端與計算機的出現使數據的獲取、存儲與處理難度大大降低,因而相對準確性更高的“樣本=總體”的測算方式將成為大數據時代的主流,同時大數據時代本身也是建立在大批量數據的存儲與處理的基礎之上的。

接下來,維克多又通過了IBM追求高精確性的電腦翻譯計畫的失敗與Google只是將所有出現過的相應的文字語句掃描並儲存在詞庫中,所以無論需要翻譯什麼,只要有聯繫Google詞庫就會出現翻譯,雖然有的時候的翻譯很無厘頭,但是大多數時候還是正確的,所以Google的電腦翻譯的計畫的成功,表明大數據時代對準確性的追求並不是特別明顯,但是相反大數據時代是建立在大數據的基礎住上的,所以大數據時代追求的是全方位覆蓋的數字測度而不管其準確性到底有多高,因為大量的數據會湮埋少數有問題的數據所帶來的影響。同時大量的數據也會無限的逼近事物的原貌。

之後,維克托又預測了一個在大數據時代催生的重要職業——數據科學家,這是一群數學家、統計學與編程家的綜合體,這一群人將能夠從獲取的數據中得到任何他們想要的結果。換言之,只要數據充足我們的一切外在的與內在的我們不想讓他人知道的東西都見會在這一群傢伙的面前展現得淋漓盡致。所以為了避免個人隱私在大數據時代被這一群人利用,維克托建議將這一群人分為兩部分,一部分使用數據為商業部門服務,而另一群人則負責審查這一些人是否合法的獲得與套用數據,是否侵犯了個人隱私。

無論如何,大數據時代將會到來,不管我們接受還是不接受!

我覺得《大數據時代》這本書寫的很好,很值得一讀。因為會給我們很多啟發,比如你在相關的社交網站發表的言論或者照片都很有可能被“數據科學家”們利用,從而再將相關數據賣給各大網店。不過,事實就是我們將會成為被預測被引誘的對象。所以說,小心你在網上留下的痕跡。

我喜歡這本書是因為它給我展現了一個新的世界。