日本91av在线播放视频-色婷婷综合久久久中文一区二区-国产一区二区激情在线-亚洲中文字幕无码久久久久久久久-亚洲中文字幕第一人码-久久久久久久久18禁秘-精品国产乱码久久久久久婷婷-精品丰满熟女一区二区三区蜜桃-一进一出流出白浆视频

讀書筆記吧

導航欄

×
你的位置: 筆記網(wǎng) > 讀書筆記 > 導航

大學生大數(shù)據(jù)心得體會

發(fā)表時間:2025-04-12

大學生大數(shù)據(jù)心得體會(必備五篇)。

大學生大數(shù)據(jù)心得體會 篇1

《大數(shù)據(jù)時代》是英國維克托·邁爾—舍恩伯格教授的著作,這本書也被尊為國外大數(shù)據(jù)研究的先河之作。這本書最大的優(yōu)點就在于作者利用上百個例子來對大數(shù)據(jù)的方方面面做了詳細解說,讓外行也很容易理解。結(jié)構上,作者通過大數(shù)據(jù)時代的思維變革、商業(yè)變革和管理變革三個角度依次闡述,條理清晰。

所謂"大數(shù)據(jù)",按作者的說法,就是"所有數(shù)據(jù)"。隨著計算機運算速度和存儲能力的發(fā)展,收集數(shù)據(jù)變得越來越簡單,儲存數(shù)據(jù)的成本越來越低。在過去,由于技術限制,人們做統(tǒng)計時只能收集有限的數(shù)據(jù)做樣本,其中要考慮隨機樣本的選擇,努力減小因樣本問題出現(xiàn)的誤差;統(tǒng)計結(jié)果往往不能重復使用,造成數(shù)據(jù)利用率低。而現(xiàn)在則可以做到"樣本=總體"。數(shù)據(jù)的增多帶來不可避免的精確性問題。"小數(shù)據(jù)"時代,一個樣本的錯誤就可以造成對總體估計的失敗,幸運的是,"大數(shù)據(jù)"時代對精確性不再那么要求苛刻——也無法要求太嚴格——數(shù)據(jù)的數(shù)量足以彌補這一缺陷。在對思維變革這一部分的闡述中,最重要也是全書的核心觀點就是大數(shù)據(jù)時代,我們應該從追求"因果關系"的舊思維方式向追求"相關關系"轉(zhuǎn)變。

在我看來,這實際上是通過大數(shù)據(jù)來透視一種事物的發(fā)展趨勢,而很多精確學科領域依然需要探尋"因果關系"解決更有針對性的問題,所以,這局限了這一轉(zhuǎn)變只能在特定的領域發(fā)生。作者自己也說,"大數(shù)據(jù)的相關性將人們指向了比探討因果關系更有前景的領域。"

大數(shù)據(jù)時代的數(shù)據(jù)獲取方式是多種多樣,數(shù)據(jù)形式也是千變?nèi)f化,任何文字、行為、萬物都可以被數(shù)據(jù)化后用來分析。對這些數(shù)據(jù)的利用,不僅要考慮到其初次使用價值,更要放眼它未來可能的用途以提高數(shù)據(jù)的利用率。當然數(shù)據(jù)并不是無限使用,時效、環(huán)境的變化肯定會對數(shù)據(jù)提出新的要求,所以數(shù)據(jù)的折舊也是應當考慮的。這又引出了對數(shù)據(jù)這一無形資產(chǎn)的估值可能性。對于這樣的公司來說,數(shù)據(jù)就是他們的核心,如何在資產(chǎn)負債表上給他們一個公正的體現(xiàn)正是我們需要考慮的。

大數(shù)據(jù)時代的價值鏈由三部分構成,我把它們簡化為"生產(chǎn)—分析—使用"三個環(huán)節(jié),這對應書中的三種類型公司:第一種是基于數(shù)據(jù)本身的公司,第二種是基于技能,第三種則是基于思維。在大數(shù)據(jù)早期,技能和思維最有價值,但作者認為,最終,大部分的價值還是必須從數(shù)據(jù)本身來挖掘。這是假定了一個成熟的市場,人人都了解了大數(shù)據(jù)的用途。

對于普通人來說,大數(shù)據(jù)時代最關心的`還是隱私問題。不知不覺中,個人的一舉一動都暴露在政府甚至私人企業(yè)之下,還面臨潛在的泄露風險。對此,作者提出了使用者承擔責任的解決辦法,而不是過去那種流于形式的使用授權。大數(shù)據(jù)甚至能預測一個人的犯罪動機,這給監(jiān)管者帶來的難題是,預測一個人要犯罪,懲罰還是不懲罰?在這點上,社會達成"個人僅需對行為而非動機負責"的共識非常重要。

大數(shù)據(jù)時代的風險控制靠的是"算法師",類似會計師一樣的職業(yè),對大數(shù)據(jù)的準確度或有效性進行鑒定。這能在一定程度上防止數(shù)據(jù)濫用的發(fā)生和數(shù)據(jù)獨裁。當今的法律亦需對大數(shù)據(jù)監(jiān)管進行修訂補充。

當代大數(shù)據(jù)發(fā)展主要由科技公司推動,相信在不久的將來更多的傳統(tǒng)領域會意識到大數(shù)據(jù)的重要性。但我們也應該保持清醒,大數(shù)據(jù)并不是萬能藥,對某些領域或環(huán)節(jié),使用大數(shù)據(jù)是一種簡單且實用的'選擇;但對某些領域,盲目使用大數(shù)據(jù)只會適得其反。

大學生大數(shù)據(jù)心得體會 篇2

大數(shù)據(jù)時代已經(jīng)悄然到來,如何應對大數(shù)據(jù)時代帶來的挑戰(zhàn)與機遇,是我們當代大學生特別是我們計算機類專業(yè)的大學生的一個必須面對的嚴峻課題。大數(shù)據(jù)時代是我們的一個黃金時代,對我們的意義可以說就像是另一個“80年代”。 在講座中秦永彬博士由一個電視劇《大太監(jiān)》中情節(jié)來深入淺出的簡單介紹了“大數(shù)據(jù)”的基本概念,并由“塔吉特”與“犯罪預測”兩個案例讓我們深切的體會到了“大數(shù)據(jù)”的對現(xiàn)今這樣一個信息時代的不可替代的巨大作用。

在前幾年本世紀初的時候,世界都稱本世紀為“信息世紀”。確實在計算機技術與互聯(lián)網(wǎng)技術的飛速發(fā)展過后,我們面臨了一個每天都可以“信息爆炸”的時代。打開電視,打開電腦,甚至是在街上打開手機、PDA、平板電腦等等,你都可以接收到來自互聯(lián)網(wǎng)從世界各地上傳的各類信息:數(shù)據(jù)、視頻、圖片、音頻……這樣各類大量的數(shù)據(jù)累積之后達到了引起量變的臨界值,數(shù)據(jù)本身有潛在的價值,但價值比較分散;數(shù)據(jù)高速產(chǎn)生,需高速處理。大數(shù)據(jù)意味著包括交易和交互數(shù)據(jù)集在內(nèi)的所有數(shù)據(jù)集,其規(guī)模或復雜程度超出了常用技術按照合理的成本和時限捕捉、管理及處理這些數(shù)據(jù)集的能力。遂有了“大數(shù)據(jù)”技術的應運而生。

現(xiàn)在,當數(shù)據(jù)的積累量足夠大的時候到來時,量變引起了質(zhì)變。“大數(shù)據(jù)”通過對海量數(shù)據(jù)有針對性的分析,賦予了互聯(lián)網(wǎng)“智商”,這使得互聯(lián)網(wǎng)的作用,從簡單的數(shù)據(jù)交流和信息傳遞,上升到基于海量數(shù)據(jù)的分析,一句話“他開始思考了”。簡言之,大數(shù)據(jù)就是將碎片化的海量數(shù)據(jù)在一定的時間內(nèi)完成篩選、分析,并整理成為有用的資訊,幫助用戶完成決策。借助大數(shù)據(jù)企業(yè)的決策者可以迅速感知市場需求變化,從而促使他們作出對企業(yè)更有利的決策,使得這些企業(yè)擁有更強的創(chuàng)新力和競爭力。這是繼云計算、物聯(lián)網(wǎng)之后IT產(chǎn)業(yè)又一次顛覆性的技術變革,對國家治理模式、對企業(yè)的決策、組織和業(yè)務流程、對個人生活方式都將產(chǎn)生巨大的影響。后工業(yè)社會時代,隨著新興技術的發(fā)展與互聯(lián)網(wǎng)底層技術的革新,數(shù)據(jù)正在呈指數(shù)級增長,所有數(shù)據(jù)的產(chǎn)生形式,都是數(shù)字化。如何收集、管理和分析海量數(shù)據(jù)對于企業(yè)從事的一切商業(yè)活動都顯得尤為重要。

大數(shù)據(jù)時代是信息化社會發(fā)展必然趨勢,我們只有緊緊跟隨時代發(fā)展的潮流,在技術上、制度上、價值觀念上做出迅速調(diào)整并牢牢跟進,才能在接下來新一輪的競爭中擺脫受制于人的弱勢境地,才能把握發(fā)展的方向。

首先,“大數(shù)據(jù)”究竟是什么?它有什么用?這是當下每個人初接觸“大數(shù)據(jù)”都會有的疑問,而這些疑問在秦博士的講座中我們都了解到了。“大數(shù)據(jù)”的“大”不僅是單單純純指數(shù)量上的“大”,而是在諸多方面上闡釋了“大”的含義,是體現(xiàn)在數(shù)據(jù)信息是海量信息,且在動態(tài)變化和不斷增長之上。同時“大數(shù)據(jù)”在:速度(Velocity)、多樣性(Variety)、價值密度(Value)、體量(Volume)這四方面(4v)都有體現(xiàn)。其實“大數(shù)據(jù)”歸根結(jié)底還是數(shù)據(jù),其是一種泛化的數(shù)據(jù)描述形式,有別于以往對于數(shù)據(jù)信息的表達,大數(shù)據(jù)更多地傾向于表達網(wǎng)絡用戶信息、新聞信息、銀行數(shù)據(jù)信息、社交媒體上的數(shù)據(jù)信息、購物網(wǎng)站上的用戶數(shù)據(jù)信息、規(guī)模超過TB級的數(shù)據(jù)信息等。

了解了“大數(shù)據(jù)”的“大”之后我們也該了解它所具有的巨大價值。就目前來說“大數(shù)據(jù)”的來源主要還是互聯(lián)網(wǎng),來自互聯(lián)網(wǎng)上的大多數(shù)不被重視信息都是具有巨大開發(fā)價值的,

其具有巨“大”的商業(yè)價值,我們所缺少的只是一些數(shù)據(jù)分析等手段。例如:在如今,網(wǎng)購已經(jīng)成為了一種風潮,網(wǎng)上也涌現(xiàn)了以淘寶、京東、亞馬遜等一系列的購物網(wǎng)站。而在這些網(wǎng)站之中,顧客的瀏覽記錄,購買記錄等等都是一些巨大商業(yè)價值的信息。借鑒“塔吉特”的先例,我們可以利用“大數(shù)據(jù)”技術收集分析,就可預測需求、供給和顧客習慣等,做到精準采購、精準投放,達到利益放大的效果。 從全球范圍來看,很多人都把20xx年看做是大數(shù)據(jù)時代的元年。在這一年里,很多行業(yè)在大數(shù)據(jù)方面的管理、規(guī)劃和應用已經(jīng)覺醒。電商、金融、電信等行業(yè)數(shù)據(jù)有著長期的數(shù)據(jù)積累。事實上,很多互聯(lián)網(wǎng)公司,例如亞馬遜、Google、騰訊,更愿意將自己定位為數(shù)據(jù)企業(yè)。因為信息時代,數(shù)據(jù)成為經(jīng)營決策的強有力依據(jù),給企業(yè)帶來了發(fā)展和引領行業(yè)的機遇。銀行也同樣擁有豐富的數(shù)據(jù)礦藏,不僅存儲處理了大量結(jié)構化的賬務數(shù)據(jù),而且隨著銀行渠道快速滲透到社交網(wǎng)絡、移動端等媒介,海量的非結(jié)構化數(shù)據(jù)也在等待被收集和分析。未來的金融業(yè)將更多地受到科技創(chuàng)新力的驅(qū)動,也越來越傾向于零售營銷:對于金融業(yè)來說,大數(shù)據(jù)意味著巨大的商機,可強化客戶體驗,提高客戶忠誠度。大數(shù)據(jù)技術的發(fā)展帶來企業(yè)經(jīng)營決策模式的轉(zhuǎn)變,驅(qū)動著行業(yè)變革,衍生出新的商機和發(fā)展契機。駕馭大數(shù)據(jù)的能力已被證實為領軍企業(yè)的核心競爭力,這種能力能夠幫助企業(yè)打破數(shù)據(jù)邊界,繪制企業(yè)運營全景視圖,做出最優(yōu)的商業(yè)決策和發(fā)展戰(zhàn)略。金融行業(yè)在大數(shù)據(jù)浪潮中,要以大數(shù)據(jù)平臺建設為基礎,夯實大數(shù)據(jù)的收集、存儲、處理能力;重點推進大數(shù)據(jù)人才的梯隊建設,打造專業(yè)、高效、靈活的大數(shù)據(jù)分析團隊;不斷提升企業(yè)智商,挖掘海量數(shù)據(jù)的商業(yè)價值,從而在數(shù)據(jù)新浪潮的變革中拔得頭籌,贏得先機

在如此快速的到來的大數(shù)據(jù)革命時代,我們還有很多知識需要學習,許多思維需要轉(zhuǎn)變,許多技術需要研究。職業(yè)規(guī)劃中,也需充分考慮到大數(shù)據(jù)對于自身職業(yè)的未來發(fā)展所帶來的機遇和挑戰(zhàn)。當我們掌握大量數(shù)據(jù),需要考慮有多少數(shù)字化的數(shù)據(jù),又有哪些可以通過大數(shù)據(jù)的分析處理而帶來有價值的用途?在大數(shù)據(jù)時代制勝的良藥也許是創(chuàng)新的點子,也許可以利用外部的數(shù)據(jù),通過多維化、多層面的分析給我們?nèi)蘸髣?chuàng)業(yè)帶來價值。借力,順勢,合作共贏。把自己的心門打開,像海綿般吸取積極、正能量的東西。

大學生大數(shù)據(jù)心得體會 篇3

奧倫·艾奇奧倫(Oren Etzioni)創(chuàng)立的從文本中挖掘信息的公司ClearForest,已經(jīng)被路透社收購。

美國股市每天成交量高達70億股,而其中三分二的交易都是由建產(chǎn)在數(shù)學模型和算法之上的計算機程序自動完成的。

farecast經(jīng)過了20xx年立項,到20xx年被收購。經(jīng)歷了5年的時間,數(shù)據(jù)從最早了120xx條到20xx億條。

大數(shù)據(jù)的平臺有:谷歌的MAPREDUCE 和開源HADOOP平臺(最初源于雅虎)。NOSQL更優(yōu)先于MYSQL.

大數(shù)據(jù)所用的數(shù)據(jù)記錄單位:拍字節(jié)PB(2的50次方)和艾字節(jié)EB(2的60次方),澤字節(jié)ZB (2的70次方),太字節(jié)TB。1EB=10億GB。1ZB=1024EB

20xx年,所有數(shù)據(jù)中只有7%是存儲在報紙、書籍、圖片等媒價上的模擬數(shù)據(jù),其余全部是數(shù)字數(shù)據(jù)。

20xx年世界上存儲的數(shù)據(jù)預計能達到約1.2澤字節(jié),其中非數(shù)字數(shù)據(jù)只占不到2%。

人類存儲信息量的增長速度比世界經(jīng)濟的增長速度快4倍。而計算機數(shù)據(jù)處理能力的增長速度則比世界經(jīng)濟的增長速度快9倍。

大數(shù)據(jù)告訴我們“是什么”而不是“為什么”。在大數(shù)據(jù)時代,我們不必知道現(xiàn)象背后的原因。

大數(shù)據(jù)的算法從因果關系向相關關紗轉(zhuǎn)化。這也是思維方式的轉(zhuǎn)變。

推薦電影《點球成金》MONEYBALL

大數(shù)據(jù)的三個思維方式:

1、不要依靠分析少量的數(shù)據(jù)樣本,不要抽樣調(diào)查。要分析與某事物相關的所有數(shù)據(jù)。

2、不要追求精確性,要樂于接受紛繁復雜的數(shù)據(jù)。

3、不要探求難以捉摸的因果關系,轉(zhuǎn)而關注事物的相關關系。

大數(shù)據(jù)中的“大”不是絕對意義上的大,雖然在大多數(shù)情況下是這個意思。大數(shù)據(jù)是指不用隨機分析法這樣的捷徑,而采用所有數(shù)據(jù)的方法。

LYTOR相機(光場相機)就是對拍照場景的應用。將傳統(tǒng)相機的拍攝照片的樣本進行全收集,成為樣本=總體的應用代表。

意外的案例:

如果把一個在社區(qū)內(nèi)有很多連接關系的人從社區(qū)關系網(wǎng)中剔除掉,這個關系網(wǎng)會變得沒那么高效,但卻不會解體。但是如果把一個與所在社區(qū)之外的很多人有著連接關系的人從這個關系網(wǎng)中剔除,整個關系網(wǎng)奶快就會破碎成很多的小塊。節(jié)點的做用。

社交網(wǎng)絡的多樣性是有額外價值的。這是一個人在社會關系網(wǎng)中的存在價值。

互聯(lián)網(wǎng)可以使數(shù)據(jù)達到精確嗎?只有5%的數(shù)據(jù)是結(jié)構化且能適用于傳統(tǒng)數(shù)據(jù)庫的。如果不接受混亂,剩下的95%的非結(jié)構化數(shù)據(jù)都無法被利用。只有接受不精確性,我們才能打開一扇從未涉足的世界的窗戶。

數(shù)據(jù)與算法那個更重要呢?簡單的算法+大數(shù)據(jù),還是復雜的算法+小數(shù)據(jù)。結(jié)論就是大數(shù)據(jù)比算法智能系統(tǒng)更重要。

大學生大數(shù)據(jù)心得體會 篇4

這本書里主要介紹的是大數(shù)據(jù)在現(xiàn)代商業(yè)運作上的應用,以及它對現(xiàn)代商業(yè)運作的影響。

《大數(shù)據(jù)時代》這本書的結(jié)構框架遵從了學術性書籍的普遍方式。也既,從現(xiàn)象入手,繼而通過對現(xiàn)象的解剖提出對這一現(xiàn)象的解釋。然后在通過解釋在對未來進行預測,并對未來可能出現(xiàn)的問題提出自己看法與對策。

下面來重點介紹《大數(shù)據(jù)時代》這本書的主要內(nèi)容。

《大數(shù)據(jù)時代》開篇就講了Google通過人們在搜索引擎上搜索關鍵字留下的數(shù)據(jù)提前成功的預測了20xx年美國的H1N1的爆發(fā)地與傳播方向以及可能的潛在患者的事情。Google的預測比政府提前將近一個月,相比之下政府只能夠在流感爆發(fā)一兩個周之后才可以弄到相關的數(shù)據(jù)。同時Google的預測與政府數(shù)據(jù)的相關性高達97%,這也就意味著Google預測數(shù)據(jù)的置信區(qū)間為3%,這個數(shù)字遠遠小于傳統(tǒng)統(tǒng)計學上的常規(guī)置信區(qū)間5%!而這個數(shù)字就是大數(shù)據(jù)時代預測結(jié)果的相對準確性與事件的可預測性的最好證明!通過這一事以及其他的案例,維克托提出了在大數(shù)據(jù)時代“樣本=總體”的思想。我們都知道當樣本無限趨近于總體的時候,通過計算得到的描述性數(shù)據(jù)將無限的趨近于事件本身的性質(zhì)。而之前采取的“樣本<總體”的做法很大程度上無法做到更進一步的描述事物,因為之前的時代數(shù)據(jù)的獲取與存儲處理本身有很大的難度只導致人們采取抽樣的方式來測量事物。而互聯(lián)網(wǎng)終端與計算機的出現(xiàn)使數(shù)據(jù)的獲取、存儲與處理難度大大降低,因而相對準確性更高的“樣本=總體”的測算方式將成為大數(shù)據(jù)時代的主流,同時大數(shù)據(jù)時代本身也是建立在大批量數(shù)據(jù)的存儲與處理的基礎之上的。

接下來,維克多又通過了IBM追求高精確性的電腦翻譯計劃的失敗與Google只是將所有出現(xiàn)過的相應的文字語句掃描并儲存在詞庫中,所以無論需要翻譯什么,只要有聯(lián)系Google詞庫就會出現(xiàn)翻譯,雖然有的時候的翻譯很無厘頭,但是大多數(shù)時候還是正確的,所以Google的電腦翻譯的計劃的成功,表明大數(shù)據(jù)時代對準確性的追求并不是特別明顯,但是相反大數(shù)據(jù)時代是建立在大數(shù)據(jù)的基礎住上的,所以大數(shù)據(jù)時代追求的是全方位覆蓋的數(shù)字測度而不管其準確性到底有多高,因為大量的數(shù)據(jù)會湮埋少數(shù)有問題的數(shù)據(jù)所帶來的影響。同時大量的數(shù)據(jù)也會無限的逼近事物的原貌。

之后,維克托又預測了一個在大數(shù)據(jù)時代催生的重要職業(yè)——數(shù)據(jù)科學家,這是一群數(shù)學家、統(tǒng)計學與編程家的綜合體,這一群人將能夠從獲取的數(shù)據(jù)中得到任何他們想要的結(jié)果。換言之,只要數(shù)據(jù)充足我們的一切外在的與內(nèi)在的我們不想讓他人知道的東西都見會在這一群家伙的面前展現(xiàn)得淋漓盡致。所以為了避免個人隱私在大數(shù)據(jù)時代被這一群人利用,維克托建議將這一群人分為兩部分,一部分使用數(shù)據(jù)為商業(yè)部門服務,而另一群人則負責審查這一些人是否合法的獲得與應用數(shù)據(jù),是否侵犯了個人隱私。

無論如何,大數(shù)據(jù)時代將會到來,不管我們接受還是不接受!

我覺得《大數(shù)據(jù)時代》這本書寫的很好,很值得一讀。因為會給我們很多啟發(fā),比如你在相關的社交網(wǎng)站發(fā)表的言論或者照片都很有可能被“數(shù)據(jù)科學家”們利用,從而再將相關數(shù)據(jù)賣給各大網(wǎng)店。不過,事實就是我們將會成為被預測被引誘的對象。所以說,小心你在網(wǎng)上留下的痕跡。Dsbj1.COM

我喜歡這本書是因為它給我展現(xiàn)了一個新的世界。

大學生大數(shù)據(jù)心得體會 篇5

讀了《大數(shù)據(jù)時代》后,感覺到一個大變革的時代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結(jié)”或顛覆一些傳統(tǒng)上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強烈震撼,不禁戰(zhàn)栗起來。

“在小數(shù)據(jù)時代,我們會假象世界是怎樣運作的,然后通過收集和分析數(shù)據(jù)來驗證這種假想。”“隨著由假想時代到數(shù)據(jù)時代的過渡,我們也很可能認為我們不在需要理論了。”書中幾乎肯定要顛覆統(tǒng)計學的理論和方法,也試圖通過引用《連線》雜志主編安德森的話“量子物理學的理論已經(jīng)脫離實際”來“終結(jié)”量子力學。對此我很高興,因為統(tǒng)計學和量子力學都是我在大學學習時學到抽筋都不能及格的課目。但這兩個理論實在太大,太權威,太基本了,我想我不可能靠一本書就能擺脫這兩個讓我頭疼一輩子的東西。作者其實也不敢旗幟鮮明地提出要顛覆它們的論點,畢竟還是在前面加上了“很可能認為”這樣的保護傘。

近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應該做到的就是要破和立,要改變自己的傳統(tǒng),跟上時代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會被扣上思想僵化甚至阻礙世界發(fā)展的大帽子。既然大數(shù)據(jù)是“通往未來的必然改變”,那我就必須“不受限于傳統(tǒng)的思維模式和特定領域里隱含的固有偏見”,跟作者一起先把統(tǒng)計學和量子力學否定掉再說。反正我也不喜歡、也學不會它們。

當我們?nèi)祟惖臄?shù)據(jù)收集和處理能力達到拍字節(jié)甚至更大之后,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性后,似乎真的可以拋棄以抽樣調(diào)查為基礎的統(tǒng)計學了。但是由統(tǒng)計學和量子力學以及其他很多“我們也很可能認為我們不再需要的”理論上溯,它們幾乎都基于一個共同的基礎——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔心了!

《大數(shù)據(jù)時代》第16頁“大數(shù)據(jù)的核心就是預測”。邏輯是——描述時空信息“類”與“類”之間長時間有效不變的先后變化關系規(guī)則。兩者似乎是做同一件事。可大數(shù)據(jù)要的“不是因果關系,而是相關關系”,“知道是什么就夠了,沒必要知道為什么”,而邏輯學四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規(guī)定”任何事物都有其存在的充足理由。且邏輯推理三部分——歸納邏輯、溯因邏輯和演繹邏輯都是基于因果關系。兩者好像又是對立的。在同一件事上兩種方法對立,應該只有一個結(jié)果,就是要否定掉其中之一。這就是讓我很擔心的原因。

可我卻不能拭目以待,像旁觀者一樣等著哪一個“脫穎而出”,因為我身處其中。問題不解決,我就沒法思考和工作,自然就沒法活了!更何況還有兩個更可怕的事情。

其一:量子力學搞了一百多年,為了處理好混雜性問題,把質(zhì)量和速度結(jié)合到能量上去了,為了調(diào)和量子力學與相對論的矛盾,又搞出一個量子場論,再七搞八搞又有了蟲洞和羅森橋,最后把四維的時空彎曲成允許時間旅行的樣子,恨不得馬上造成那可怕的時間旅行機器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關系,因為爸爸就是爸爸,兒子就是兒子。那么大數(shù)據(jù)會不會通過正視混雜性,放棄因果關系最后反而搞出時間機器,讓爸爸不再是爸爸,兒子不再是兒子了呢?其二:人和機器的根本區(qū)別在于人有邏輯思維而機器沒有。《大數(shù)據(jù)時代》也擔心“最后做出決策的將是機器而不是人”。如果真的那一天因為放棄邏輯思維而出現(xiàn)科幻電影上描述的機器主宰世界消滅人類的結(jié)果,那我還不如現(xiàn)在就趁早跳樓。

還好我知道自己對什么統(tǒng)計學、量子力學、邏輯學和大數(shù)據(jù)來說都是門外漢,也許上面一大篇都是在胡說八道,所謂的擔心根本不存在。但問題出現(xiàn)了,還是解決的好,不然沒法睡著覺。自己解決不了就只能依靠專家來指點迷津。

所以想向《大數(shù)據(jù)時代》的作者提一個合理化建議:把這本書繼續(xù)寫下去,至少加一個第四部分——大數(shù)據(jù)時代的邏輯思維。

文章來源://www.wz2.com.cn/dushubiji/142749.html

猜你喜歡