999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據究竟是什么

2018-10-21 11:01:47汪暉
老年博覽·上半月 2018年11期
關鍵詞:百度汽車思維

汪暉

機器智能離不開數據,那么大量的數據和現在大家所說的大數據是不是一回事呢?如果不是,它們之間又有什么聯系和區別呢?

毫無疑問,大數據的數據量自然是非常大的,但是光是量大還不是我們所說的大數據。比如過去國家統計局的數據量也很大,但那并不是真正意義上的大數據。這兩者的差別我們可以從三個方面來看。

第一,大數據具有多維度性質,而不同維度之間有著天然的(而非人為的)聯系。為了說明這一點,我們不妨看一個實際的例子。

2013年9月,百度發布了一個頗有意思的統計結果:中國十大“吃貨”省市排行榜。百度沒有做任何民意調查和對各地飲食習慣的研究,只是從“百度知道”的7700萬條和吃有關的問題里“挖掘”出來一些結論:在有關“××能吃嗎”的問題中,福建、浙江、廣東、四川等地的網友最常問的是“××蟲能吃嗎”,江蘇、上海、北京等地的網友最常問“××的皮能不能吃”,內蒙古、新疆、西藏的網友最關心的是“蘑菇能吃嗎”,而寧夏網友最關心的竟然是“螃蟹能吃嗎”!寧夏網友的問題一定會讓福建的網友大跌眼鏡。

百度做的這件事其實就是大數據的一個典型應用。它有這樣一些特點:首先,它的數據量非常大。其次,這些數據的維度非常多,不僅涉及食物的做法、吃法、營養價值、價格等,而且包含了提問者的很多信息,如互聯網IP地址、所用的計算機(或者手機)型號、瀏覽器的種類等等。這些維度并不是明確地給出的(這一點和傳統的數據庫不一樣),因此在外人看來,這些原始的數據“相當雜亂”,但恰恰是這些看上去雜亂無章的數據,將原來看似無關的維度聯系了起來。經過對這些信息的挖掘、加工和整理,就得到了有意義的統計規律。

百度只是公布了一點點大家感興趣的結果,其實它還完全可以從這些數據中得到更多有價值的統計結果。比如,它很容易得到不同年齡、性別和文化背景的人(這些很容易挖掘出來)的飲食習慣,不同生活習慣的人(比如正常作息的、夜貓子,經常出差的或者不愛運動的)的飲食習慣等等。如果百度的數據收集時間跨度足夠長,它還可以看出不同地區人們飲食習慣的變化,尤其是在不同經濟發展階段飲食習慣的改變。而這些看似很簡單的問題,沒有這些大數據,還真是很難得到答案。這就是大數據多維度的威力。

大數據的第二個特點在于它的完備性。為了說明這一點,讓我們再來看一個實例。從1932年開始,蓋洛普一直在對美國總統選舉進行預測。幾十年來它不斷改進采樣方法,力求使統計結果準確。但是在過去的幾十年,它對美國大選結果的預測可以講是大局(全國)尚準確,但是細節(每一個州)常常出錯。因為再好的采樣方法,也有考慮不周全之處。

但是到了2 0 1 2年總統選舉時,這種“永遠預測不準”的情況得到了改變。一位名不見經傳的統計學家Nate Silver通過對互聯網上能夠獲得的大量數據(包括社交網絡上用戶發表的信息、新聞信息和其他網絡信息)進行大數據分析,準確地預測了全部50個州的選舉結果。Silver并沒有多么好的采樣方法,只是收集的數據很完備。

數據的完備性的作用遠比準確預測一次總統選舉大得多,谷歌無人駕駛汽車便是一個很好的例子。無人駕駛汽車可以算是一個機器人,它能像人一樣對各種隨機突發性事件快速做出判斷。

2004年,經濟學家們還認為駕駛員是人工智能很難取代的。當然,他們不是憑空得出這個結論的。除分析了技術上和心理上的難度外,他們還參考了當年DARPA組織的自動駕駛汽車拉力賽的結果—當時排名第一的汽車花了幾小時才開出8英里,然后就拋錨了。但是僅僅過了6年,谷歌的自動駕駛汽車不僅研制出來了,而且在高速公路和繁華的市區行駛了14萬英里,沒有出過一次事故。

為什么谷歌能在不到6年的時間里做到這一點呢?最根本的原因是谷歌的思維方式和以往的科學家們都不同—他們把這個機器人的問題變成了一個大數據的問題。

首先,自動駕駛汽車項目是谷歌街景項目的延伸。谷歌的自動駕駛汽車只能去它“掃過街”的地方,在行駛到這些地方時,它對周圍的環境是非常了解的,而過去那些研究所里研制的自動駕駛汽車,每到一處都要臨時識別目標,這是人的思維方式。

其次,谷歌的自動駕駛汽車上裝了十幾個傳感器,每秒進行幾十次各種掃描。這不僅超過了人所謂的“眼觀六路,耳聽八方”,而且積攢下來的大量數據使它對各地的路況以及不同交通狀況下車輛行駛的模式有了準確的了解。計算機學習這些“經驗”的速度遠遠比人快。依靠這些,谷歌才能在非常短的時間里實現汽車的自動駕駛。

大數據的第三個特征在它的英文表述“big data”這個詞中體現得很清楚。請注意,這里使用的是big data,而不是large data。這兩個表述有什么區別呢?big主要是強調抽象意義上的大,而large是強調數量(或者尺寸)大。big data不僅表示數據量大,更重要的是強調了思維方式的不同。這種以數據為主的新做法,在某種程度上顛覆了人們長期以來在科學和工程上的方法論。

過去,我們強調一件事的因果關系,通過前提和假設推導出結果。但是在大數據時代,由于數據的完備性,我們常常是先知道結論,再去找原因(甚至不去找原因)。事實上,在一些擁有大數據的IT公司,包括谷歌、阿里巴巴等,今天已經在按照這種思維方式做事了。谷歌的產品比競爭對手好,主要不是靠技術,而是靠它的數據比對手的更完備,同時它愿意用數據來解決問題。阿里巴巴的小額貸款業務能做起來,也是利用了大數據思維。這是一種我們以前完全沒見過的新的思維方式,一種新的方法論。

大數據的這三個特點導致人工智能和人具有完全不同的特點。它不是通過邏輯推理歸納演繹得出結論,而是利用大數據的完備性和多維度特點直接找到答案。而大數據的完備性讓機器有可能比人更能夠掌控全局,或者說幫助決策者更好地掌握全局。

猜你喜歡
百度汽車思維
思維跳跳糖
思維跳跳糖
思維跳跳糖
思維跳跳糖
Robust adaptive UKF based on SVR for inertial based integrated navigation
百度年度熱搜榜
青年與社會(2018年2期)2018-01-25 15:37:06
汽車的“出賣”
汽車們的喜怒哀樂
百度遭投行下調評級
IT時代周刊(2015年8期)2015-11-11 05:50:22
3D 打印汽車等
決策探索(2014年21期)2014-11-25 12:29:50
主站蜘蛛池模板: 麻豆精选在线| 亚洲色图欧美在线| 久久精品视频亚洲| 亚洲一区国色天香| 九九热精品视频在线| 亚洲Aⅴ无码专区在线观看q| 久久综合国产乱子免费| 99re视频在线| 亚洲精品视频免费观看| 国产欧美日本在线观看| 亚洲视频三级| 欧亚日韩Av| 国产精品尹人在线观看| 国产欧美高清| 日韩乱码免费一区二区三区| 久久亚洲国产一区二区| 五月天综合网亚洲综合天堂网| 午夜国产精品视频| 福利姬国产精品一区在线| 国产一级精品毛片基地| 国产呦精品一区二区三区网站| 九九热视频在线免费观看| 亚洲AV成人一区二区三区AV| 日韩123欧美字幕| 亚洲国产日韩视频观看| h视频在线观看网站| 97超级碰碰碰碰精品| 天天操天天噜| 九九九国产| 日韩免费中文字幕| 国产精品99久久久| 国产福利在线免费| 欧美黑人欧美精品刺激| 午夜电影在线观看国产1区| 国产在线视频导航| 福利小视频在线播放| 国产精品无码AV中文| 朝桐光一区二区| 极品尤物av美乳在线观看| 日韩国产一区二区三区无码| 成人福利在线视频| www精品久久| 国产在线视频二区| 国产精品永久在线| 亚洲第一视频网站| 国产一级毛片在线| 日本高清成本人视频一区| 国产麻豆精品久久一二三| 永久毛片在线播| 国产成人1024精品| 亚洲熟女中文字幕男人总站| 最新日本中文字幕| 九色视频在线免费观看| 毛片网站在线看| 中字无码精油按摩中出视频| 狠狠v日韩v欧美v| 高潮毛片无遮挡高清视频播放| 国产成人精品一区二区免费看京| 国产在线第二页| 强奷白丝美女在线观看| 国产91精品最新在线播放| 欧洲欧美人成免费全部视频| 亚洲无码视频一区二区三区| 国产在线专区| 中文字幕 日韩 欧美| 91色老久久精品偷偷蜜臀| 中国国语毛片免费观看视频| 亚洲欧美不卡| 亚洲首页国产精品丝袜| 日本午夜三级| 日韩最新中文字幕| 亚洲伊人电影| 欧美综合中文字幕久久| 国产a v无码专区亚洲av| 久996视频精品免费观看| 成人免费黄色小视频| 亚洲免费黄色网| 无码电影在线观看| 国产精品一老牛影视频| 色欲综合久久中文字幕网| 日本一本正道综合久久dvd | 欧美日韩精品在线播放|