資訊中心 Info
當前位置:愛尚教育 > 資訊中心 >
什么是大數據?讓你秒懂
發布日期:2021-07-23 閱讀次數:

1、什么是大數據

從字面的意思來看,大數據就是大量的數據。業界一般認為數據量達到普通的設備存不下,算不動的程度,就可以稱之為大數據了。

大數據到底有多大

普通個人電腦所能存儲的數據,一般是幾百個GB到幾個TB的級別。

例如,常見的固態硬盤,512GB就已經比較大了;常見的機械硬盤,可達1TB/2TB/4TB的容量。

表達數據容量的KB,MB,GB和TB之間的關系,大家應該都很熟悉了:

KB(Kilo Byte)— 千字節,也就是1024B

MB(Mega Byte)— 兆字節,也就是1024KB

GB(Giga Byte)— 吉字節,也就是1024MB

TB(Tera Byte)— 太字節,也就是1024GB

而大數據是什么級別呢?PB/EB級別。其實就是在TB的基礎上每一級接著乘以1024。

PB(Peta Byte)— 皮字節,也就是1024TB

EB(Exa Byte)— 艾字節,也就是1024PB

ZB(Zetta Byte)— 澤字節,也就是1024EB

YB(Yotta Byte)— 堯字節,也就是1024ZB

上述的這些大的單位在日常生活中幾乎接觸不到,而且常人也已經無法直觀地感受到這些單位能大到什么讓人吃驚的程度。下面我們舉個簡單的例子來說明。

一本《紅樓夢》:純文本(未壓縮),約2MB

一張1200萬像素的照片(未壓縮):約34MB

一部90分鐘的電影(H.264編碼):約2.5GB(也就是2500MB)

這樣算下來,一塊1TB的硬盤大約可以存儲50萬本電子書,3萬張圖片,400部電影。假定三天時間看完一本書,這50萬本就需要4000多年才能看完。

1PB的容量大約可存儲5億本書,3千萬張圖片,或40萬部90分鐘的電影。看書的時間過于夸張就不說了,這些電影也需要持續近140年時間才能看完。

1EB這個單位的龐大已經超乎了人們的想象,僅僅存放這些數據需要大約2000個機柜的存儲設備。

如果并排放這些機柜,可以連綿1.2公里那么長。如果擺放在機房里,需要21個標準籃球場那么大的機房,才能放得下。

真的有企業會產生如此海量的數據嗎?

事實上,阿里、百度、騰訊這樣的互聯網巨頭,因為其擁有數億的用戶,這些海量用戶產生的數據量早已超越PB級,接近EB級。

2、大數據是怎樣產生的?

隨著互聯網,物聯網的發展,萬事萬物皆可連接,皆可源源不斷地產生數據,從涓涓細流匯聚成汪洋大海。

經過移動互聯網的大爆發,中國的上網用戶數已經約等于智能手機的用戶數,通過4G網絡隨時連接,實時在線。

這些用戶在手機上的每一次滑動和點擊,都會被各式各樣的APP上傳并存儲,以及在微博,微信,知乎,抖音等各種社交或者UGC類APP上創作的文本,圖片和視頻,形成海量的數據。

物聯網方面也不遑多讓。據GSMA智庫預測,到2025年全球將會有18億移動物聯網連接(總共31億蜂窩物聯網連接),以及138億工業物聯網連接,其中63億在亞太地區和中國,占總數的65%。

如果放在以前,計算機的硬件(存儲,計算)等資源還很金貴的情況下,這些數據只能是經過簡單匯總之后就被丟掉。

然而隨著技術的發展,計算機硬件的存儲和計算能力越來越強,越來越不值錢,這些原本被認為食之無肉棄之有味數據才能被大量存儲和處理,并挖掘價值。

目前微信擁有11億的用戶,每天發送數百億條消息,還有朋友圈,支付,掃一掃,搖一搖等多種行為都存儲在微信的后臺。

如果要從這些海量數據中分析所有微信用戶的行為習慣,比如每天的使用時長,偏好發語音還是文字,對哪些類型的公眾號感興趣等數據就沒有那么簡單了。這就是各種大數據技術誕生及發展的驅動力。

(文章來源于網絡)

优彩-网址