
“大數據已死。”
說這話的,正是來自Google十年員工,數據分析產品BigQuery創始成員之一,Jordan Tigani。
在最新發布的一篇博文中,他表示——
(相關資料圖)
大數據概念在十多年前開始興起,時至今日,銷售們仍用“海量數據帶來指數級增長曲線”說法,來勾起(唬住)客戶為相關服務買單的欲望,否則就將被數字時代拋棄。作者自己也曾是其中之一。
但現在,Jordan Tigani不僅認為這種說法行不通,還稱——“數據大小根本不是問題所在。”
那么問題在哪?他認為,我們已無需擔心數據大小,而應專注于如何使用數據來做出更好的決策。
如此言論之下,也吸引了不少業內人士的圍觀和熱議。
他的上述觀點有何依據?
不妨從證明過程看起。
值得注意的是,作者表示,證明過程中相關圖表曲線并不是嚴格參考了數據,而是憑記憶手繪的,這位資深從業者強調——重要的是曲線形狀趨勢,而非確切數值。
“恐嚇”客戶的話術出問題了
Jordan Tigani先從一張PPT聊開去。
這是一條數據量隨時間增長,呈現指數級增長的曲線,在過去十年,幾乎每個大數據產品推銷都從該曲線開啟。他曾就職的谷歌、SingleStore都不例外。
亮出曲線后,銷售們會順勢鼓吹產品,告訴客戶——大數據時代來了!你需要我手里的產品服務!
但Jordan Tigani認為,多年來的事實已證明,處理數據的老方法已經行不通了,且大多數應用程序也不需要處理大量數據。
一個佐證是近些年傳統架構的數據管理系統復興,諸如SQLite、Postgres、MySQL都增長強勁,與之對比,“NoSQL”甚至“NewSQL”增長卻停滯不前。
一個明顯例子是MongoDB,它是排名最高的NoSQL類數據庫,也同樣是最火的橫向擴展類數據庫,此前幾年MongoDB增長勢頭強勁,但最近規模卻小幅下降,且與MySQL等主流數據庫仍存差距。
Jordan Tigani認為——如果大數據真是未來,那情況應該不一樣。
鼓吹大數據時代就在眼前的另一個說法是——每個人都會被產生的數據淹沒。
但Jordan Tigani在研究客戶中發現絕大多數客戶總數據存儲量不超過1TB,即便大型企業,其數據量級也soso。
根據他的從業經驗,所服務的最大客戶數據存儲量是第二大客戶的2倍,第二大客戶又是第三位的2倍。
這樣一來,客戶數據大小與數量服從冪律分布。
只有極少數客戶擁有PB級數據,成千上萬客戶每月存儲費用不超過10美元,而他們服務客戶存儲資源使用的中位數,連100GB都不到。
不僅作者本人這么認為,Gartner、Forrester等機構分析師及其他從業者也表示,大部分企業的數據庫量級都小于1TB,且100GB是常態。
拿一家超千名客戶的公司舉例,即便每個客戶每天下一個訂單,里面包含100項數據,每天生成數據仍小于1字節,三年后是1GB,而要達到1TB,這家公司得做幾千年生意。
另一個例子是之前作者接觸了一家E輪獨角獸公司,且還在快速成長中,但即便這樣,他們的財務數據、客戶數據、營銷跟蹤數據及服務日志加起來,也只有幾GB。
就這,能叫大數據?
還不算完,即便看“已有”部分,也有問題。
由于現代云平臺將存儲與計算分開,兩部分利用量級也有很大差距,即——數據存儲增長速度,遠大于計算資源需求增速。
具體來說,企業數據的存儲量隨時間推移,肯定是線性增加的,但大部分分析計算需求是針對近期數據,不可能一遍又一遍反復讀取舊數據。因此,計算需求不會同步迅速增加。
Jordan Tigani的一個客戶就是這樣。
作為全球頭部零售商,他們原有100TB本地數據,遷移到云上后,數據量變成了30PB,增加了300倍,如果計算資源需求也隨之拉滿,那他們在數據分析上的花費將達幾十億美元,但事實上,他們只花了很小一筆費用。
作者認為,大量計算服務不被需要,也就意味著前沿架構不太有必要,甚至分布式處理也Duck不必。
與之類似,分析數據的工作負載也遠小于數據體量。
多數時候,人們往往只會查詢前1小時、前1天或上周數據,較小的表會被頻繁查詢,但大表就不一定了。
在作者本人BigQuery工作經歷中,數據量巨大的客戶幾乎從不查詢大量數據,除非他們正在生成一些報告。
這種需求,也不要求性能優先,且僅是企業一周幾十萬個查詢中的極少數。
正如下圖,90%查詢任務涉及的數據量級不超過100MB,僅1%超過10GB,且即便查詢巨型表,數據庫也可通過一定處理,減少計算量和延遲。
一個側面佐證是——業內符合原本“大數據”定義的產品也在變少。
在當初,大數據的定義之一是“任何單機無法處理相關任務/場景需求”,比如00年代,數據工作負載對于單個商業計算機來說,帶不動是常態。
但今天,一個AWS的標準實例所用到的物理服務器包含了64核及256GB RAM,如果為優化實例再多掏一點錢,又能在原基礎上增加2個數量級RAM,這幾乎覆蓋所有工作負載需求。
既然大數據時代結束了,那是不是說,相關從業者要下崗了?
作者也提出了自己的看法——
結束了,但沒完全結束。
具體來說,作者認為,大數據的另一重內涵是“當數據保存的支出小于其挖掘價值,那就應該放棄”,因而,我們需要判定哪些數據需要及時清除,以及背后的原因,這將成為數據工作的重要部分。
這當中,也包括不同時期同一數據以不同字段存儲,需要有人來加以維護和留有記錄。
此外,基于相關監管規定,很多類型數據(比如涉及個人隱私的電話號碼)也需要定期清除。
再有,便是一些公司需要定期判斷哪些舊數據要清理,以避免未來可能的法律風險。(手動狗頭)
ChatGPT老板有不同看法
對于Jordan Tigani上述觀點及論證,有網友表示支持,還聯想到之前類似的工作經歷。
也有網友表示:
當XX已死,說明它真實被認可的地方會被保留下來。
值得一提的是,并非所有人都贊同作者的觀點。
尤其鑒于“XX已死”將話說得太滿,有網友認為:
在近期AI大火之際,判決AI所依賴的大數據已死,也是挺敢說。
當紅炸子雞ChatGPT背后老板Sam Altman,此前在舊金山一次技術活動中,也談過對大數據的看法,Sam認為——
AI研究領域取得令人印象深刻的進步,不僅依靠海量數據,同時更需要海量的計算。
上述觀點不僅強調了海量數據重要性,對比Jordan Tigani所認為的“重存儲輕計算”看法,正好相反。
另一個不同聲音來自一位名叫Lewis Gavin的大數據與軟件工程師,此前他曾在Medium上發文,主題也是圍繞“大數據是否消亡”
他認為:
大數據不會死,只會變得更重要。
所給出理由是:一方面依據是全球生成的數據總量仍在加速增長,且細分領域中,處理“大數據”正成為常態。
基于此,Lewis Gavin認為——所謂“大數據死亡”,只是營銷說法的消亡,但Big Data處理技術和應用仍存在,且它會成為習以為常的現象。
IDC于1月24日發布的一篇預測證明了大數據市場仍在增長,內容指出——
未來幾年,全球大數據和分析軟件市場將實現強勁增長,且具體到該板塊各細分領域,未來幾年增長率均為雙位數。
有意思的是,有網友提出“大數據的死亡”并不是個技術話題。
他表示:數據之所以沒發揮價值,其實是商界精英們往往忽略數據內蘊藏的結論。
另一位網友也表示贊同,還稱:
自己曾開玩笑,數據科學家的工作其實不是搞分析,而是為高管們前瞻性觀點提供有力證明。(手動狗頭)
關鍵詞:
網站首頁 |網站簡介 | 關于我們 | 廣告業務 | 投稿信箱
Copyright © 2000-2020 www.yjkq2010.com All Rights Reserved.
中國網絡消費網 版權所有 未經書面授權 不得復制或建立鏡像
聯系郵箱:920 891 263@qq.com
欧美色综合网_狠狠色狠色综合曰曰_麻豆精品一区二区av白丝在线_久久精品综合一区 制服丝袜亚洲播放| 成人aa视频在线观看| 精品亚洲aⅴ乱码一区二区三区| 奇米综合一区二区三区精品视频| 成人午夜av影视| 亚洲欧美另类小说视频| 国产成人亚洲综合a∨婷婷| 日韩一区二区视频| 欧美另类一区二区三区| 亚洲欧洲日韩综合一区二区| 粉嫩在线一区二区三区视频| 1区2区3区欧美| av亚洲产国偷v产偷v自拍| 亚洲日本青草视频在线怡红院| 成人综合激情网| 亚洲欧美综合网| 精品在线播放免费| 日韩亚洲欧美综合| 精东粉嫩av免费一区二区三区| 欧美日韩一级二级| 日本午夜一本久久久综合| 欧美一区二区高清| 亚洲一本大道在线| 欧美电影免费观看高清完整版| 免费看精品久久片| 亚洲女子a中天字幕| 欧美色精品天天在线观看视频| 伊人婷婷欧美激情| 91精品国产色综合久久ai换脸 | 精品粉嫩aⅴ一区二区三区四区| 亚洲天堂免费在线观看视频| 在线成人小视频| 麻豆精品视频在线观看免费| 日韩欧美一二三区| 欧美主播一区二区三区美女| 婷婷国产在线综合| 亚洲四区在线观看| 欧美一区二区三区男人的天堂| 久久国内精品视频| 午夜精品福利视频网站| 国产亚洲一区二区在线观看| 成人av午夜电影| 老司机免费视频一区二区| 久久精品一二三| av网站一区二区三区| 经典三级视频一区| 尤物视频一区二区| 国产精品久久久久久妇女6080| 色94色欧美sute亚洲线路一久| 日本中文一区二区三区| 午夜视频在线观看一区二区 | 亚洲视频图片小说| 日韩欧美在线综合网| 色88888久久久久久影院野外| 琪琪久久久久日韩精品| 中文字幕一区不卡| 亚洲欧洲精品天堂一级| 欧美xxxx老人做受| 欧美电影精品一区二区| 欧美色图天堂网| 不卡一卡二卡三乱码免费网站| 国产精品一区二区x88av| 午夜精品久久久久久久久| 亚洲女同女同女同女同女同69| 国产精品国产馆在线真实露脸| 欧美v国产在线一区二区三区| 欧美亚州韩日在线看免费版国语版| av资源站一区| 国产精品羞羞答答xxdd| 日韩黄色在线观看| 亚洲女厕所小便bbb| 国产色产综合产在线视频| 91精品国产入口| 7777精品伊人久久久大香线蕉完整版| 91在线视频在线| 日韩一区二区精品在线观看| 欧美日韩极品在线观看一区| 99国产精品视频免费观看| 大陆成人av片| 在线免费观看一区| 欧美色图天堂网| 欧美三级三级三级爽爽爽| 欧美videossexotv100| 欧美一区二区三区视频| 欧美午夜一区二区| 精品国产免费久久| 亚洲精品一线二线三线| 日韩午夜激情电影| 欧美精品三级在线观看| 欧美日本国产视频| 欧美日韩一区二区不卡| 欧美日韩一区二区不卡| 欧美一区国产二区| 精品国产一区二区三区久久影院| 国产精品天天摸av网| 中文字幕一区二区三区在线观看 | 精品国产成人系列| 亚洲特黄一级片| 亚洲国产毛片aaaaa无费看| 日韩福利视频导航| 粉嫩13p一区二区三区| 成人成人成人在线视频| 6080日韩午夜伦伦午夜伦| 日韩欧美国产综合| 国产偷国产偷精品高清尤物 | 亚洲成人午夜电影| 蜜臀av性久久久久蜜臀aⅴ| 国产综合色精品一区二区三区| 国产一区二区三区最好精华液| 国产成a人亚洲精| 91在线视频播放地址| 欧美sm美女调教| 国产精品麻豆一区二区| 琪琪久久久久日韩精品| 国产成人精品三级麻豆| 日韩免费视频线观看| 国产精品免费免费| 亚洲免费大片在线观看| 国产成人综合精品三级| 欧美亚洲一区二区在线| 久久精品亚洲乱码伦伦中文| 一区二区三区在线影院| av网站免费线看精品| 91精品在线观看入口| 中文字幕精品一区| 国产一区二区三区四区在线观看| 色先锋aa成人| 亚洲欧洲av另类| 九一九一国产精品| 欧美专区亚洲专区| 亚洲一二三四在线| 成人av在线网| 国产精品成人免费| 国产精品1024久久| 日韩欧美一级精品久久| 蜜桃视频第一区免费观看| 91在线免费视频观看| 中文字幕在线观看不卡| 国产精品自拍毛片| 欧美一二三四在线| 国产精品影音先锋| 日韩欧美在线综合网| 久久综合久久综合久久综合| 精品伊人久久久久7777人| 欧美性欧美巨大黑白大战| 亚洲成人综合视频| 色综合激情久久| 亚洲第四色夜色| 在线亚洲人成电影网站色www| 国产日韩在线不卡| 色综合久久久久久久久| 中文字幕亚洲一区二区va在线| 91丨porny丨最新| 国产精品国产a| 高清不卡在线观看av| 亚洲欧美日韩电影| 91丝袜呻吟高潮美腿白嫩在线观看| 亚洲欧洲性图库| 91丨九色porny丨蝌蚪| 中文字幕一区二区三区四区不卡| 色婷婷精品大在线视频| 亚洲欧美另类久久久精品2019| 国产乱人伦偷精品视频免下载 | 欧美日韩午夜在线视频| 亚洲美女视频一区| 日韩一区二区电影网| 日韩av一二三| 亚洲精品一区二区在线观看| 久久精品在这里| 成人禁用看黄a在线| 亚洲天堂久久久久久久| 91麻豆国产在线观看| 洋洋成人永久网站入口| 成人h精品动漫一区二区三区| 国产欧美久久久精品影院| 成人性生交大片免费看中文网站| 一区二区三区小说| 91精品国产黑色紧身裤美女| 亚洲线精品一区二区三区八戒| 精品免费一区二区三区| 国产激情精品久久久第一区二区 | 成人av在线一区二区三区| 国产精品初高中害羞小美女文| 欧美日韩激情在线| 久久69国产一区二区蜜臀| 国产欧美va欧美不卡在线| 51午夜精品国产| 国产精品中文字幕日韩精品| 亚洲成人av中文| www激情久久| 色欧美片视频在线观看| 国产69精品久久777的优势| 亚洲精品午夜久久久| 国产99久久久国产精品潘金| 亚洲午夜久久久久| 久久综合色一综合色88| 欧美一区二区三区啪啪| 99re热视频这里只精品| 国产激情一区二区三区| 亚洲成人1区2区|