近年來,大數(shù)據(jù)和增長黑客等概念已在Internet行業(yè)中廣泛傳播,并且數(shù)據(jù)分析思想變得越來越流行。作為Internet上最前沿的產(chǎn)品經(jīng)理,他們已經(jīng)接觸到許多產(chǎn)品數(shù)據(jù)和用戶數(shù)據(jù)。使用它來增強業(yè)務(wù)能力已經(jīng)成為人們討論的熱點。那么大數(shù)據(jù)分析要經(jīng)歷幾個階段?大數(shù)據(jù)分析至少存在三個階段:熟悉計算工具階段、提升分析能力階段和形成思維方式階段。
大數(shù)據(jù)分析要經(jīng)歷幾個階段?
階段1:熟悉計算工具
第一個階段是熟悉計算工具階段,也就是能從數(shù)據(jù)中正確計算出結(jié)論。這一階段需要的是編程能力和基礎(chǔ)的邏輯分析。在這個階段,需要打好基本的編程和數(shù)理基礎(chǔ),比如如何使用一種編程語言從某個數(shù)據(jù)源中提取數(shù)據(jù),進行必要的轉(zhuǎn)化,生成一個結(jié)果。在這個階段,我經(jīng)常認為數(shù)據(jù)分析就是編程。那時也對編程和數(shù)據(jù)分析產(chǎn)生很大的畏難情緒,覺得自己離學好編程、使用好各類工具的狀態(tài)有很大差距。
同時,我也對如何分析數(shù)據(jù)感到一籌莫展。雖然在學校課堂和各類網(wǎng)絡(luò)教程中學過很多編程方面的技術(shù),也能夠看懂一些別人的程序,但是對于一個嶄新的問題,我不知道使用哪種工具,編寫什么樣的程序,進行哪些方面的分析。
處在這個階段,我認為主要因為自己的編程經(jīng)驗停留在“學”上,還沒有過度到“用”的境界。只能說學會了一些工具(比如編程語言),但是不知道如何應用。另一方面,自己的實戰(zhàn)經(jīng)驗太少,沒有實戰(zhàn)經(jīng)驗,只學習一些表面的皮毛,出去忽悠一些非科班的人還像模像樣,但是真正讓我去做一個新案例的數(shù)據(jù)挖掘和分析,我可能完全不知如何入手。
在這個階段,我們一方面需要打磨自己的編程能力,另外一方面也不斷學習一些數(shù)學模型,包括各類機器學習算法、概率論等。
階段2:提升分析能力
隨著對編程工具的熟悉,比如開始熟悉了Shell、SQL、Python、大數(shù)據(jù)等,我發(fā)現(xiàn)使用工具不一定能得出特別好的結(jié)論。
經(jīng)濟學有一個關(guān)于啤酒和尿不濕的例子:沃爾瑪一家分店的營銷經(jīng)理對超市的銷售數(shù)量進行設(shè)定跟蹤,有一次他發(fā)現(xiàn)了一個很奇怪的現(xiàn)象:啤酒與尿不濕的銷量在周末總會出現(xiàn)成比例增長。主要因為爸爸們周末采購時,買完尿不濕想順手捎帶幾瓶啤酒。
其實,獲取到這個數(shù)據(jù)并不難,但原始數(shù)據(jù)中絕對沒有這個現(xiàn)成的結(jié)論。進行數(shù)據(jù)分析的第一步是找到一個方向,先看看哪些潛在的假設(shè)能夠解釋現(xiàn)象。比如,這個例子中,沃爾瑪對銷售數(shù)據(jù)做相關(guān)性分析。數(shù)據(jù)是死的,是躺在硬盤中的一堆字符。如果沒有一個基本的假設(shè)或者方向,即使有再強大的編程能力,也很難得出一個觀點或結(jié)論。
這時候我們能夠看懂很多數(shù)據(jù)分析的報告,能夠開始建立起數(shù)據(jù)之間的聯(lián)系。如果有一些高人指點,加上實戰(zhàn)練習,在數(shù)據(jù)分析上可以有茅塞頓開般的提升。
很多入門和初學者基本上都停留在第一階段和第二階段的初級水平。一部分人在這個階段做大量重復性的工作,多年可能沒有任何進步,無法進入到下一階段。
階段3:形成思維方式
說實話,以前我認為現(xiàn)代社會發(fā)展變化太快,新事物層出不窮,經(jīng)驗不值一提。但是接觸了越多的大牛,我開始發(fā)現(xiàn)這些人的經(jīng)驗才是他們安身立命之本。經(jīng)驗不局限于數(shù)據(jù)、工具或者技術(shù),經(jīng)驗是逐漸培養(yǎng)起來的,是分析問題的思維方式。金庸在他的武俠系列中一直強調(diào)內(nèi)功的重要性,經(jīng)驗就是這樣的內(nèi)功。
數(shù)據(jù)分析的最后一個階段,一般是團隊的領(lǐng)導需要達到的水平。由于團隊的領(lǐng)導一般具有多年的實戰(zhàn)經(jīng)驗,他們可以很快發(fā)現(xiàn)問題。當我還是小白的時候,我發(fā)現(xiàn)團隊的領(lǐng)導幾乎天天都在看數(shù)據(jù),每次開會都在討論數(shù)據(jù),從一張數(shù)據(jù)圖中他們可以很快發(fā)現(xiàn)一些問題,面對新問題,他們也有很多解決思路和探索方向。而且,這里的團隊領(lǐng)導不僅限于技術(shù)團隊,包括產(chǎn)品或者運營相關(guān)團隊的領(lǐng)導也對數(shù)據(jù)有很強的敏感性。比如,在與產(chǎn)品溝通的通氣會上,產(chǎn)品團隊的領(lǐng)導經(jīng)常抓住數(shù)據(jù)可疑點,讓我們技術(shù)團隊來解釋背后的原因。我非常震驚,為什么非技術(shù)出身的他們,也能找到一些問題的關(guān)鍵。再到后來,我發(fā)現(xiàn)不僅僅是互聯(lián)網(wǎng)行業(yè),各行各業(yè)的佼佼者都對數(shù)據(jù)非常敏感,都有一套問題求解的思路。比如,我之前以疫情分析為例的那篇文章疫情分析是最好的實戰(zhàn)教材中列舉了一些作者,他們分析問題的能力都值得我們學習,實際上他們并不都是100%的技術(shù)背景出身。
上述就是關(guān)于大數(shù)據(jù)分析要經(jīng)歷幾個階段的全部內(nèi)容介紹,想了解更多關(guān)于大數(shù)據(jù)的信息,請繼續(xù)關(guān)注中培偉業(yè)。