信息化時(shí)代的快速推進(jìn)所產(chǎn)生的海量信息,讓全球迎來了一個(gè)大數(shù)據(jù)時(shí)代。處于這個(gè)行業(yè)上冊(cè)的大數(shù)據(jù)精英無疑成為這個(gè)行業(yè)乃至?xí)r代的引領(lǐng)和驅(qū)動(dòng)者。中培偉業(yè)《大數(shù)據(jù)分析及可視化技術(shù)應(yīng)用實(shí)戰(zhàn)》專家謝老師認(rèn)為,要想成為大數(shù)據(jù)的精英人才,除了專業(yè)水平之外,還應(yīng)該具備以下5種專業(yè)特質(zhì):
特質(zhì)一:定義和厘清問題
好的數(shù)據(jù)科學(xué)家具備什么條件,一般可以分成兩種等級(jí):一種是是別人幫你把問題定義好,然后你來解開,但更厲害的是你知道怎么找問題,什么問題才是重要的,自己發(fā)現(xiàn)問題。要定義最有前瞻性最重要的問題,結(jié)果不只正確還要顯著性,對(duì)各領(lǐng)域發(fā)展有貢獻(xiàn),要有商業(yè)價(jià)值和技術(shù)進(jìn)步的空間,兩者能兼?zhèn)涫亲詈玫摹T诜治鰯?shù)據(jù)時(shí)定義問題的能力很重要,因?yàn)閱栴}分成很多層面,數(shù)據(jù)科學(xué)家必須要看當(dāng)下要解決什么問題,再用那個(gè)指標(biāo)去回答。因此數(shù)據(jù)科學(xué)家首要具備的條件就是:定義和厘清問題。
特質(zhì)二:想像力
不要以為數(shù)據(jù)科學(xué)家整天在電腦前面工作,只要一板一眼地分析數(shù)據(jù)就好,其實(shí)想像力也很重要。有一定的創(chuàng)意才能幫助自己找到不一樣的觀點(diǎn),學(xué)校會(huì)訓(xùn)練你使用習(xí)慣的工具,但你應(yīng)該要嘗試各種可能,如果沒有專業(yè)知識(shí)判斷,最后得到的結(jié)果就會(huì)跟大家差不多。
例如一些提供大數(shù)據(jù)解決方案的公司常會(huì)需要幫助客戶找到具有某種特征的族群,這個(gè)時(shí)候若只靠經(jīng)驗(yàn)和專業(yè)是不夠的,還需要發(fā)揮一些想像力。我們?cè)诿枋鲆粋€(gè)人的行為傾向時(shí)是很多維度的東西去做整合,除了你對(duì)生活經(jīng)驗(yàn)的豐富度之外,你還要有創(chuàng)意去描述這種人具有什么樣的行為特征,我們?cè)偻高^機(jī)器學(xué)習(xí)的輔助,幫助你快速收集這些特征背后隱含的意義是什么,不然一般人就是我想到什么樣的資訊我就勾一勾,這是遠(yuǎn)遠(yuǎn)不夠的。
特質(zhì)三:邏輯思考能力
數(shù)據(jù)科學(xué)家的工作時(shí)常需要建立假設(shè)然后去驗(yàn)證它,并且建立模型,這個(gè)過程依賴優(yōu)秀的邏輯思考能力,否則追尋答案到一半可能不小心就會(huì)走到岔路。心理學(xué)的訓(xùn)練幫助可以更容易了解他人的動(dòng)機(jī)和想法,也因此在分析數(shù)據(jù)時(shí)常有意想不到的收獲。
以大數(shù)據(jù)科學(xué)家最討厭的機(jī)器人為例,這類的假數(shù)據(jù)抓不勝抓,又會(huì)影響到統(tǒng)計(jì)結(jié)果,令人不堪其擾,然而與其去思考機(jī)器人在哪里,要怎么抓,不如反向思考什么樣的網(wǎng)頁需要機(jī)器人,機(jī)器人的數(shù)據(jù)從哪里來,就像是偵探福爾摩斯一樣,偵探怎么找出犯人,他不是從犯案手法去看的,而是從動(dòng)機(jī)。
特質(zhì)四:基礎(chǔ)數(shù)理與資訊工程能力
大數(shù)據(jù)科學(xué)家不一定非得要是理工學(xué)院或電資學(xué)院出身的,但還是必須具備基礎(chǔ)數(shù)理與資訊工程能力。
你也許可以用Excel去處理數(shù)據(jù),但如果想要加快資料處理速度的話,程式能力依然是必須的。不害怕數(shù)字很重要,必須要培養(yǎng)對(duì)數(shù)字的敏銳度;在工具之外,最重要的還是商業(yè)嗅覺,現(xiàn)在很多人隨隨便便就說自己會(huì)做數(shù)據(jù)分析會(huì)用什么資訊工具,但沒有商業(yè)眼光依然白搭。
特質(zhì)五:跨界合作能力
最后,由于大數(shù)據(jù)科學(xué)家必須膽大心細(xì)又要天馬行空,邏輯好之外還得要融合自身生活經(jīng)驗(yàn),這些特質(zhì)要在一個(gè)人身上面面俱到非常困難。跨界合作能力在這里就顯得格外重要,因?yàn)椴煌漠a(chǎn)業(yè)別需要不同的觀點(diǎn),如果不懂得傾聽別人的意見,恐怕陷入盲點(diǎn)而不自知,跨界合作有助于發(fā)現(xiàn)不同面向切入分析,更有效率地做決策。
“在大數(shù)據(jù)領(lǐng)域的英雄不是圖靈,也不是克勞德·夏農(nóng)(發(fā)明資訊概論的人),而是福爾摩斯;如果只是因?yàn)榇髷?shù)據(jù)很紅就去學(xué)習(xí)大數(shù)據(jù),你學(xué)這些也許只能賺22W的,但是如果先掌握這些特質(zhì),把專業(yè)領(lǐng)域做好,你就可以賺220W。因此,與其盲目追隨大數(shù)據(jù)熱潮,不如看看自己是否具備這些特質(zhì)以及專業(yè),再來決定要不要加入大數(shù)據(jù)淘金潮。