一:那到底什么是數(shù)據(jù)分析呢?
數(shù)據(jù)分析是基于商業(yè)目的,有目的的進行收集、整理、加工和分析數(shù)據(jù),提煉有價信息的一個過程。
其過程概括起來主要包括:明確分析目的與框架、數(shù)據(jù)收集、數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)展現(xiàn)和撰寫報告等6個階段。
1、明確分析目的與框架
一個分析項目,你的數(shù)據(jù)對象是誰?商業(yè)目的是什么?要解決什么業(yè)務(wù)問題?數(shù)據(jù)分析師對這些都要了然于心。
基于商業(yè)的理解,整理分析框架和分析思路。例如,減少新客戶的流失、優(yōu)化活動效果、提高客戶響應(yīng)率等等。不同的項目對數(shù)據(jù)的要求,使用的分析手段也是不一樣的。
2、數(shù)據(jù)收集
數(shù)據(jù)收集是按照確定的數(shù)據(jù)分析和框架內(nèi)容,有目的的收集、整合相關(guān)數(shù)據(jù)的一個過程,它是數(shù)據(jù)分析的一個基礎(chǔ)。
3、數(shù)據(jù)處理
數(shù)據(jù)處理是指對收集到的數(shù)據(jù)進行加工、整理,以便開展數(shù)據(jù)分析,它是數(shù)據(jù)分析前必不可少的階段。這個過程是數(shù)據(jù)分析整個過程中最占據(jù)時間的,也在一定程度上取決于數(shù)據(jù)倉庫的搭建和數(shù)據(jù)質(zhì)量的保證。
數(shù)據(jù)處理主要包括數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)化等處理方法。
4、數(shù)據(jù)分析
數(shù)據(jù)分析是指通過分析手段、方法和技巧對準備好的數(shù)據(jù)進行探索、分析,從中發(fā)現(xiàn)因果關(guān)系、內(nèi)部聯(lián)系和業(yè)務(wù)規(guī)律,為商業(yè)目提供決策參考。
到了這個階段,要能駕馭數(shù)據(jù)、開展數(shù)據(jù)分析,就要涉及到工具和方法的使用。其一要熟悉常規(guī)數(shù)據(jù)分析方法,最基本的要了解例如方差、回歸、因子、聚類、分類、時間序列等多元和數(shù)據(jù)分析方法的原理、使用范圍、優(yōu)缺點和結(jié)果的解釋;其二是熟悉1+1種數(shù)據(jù)分析工具,Excel是最常見,一般的數(shù)據(jù)分析我們可以通過Excel完成,后而要熟悉一個專業(yè)的分析軟件,如數(shù)據(jù)分析工具SPSS/SAS/R/Matlab等,便于進行一些專業(yè)的統(tǒng)計分析、數(shù)據(jù)建模等。
5、數(shù)據(jù)展現(xiàn)
一般情況下,數(shù)據(jù)分析的結(jié)果都是通過圖、表的方式來呈現(xiàn),俗話說:字不如表,表不如圖。。借助數(shù)據(jù)展現(xiàn)手段,能更直觀的讓數(shù)據(jù)分析師表述想要呈現(xiàn)的信息、觀點和建議。。
常用的圖表包括餅圖、折線圖、柱形圖/條形圖、散點圖、雷達圖等、金字塔圖、矩陣圖、漏斗圖、帕雷托圖等。
6、撰寫報告
最后階段,就是撰寫數(shù)據(jù)分析報告,這是對整個數(shù)據(jù)分析成果的一個呈現(xiàn)。通過分析報告,把數(shù)據(jù)分析的目的、過程、結(jié)果及方案完整呈現(xiàn)出來,以供商業(yè)目的提供參考。
一份好的數(shù)據(jù)分析報告,首先需要有一個好的分析框架,并且圖文并茂,層次明晰,能夠讓閱讀者一目了然。結(jié)構(gòu)清晰、主次分明可以使閱讀者正確理解報告內(nèi)容;圖文并茂,可以令數(shù)據(jù)更加生動活潑,提高視覺沖擊力,有助于閱讀者更形象、直觀地看清楚問題和結(jié)論,從而產(chǎn)生思考。
另外,數(shù)據(jù)分析報告需要有明確的結(jié)論、建議和解決方案,不僅僅是找出問題,后者是更重要的,否則稱不上好的分析,同時也失去了報告的意義,數(shù)據(jù)的初衷就是為解決一個商業(yè)目的才進行的分析,不能舍本求末。
二:數(shù)據(jù)分析師職業(yè)介紹
做數(shù)據(jù)分析前我們首先要明確分析目的和內(nèi)容,對于數(shù)據(jù)分析師而言,他們的進階需求無外乎是各個企業(yè)對數(shù)據(jù)分析師的職位要求。在前程無憂、中華英才網(wǎng)以及智聯(lián)招聘上,我們隨便搜索下數(shù)據(jù)分析的崗位信息,都能找到大量類似于下面的一些職位要求信息:
別看崗位職責(zé),任職要求這么多,說白了主要就三點要求:1)對相關(guān)業(yè)務(wù)的理解;2)掌握一到二種數(shù)據(jù)分析工具;3)良好的溝通。可能不同的公司因為需求不同,會在要求上有點小小的不同,而這個不同主要集中在數(shù)據(jù)庫上。了解數(shù)據(jù)分析師的具體需求之前,我們有必要先了解數(shù)據(jù)分析師的職位體系。
數(shù)據(jù)分析師的職位體系
在傳統(tǒng)行業(yè)中,數(shù)據(jù)分析更多存在移動、銀行、超市等行業(yè),在這些行業(yè)中你才會偶爾聽到數(shù)據(jù)分析師這個職位,也許更多是聽到數(shù)據(jù)挖掘工程師、數(shù)據(jù)建模師。在中國也許只在電信的項目中,才會存在真正的意義上的數(shù)據(jù)挖掘。
數(shù)據(jù)行業(yè)從廣義上講可以分為以下幾個職位:
1、數(shù)據(jù)分析師
更注意是對數(shù)據(jù)、數(shù)據(jù)指標的解讀,通過對數(shù)據(jù)的分析,來解決商業(yè)問題。主要有以下幾個次層次: 1)業(yè)務(wù)監(jiān)控:診斷當前業(yè)務(wù)是否正常?是否存在問題?業(yè)務(wù)發(fā)展是否達到預(yù)期(KPI)?如果沒有達到預(yù)期,問主要問題在哪?是什么原因引起的?
2)建立分析體系:這些數(shù)據(jù)分析師已經(jīng)對業(yè)務(wù)有一定的理解,對業(yè)務(wù)也相對比較熟悉,更多幫業(yè)務(wù)方建立一套分析體系,或者更高級是做成數(shù)據(jù)產(chǎn)品。例如:營銷活動。分析師會告訴業(yè)務(wù)方,在活動前你應(yīng)該分析哪些數(shù)據(jù),從而制定恰當?shù)臓I銷計劃。在營銷過程中,你應(yīng)該看哪些數(shù)據(jù),從而及時做出營銷活動調(diào)整。在營銷活動,應(yīng)該如何進行活動效果評估。
3)行業(yè)未來發(fā)展的趨勢分析:這應(yīng)該是數(shù)據(jù)分析師最高級別,有的公司叫做戰(zhàn)略分析師/商業(yè)分析師。這個層次的數(shù)據(jù)分析師站的更高,在行業(yè)、宏觀的層面進行業(yè)務(wù)分析,預(yù)測未來行業(yè)的發(fā)展,競爭對手的業(yè)務(wù)構(gòu)成,幫助公司制定戰(zhàn)略發(fā)展計劃,并及時跟蹤、分析市場動態(tài),從而及時對戰(zhàn)略進行不斷優(yōu)化。
主要技能要求:
數(shù)據(jù)庫知識(SQL至少要熟悉)、基本的統(tǒng)計分析知識、EXCEL要相當熟悉,對SPSS或SAS有一定的了解,對于與網(wǎng)站相關(guān)的業(yè)務(wù)還可能要求掌握GA等網(wǎng)站分析工具,當然PPT也是必備的。
2、數(shù)據(jù)挖掘工程師
更多是通過對海量數(shù)據(jù)進行挖掘,尋找數(shù)據(jù)的存在模式、或者說規(guī)律,從而通過數(shù)據(jù)挖掘來解決具體問題。數(shù)據(jù)挖掘更多是針對某一個具體的問題,是以解決具體問題為導(dǎo)向的。例如:聚類分析,通過對于會員各種人口統(tǒng)計學(xué)、行為數(shù)據(jù)進行分析,對會員進行分類,對不同的類型的會員建立相應(yīng)的profiling,從而更好的理解會員,知道公司會員是到底如何?高、中、低低價值的會員構(gòu)成,既可以后期各種會員的運營提供指導(dǎo),提高活動效率,可以指導(dǎo)公司的營銷,例如廣告的投放策略。以及用于公司各種戰(zhàn)略的制定。
主要技能要求: 1)數(shù)據(jù)庫必須精通。很多時候,你模型的數(shù)據(jù)預(yù)處理,可能完成在數(shù)據(jù)庫里完成,你用到的數(shù)據(jù)庫技巧更高。
2)必須要會成熟的數(shù)據(jù)挖掘工具、數(shù)據(jù)挖掘算法,例如:SPSS/CELEMENTINE、SAS/EM等,當然如果你會一、二款開源軟件,并會寫一些程序代碼那是最好的,大公司都喜歡用開源的軟件,例如:R、WEKA。
3、數(shù)據(jù)建模師
這個職位與數(shù)據(jù)挖掘工程師還是有本質(zhì)區(qū)別的。數(shù)據(jù)建模師,更多偏向于中、小數(shù)據(jù)量,而且其使用更多更多是統(tǒng)計學(xué)的方法,而數(shù)據(jù)挖掘中的例如:決策樹、神經(jīng)網(wǎng)絡(luò)、SVM等在這里是根據(jù)不會涉及的。
當然二者有一個共同之處都是,針對很具體的問題,都是會解決某個具體問題,例如:營銷反應(yīng)率,你就可能歷史的郵箱、短信的反應(yīng)情況,來建模型進行預(yù)測,從而提高郵件反應(yīng)率,或者減少對用戶來說的“垃圾”郵箱,提高用戶體驗。所以從掌握的技能上講,這二者就有很大的區(qū)別,數(shù)據(jù)建模師其實很少會提到算法這個詞,更多說使用什么模型,有感覺嗎?但是從實務(wù)界來看,這二個模型越來越?jīng)]有明確的分工,一般來說都會二個職位的人都會去學(xué)習(xí)對方的知識,所以這二個職位有合并的趨勢,但在未來幾年來,我覺得公司要招人的時候應(yīng)該還是要有區(qū)別的。
新進入數(shù)據(jù)行業(yè)的同學(xué),可以根據(jù)自己的背景背景選擇相應(yīng)的職位,學(xué)數(shù)據(jù)、統(tǒng)計學(xué)的朋友更多可以偏向于建模師,而計算機特別是寫編程出現(xiàn)和同學(xué),可以走數(shù)據(jù)挖掘工程師,也許適應(yīng)性更好,但這不是絕對的。
數(shù)據(jù)分析師的職位級別劃分
不同公司對數(shù)據(jù)分析師的職位劃分騷有不同,在一些中小型企業(yè),沒有成立獨立的數(shù)據(jù)中心前,數(shù)據(jù)分析的相關(guān)職位往往是在譬如市場部、運營部這些部門之下,通常數(shù)據(jù)分析成員在2-4人不等。對于一些大型企業(yè),有獨立的數(shù)據(jù)部門的企業(yè),其數(shù)據(jù)分析團隊人員則是十到百人不等,其職位頭銜有通俗的總監(jiān)、經(jīng)理、主管劃分,也有助理、資深、專家之類的劃分。下面是一張微博上傳的比較火的某集團的數(shù)據(jù)分析師職位級別劃分圖表,大家可根據(jù)自身的情況對號入座。(下圖來自微博阿里的朋友分享)
三:數(shù)據(jù)分析職業(yè)生涯規(guī)劃
按照不同分析方法所能給人帶來的智能程度,可以把分析能力劃分為以下8個等級。
上面的8級劃分源自SAS網(wǎng)站的Eight levels of analytics,由IDMer編譯而成,個人覺得其中的8張圖片非常形象生動,網(wǎng)友@數(shù)據(jù)小宇軍用兩個圖表將它們更好地展示出來了:
數(shù)據(jù)分析師的級別
1、數(shù)據(jù)跟蹤員:機械拷貝看到的數(shù)據(jù),很少處理數(shù)據(jù)
雖然這個工作的人還不能稱作數(shù)據(jù)分析師,但是往往作這樣工作的人還都自稱是數(shù)據(jù)分析師,這樣的人,只能通過×××系統(tǒng)看到有限的數(shù)據(jù),并且很少去處理數(shù)據(jù),甚至不理解數(shù)據(jù)的由來和含義,只是機械的把自己看到的數(shù)據(jù)拷貝出來,轉(zhuǎn)發(fā)給相應(yīng)的人。這類人發(fā)出來的數(shù)據(jù),是否有意義,怎么解讀,他自己是不知道的,只能期望收到數(shù)據(jù)的人了。
2、數(shù)據(jù)查詢員/處理員:數(shù)據(jù)處理沒問題,缺乏數(shù)據(jù)解讀能力
這些人可以稱為分析師了,他們已經(jīng)對數(shù)據(jù)有一定的理解了,對于大部分數(shù)據(jù),他們也知道數(shù)據(jù)的定義,并且可以通過監(jiān)控系統(tǒng)或者原始的數(shù)據(jù),處理得到這些數(shù)據(jù)。統(tǒng)計學(xué)的方法,這批人還是很精通的,統(tǒng)計學(xué)的工具,他們也是用起來得心應(yīng)手,你讓他們做一下因子分析,聚類肯定是沒問題,各類檢驗也是用的爐火純青。他們的不足是:1、如果不告訴他們命題,那么他們就不知道該應(yīng)用什么樣的方法去得到結(jié)論了。2、對于數(shù)據(jù)的處理沒問題,但是卻沒有一個很好的數(shù)據(jù)解讀能力。只能在統(tǒng)計學(xué)的角度上解釋數(shù)據(jù)。
3、數(shù)據(jù)分析師:解讀數(shù)據(jù),定位問題提出答案
數(shù)據(jù)分析師這群人,對于數(shù)據(jù)的處理已經(jīng)不是問題了,他們的重點已經(jīng)轉(zhuǎn)化到怎么樣去解讀數(shù)據(jù)了,同樣的數(shù)據(jù),在不同人的眼中有不一致的內(nèi)容。好的數(shù)據(jù)分析師,是能通過數(shù)據(jù)找到問題,準確的定位問題,準確的找到問題產(chǎn)生的原因,為下一步的改進,找到機會點的人。往往科班出身的人,欠缺的不是在處理數(shù)據(jù)上,而是在解讀數(shù)據(jù)上,至于將數(shù)據(jù)和產(chǎn)品結(jié)合到一起,則是其更缺少的能力了。
4、數(shù)據(jù)應(yīng)用師:將數(shù)據(jù)還原到產(chǎn)品中,為產(chǎn)品所用
數(shù)據(jù)應(yīng)用,這個詞很少被提到。但是應(yīng)用數(shù)據(jù)被提的很多,分析了大量的數(shù)據(jù),除了能找到問題以外,還有很多數(shù)據(jù)可以還原到產(chǎn)品中,為產(chǎn)品所用。典型的是在電子商務(wù)的網(wǎng)站中,用戶的購買數(shù)據(jù),查看數(shù)據(jù)和操作的記錄,往往是為其推薦新商品的好起點,而數(shù)據(jù)應(yīng)用師就是要通過自己的分析,給相應(yīng)的產(chǎn)品人員一個應(yīng)該推薦什么產(chǎn)品,購買的可能性會最大的一個結(jié)論。國內(nèi)能做到這個級別的數(shù)據(jù)人員還真是少的可憐,甚至大部分人員連數(shù)據(jù)的視圖都搞不定,而真正意義上的能數(shù)據(jù)應(yīng)用師,可以用數(shù)據(jù)讓一個產(chǎn)品變得更加地簡單高效。
5、數(shù)據(jù)規(guī)劃師:走在產(chǎn)品前面,讓數(shù)據(jù)有新的價值方向
數(shù)據(jù)規(guī)劃師,不能說水平上比數(shù)據(jù)應(yīng)用師高多少,而是另外一個讓數(shù)據(jù)有價值的方向。往往在實際的應(yīng)用中,數(shù)據(jù)都是有其生命周期的,用來分析、應(yīng)用的數(shù)據(jù)也是,這點上,尤其是在互聯(lián)網(wǎng)公司更加明顯,一個版本的更新,可能導(dǎo)致之前的所有數(shù)據(jù)都一定程度的失效。數(shù)據(jù)規(guī)劃師在一個產(chǎn)品設(shè)計之前,就已經(jīng)分析到了,這個產(chǎn)品應(yīng)該記錄什么樣的數(shù)據(jù),這些數(shù)據(jù)能跟蹤什么問題,哪些記錄到的數(shù)據(jù),應(yīng)該可以用到數(shù)據(jù)中去,可以對產(chǎn)品產(chǎn)生什么樣的價值。
四:數(shù)據(jù)分析的基本素質(zhì)
一名合格的數(shù)據(jù)分析師需要具備的五大基本能力和素質(zhì)。
1、態(tài)度嚴謹負責(zé)
嚴謹負責(zé)是數(shù)據(jù)分析師的必備素質(zhì)之一,只有本著嚴謹負責(zé)的態(tài)度,才能保證數(shù)據(jù)的客觀、準確。在企業(yè)里,數(shù)據(jù)分析師可以說是企業(yè)的醫(yī)生,他們通過對企業(yè)運營數(shù)據(jù)的分析,為企業(yè)尋找癥結(jié)及問題。一名合格的數(shù)據(jù)分析師,應(yīng)具有嚴謹、負責(zé)的態(tài)度,保持中立立場,客觀評價企業(yè)發(fā)展過程中存在的問題,為決策層提供有效的參考依據(jù);不應(yīng)受其他因素影響而更改數(shù)據(jù),隱瞞企業(yè)存在的問題,這樣做對企業(yè)發(fā)展是非常不利的,甚至?xí)斐蓢乐氐暮蠊6遥瑢?shù)據(jù)分析師自身來說,也是前途盡毀,從此以后所做的數(shù)據(jù)分析結(jié)果都將受到質(zhì)疑,因為你已經(jīng)不再是可信賴的人,在同事、領(lǐng)導(dǎo)、客戶面前已經(jīng)失去了信任。所以,作為一名數(shù)據(jù)分析師就必須持有嚴謹負責(zé)的態(tài)度,這也是最基本的職業(yè)道德。
2、好奇心強烈
好奇心人皆有之,但是作為數(shù)據(jù)分析師,這份好奇心就應(yīng)該更強烈,要積極主動地發(fā)現(xiàn)和挖掘隱藏在數(shù)據(jù)內(nèi)部的真相。在數(shù)據(jù)分析師的腦子里,應(yīng)該充滿著無數(shù)個“為什么”,為什么是這樣的結(jié)果,為什么不是那樣的結(jié)果,導(dǎo)致這個結(jié)果的原因是什么,為什么結(jié)果不是預(yù)期的那樣等等。這一系列問題都要在進行數(shù)據(jù)分析時提出來,并且通過數(shù)據(jù)分析,給自己一個滿意的答案。越是優(yōu)秀的數(shù)據(jù)分析師,好奇心也越不容易滿足,回答了一個問題,又會拋出一個新的問題,繼續(xù)研究下去。只有擁有了這樣一種刨根問底的精神,才會對數(shù)據(jù)和結(jié)論保持敏感,繼而順藤摸瓜,找出數(shù)據(jù)背后的真相。
3、邏輯思維清晰
除了一顆探索真相的好奇心,數(shù)據(jù)分析師還需要具備縝密的思維和清晰的邏輯推理能力。我記得有位大師說過:結(jié)構(gòu)為王。何謂結(jié)構(gòu),結(jié)構(gòu)就是我們常說的邏輯,不論說話還是寫文章,都要有條理,有目的,不可眉毛胡子一把抓,不分主次。
通常從事數(shù)據(jù)分析時所面對的商業(yè)問題都是較為復(fù)雜的,我們要考慮錯綜復(fù)雜的成因,分析所面對的各種復(fù)雜的環(huán)境因素,并在若干發(fā)展可能性中選擇一個最優(yōu)的方向。這就需要我們對事實有足夠的了解,同時也需要我們能真正理清問題的整體以及局部的結(jié)構(gòu),在深度思考后,理清結(jié)構(gòu)中相互的邏輯關(guān)系,只有這樣才能真正客觀地、科學(xué)地找到商業(yè)問題的答案。
4、擅長模仿
在做數(shù)據(jù)分析時,有自己的想法固然重要,但是“前車之鑒”也是非常有必要學(xué)習(xí)的,它能幫助數(shù)據(jù)分析師迅速地成長,因此,模仿是快速提高學(xué)習(xí)成果的有效方法。這里說的模仿主要是參考他人優(yōu)秀的分析思路和方法,而并不是說直接“照搬”。成功的模仿需要領(lǐng)會他人方法精髓,理解其分析原理,透過表面達到實質(zhì)。萬變不離其宗,要善于將這些精華轉(zhuǎn)化為自己的知識,否則,只能是“一直在模仿,從未超越過”。
5、勇于創(chuàng)新
通過模仿可以借鑒他人的成功經(jīng)驗,但模仿的時間不宜太長,并且建議每次模仿后都要進行總結(jié),提出可以改進的地方,甚至要有所創(chuàng)新。創(chuàng)新是一個優(yōu)秀數(shù)據(jù)分析師應(yīng)具備的精神,只有不斷的創(chuàng)新,才能提高自己的分析水平,使自己站在更高的角度來分析問題,為整個研究領(lǐng)域乃至社會帶來更多的價值。現(xiàn)在的分析方法和研究課題千變?nèi)f化,墨守成規(guī)是無法很好地解決所面臨的新問題的。
-
數(shù)據(jù)處理
+關(guān)注
關(guān)注
0文章
627瀏覽量
29134 -
數(shù)據(jù)分析
+關(guān)注
關(guān)注
2文章
1472瀏覽量
34969
原文標題:關(guān)于數(shù)據(jù)分析那些事,看這一文章就夠了
文章出處:【微信號:DBDevs,微信公眾號:數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
評論