數(shù)據(jù)分析師需要掌握哪些技能
發(fā)布時(shí)間:2021-06-01 14:04:09 已幫助:119人 來源:北京AAA教育
SQL基礎(chǔ)之所以重要,是因?yàn)閿?shù)據(jù)分析師分析的數(shù)據(jù)大多都是從數(shù)據(jù)庫中提取而來的。有良好的SQL功底并能熟悉使用,不僅能提取到需要的數(shù)據(jù),還能大大提高工作效率。盡管有部分?jǐn)?shù)據(jù)可以通過報(bào)表等其他途徑獲得,但絕大多數(shù)的數(shù)據(jù)仍需要通過自己寫SQL語句。
創(chuàng)建分析型數(shù)據(jù)庫比精通多種算法更為重要。
如何創(chuàng)建分析基礎(chǔ)是數(shù)據(jù)分析師需要培養(yǎng)的最重要技能之一。將事務(wù)性數(shù)據(jù)轉(zhuǎn)換為可以分析的數(shù)據(jù),需要真正了解我們正在處理的業(yè)務(wù)。這一點(diǎn),加上批判性思維,是正確界定問題的基礎(chǔ)。
數(shù)據(jù)分析師經(jīng)常需要target來訓(xùn)練他的模型,但是事務(wù)性數(shù)據(jù)庫通常沒有準(zhǔn)備好target。數(shù)據(jù)分析師必須明確客戶何時(shí)需要放棄服務(wù),以便創(chuàng)建客戶流失模型。并且需要定義什么是不良付款行為,即使難以預(yù)測到。創(chuàng)建目標(biāo)和分析數(shù)據(jù)一致性并不是那么容易,它需要一個(gè)長期的調(diào)查過程。
事實(shí)上,數(shù)據(jù)分析的價(jià)值遠(yuǎn)大于將數(shù)據(jù)輸入模型并評估性能指標(biāo)的即插即用過程。同時(shí)對專業(yè)業(yè)務(wù)的理解和分析是做好一組數(shù)據(jù)分析的關(guān)鍵因素!
要熟練使用Excel
Excel可以進(jìn)行各種數(shù)據(jù)的處理、統(tǒng)計(jì)分析和輔助決策操作,作為常用的數(shù)據(jù)處理和展現(xiàn)工具,數(shù)據(jù)分析師除了要熟練將數(shù)據(jù)用Excel中的圖表展現(xiàn)出來,還需要掌握為生成的圖表做一系列的格式設(shè)置的方法,如:系列格式美化、三維格式美化,以及坐標(biāo)軸和網(wǎng)格線設(shè)置等,圖表可以與函數(shù)或宏等功能一起聯(lián)用,制作出模擬圖表或帶有交互效果的高級圖表,比如在中國地圖上標(biāo)注各省的人口分布等,實(shí)現(xiàn)這些能得到更好地?cái)?shù)據(jù)分析和查看效果。
Excel里面自帶的數(shù)據(jù)分析功能,很大程度上能完成專業(yè)統(tǒng)計(jì)軟件(R、SPSS、SAS、Matlab)的數(shù)據(jù)分析工作,這其中包括描述性統(tǒng)計(jì)、相關(guān)系數(shù)、概率分布、均值推斷、線性、非線性回歸、多元回歸分析、時(shí)間序列等內(nèi)容。熟悉使用Excel的各項(xiàng)功能對一名優(yōu)秀的數(shù)據(jù)分析師來說非常重要。
要有統(tǒng)計(jì)學(xué)基礎(chǔ)
統(tǒng)計(jì)學(xué)是收集、處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學(xué),其中的理論及依據(jù)就是數(shù)據(jù)分析的理論和依據(jù)。統(tǒng)計(jì)學(xué)是數(shù)據(jù)分析的理論基礎(chǔ),可以使數(shù)據(jù)分析更加系統(tǒng)化,以系統(tǒng)的數(shù)據(jù)科學(xué)作為數(shù)據(jù)分析的指導(dǎo),才會更好地為數(shù)據(jù)分析服務(wù)。
沒有統(tǒng)計(jì)學(xué)基礎(chǔ)的分析師的職業(yè)發(fā)展之路不會長遠(yuǎn),因?yàn)槠湓诠ぷ髦锌赡軙3S龅讲恢涝撚檬裁捶椒ㄕ覍?shù)據(jù)規(guī)律的瓶頸,因此掌握數(shù)據(jù)分析的統(tǒng)計(jì)學(xué)基礎(chǔ)知識是成為一名優(yōu)秀數(shù)據(jù)分析師的基礎(chǔ),這也是在招聘數(shù)據(jù)分析師崗位時(shí)要求應(yīng)聘者具有統(tǒng)計(jì)學(xué)知識的原因。當(dāng)然,如果不是統(tǒng)計(jì)或數(shù)學(xué)專業(yè),分析師還可以通過自學(xué)統(tǒng)計(jì)學(xué)相關(guān)書籍的方法學(xué)習(xí)。
統(tǒng)計(jì)學(xué)知識主要包含:用于集中趨勢分析的平均數(shù)、中數(shù)、眾數(shù);用于離中趨勢分析的全距、四分差、平均差、方差、標(biāo)準(zhǔn)差;研究現(xiàn)象之間是否存在某種依存關(guān)系的相關(guān)分析;確定兩種或兩種以上變數(shù)間相互依賴的定量關(guān)系的回歸分析;揭示同一個(gè)變量的各個(gè)類別之間的差異,以及不同變量各個(gè)類別之間的對應(yīng)關(guān)系的關(guān)聯(lián)分析、R-Q型因子分析;研究從變量群中提取共性因子的因子分析;用于兩個(gè)及以上樣本均數(shù)差別的顯著性檢驗(yàn)的方差分析;概率及分布、參數(shù)估計(jì)、假設(shè)檢驗(yàn)等經(jīng)典統(tǒng)計(jì)學(xué)內(nèi)容。
至少熟悉并精通一種數(shù)據(jù)挖掘工具和語言
以R語言為例,R編程語言在數(shù)據(jù)分析與機(jī)器學(xué)習(xí)領(lǐng)域已經(jīng)成為一款重要的工具。R作為腳本語言憑借其良好的互動性和豐富的擴(kuò)展包資源可以方便地解決大部分?jǐn)?shù)據(jù)處理、變換、統(tǒng)計(jì)分析、可視化的問題,并可以重現(xiàn)所有的細(xì)節(jié)。
R的優(yōu)勢在于有包羅萬象的統(tǒng)計(jì)函數(shù)可以調(diào)用,特別是在時(shí)間序列分析方面,無論是經(jīng)典還是前沿的方法都有相應(yīng)的包可以直接使用。
因此,掌握R語言可以提高整體的生產(chǎn)力。然而,要成為一名優(yōu)秀的數(shù)據(jù)分析師,僅學(xué)會使用一門語言遠(yuǎn)遠(yuǎn)不夠,還需要修改數(shù)據(jù)挖掘語言的程序包或模型,因?yàn)楝F(xiàn)有的程序包或模型有局限性,在前期數(shù)據(jù)處理上還是不夠自由,如異常值的處理、變量處理等,而自己寫代碼編程也可以根據(jù)自己的需求進(jìn)行編寫,實(shí)現(xiàn)更多的個(gè)性化需求。
一名優(yōu)秀的數(shù)據(jù)分析師,還應(yīng)該主動熟悉業(yè)務(wù)。
以游戲機(jī)構(gòu)為例,如果不熟悉游戲產(chǎn)品制作流程、系統(tǒng)架構(gòu)、基本運(yùn)營思路,不知道游戲玩家的基本游戲行為和情感訴求,那么數(shù)據(jù)分析工作就相當(dāng)于空中樓閣,所以要多了解策劃人員的游戲設(shè)計(jì)理念、運(yùn)營人員的版本計(jì)劃,抓住一切機(jī)會多觀察和學(xué)習(xí)其工作思路和方法,并參與其具體的實(shí)施過程,這樣才能逐步積累真正的游戲業(yè)務(wù)經(jīng)驗(yàn)。
現(xiàn)實(shí)情況中很多數(shù)據(jù)分析師都沒有這樣的經(jīng)歷,也就沒有相關(guān)的經(jīng)驗(yàn)積累,所以他們大多數(shù)的工作產(chǎn)出主要是一些非產(chǎn)品相關(guān)的平臺數(shù)據(jù)分析內(nèi)容和結(jié)論;當(dāng)然,筆者相信并非他們不愿意去積累,而是受限于企業(yè)中的一些機(jī)制,比如大多數(shù)數(shù)據(jù)分析師是在技術(shù)部門或平臺部門,而非具體的產(chǎn)品部門,少有切實(shí)深入到業(yè)務(wù)現(xiàn)場的機(jī)會。
在這種環(huán)境下,更需要自己主動去了解業(yè)務(wù),多主動和產(chǎn)品部門聯(lián)系,若脫離行業(yè)認(rèn)知和業(yè)務(wù)背景,即使有很好的統(tǒng)計(jì)學(xué)功底,分析的結(jié)果也往往只能停留在數(shù)據(jù)解讀層面,甚至出現(xiàn)因?yàn)椴涣私鈽I(yè)務(wù)背景而使結(jié)論錯誤的情況。
從另外一個(gè)角度來說,懂業(yè)務(wù)也是數(shù)據(jù)敏感的體現(xiàn),不懂業(yè)務(wù)的數(shù)據(jù)分析師,看到的只是一個(gè)數(shù)字。反之,懂業(yè)務(wù)的數(shù)據(jù)分析師,則看到的不僅僅是數(shù)字,他明白這個(gè)數(shù)字代表什么意義,更能針對數(shù)據(jù)分析結(jié)論提出有針對性的建議,對產(chǎn)品或者企業(yè)來說都是非常有價(jià)值的。
懂業(yè)務(wù)是做數(shù)據(jù)分析師的基本要求,這種觀點(diǎn)對任何其他行業(yè)也是一樣的道理。優(yōu)秀的分析師不僅要懂業(yè)務(wù),而且要非常熟悉業(yè)務(wù)。
撰寫報(bào)告的能力對成為一名優(yōu)秀的分析師來說也非常重要。
即便有嚴(yán)謹(jǐn)?shù)姆治鏊悸泛陀袃r(jià)值的數(shù)據(jù)資料,如果不能將其寫成報(bào)告,或者寫的報(bào)告未能準(zhǔn)確清楚地表達(dá)出數(shù)據(jù)中隱含的規(guī)律,那數(shù)據(jù)的價(jià)值將大打折扣。一份好的分析報(bào)告,數(shù)據(jù)資料是功底,報(bào)告的框架是支柱,報(bào)告的格式是軍裝,獨(dú)特見解是亮點(diǎn),預(yù)測方法是刀槍,正確的判斷是見證。
在撰寫報(bào)告時(shí),深入地思考,深入分析,邏輯嚴(yán)謹(jǐn),結(jié)論有說服力,能提前預(yù)測數(shù)據(jù)趨勢,能從問題中引申出解決方案,提出有指導(dǎo)意義的分析建議,這些都是一名優(yōu)秀的分析師所體現(xiàn)的特質(zhì)。
除了以上的硬實(shí)力,數(shù)據(jù)敏感力、邏輯思維能力、歸納能力、批判性思維能力、交流溝通能力、責(zé)任力這些軟性的技能也是優(yōu)秀分析師必須具備的素質(zhì)。另外,如果分析師能站在更高的角度思考問題,有管理者的思維,則能在眾多分析師中能脫穎而出。
以上就是本章的全部內(nèi)容,希望對大家有所幫助。如果感興趣的話,可以咨詢我們的在線老師了解報(bào)名哦!