想要從事數據分析工作,應該做什麼準備?如何切入?

azul佐 發佈 2020-01-06T09:22:44+00:00

認清並接受自己能力的邊界,依此合理「使用自己」,並用工具來擴展邊界。我個人是一個BI實施公司的BA(業務分析師),所以平常會跟較多的業務人員和技術人員打交道。就我的觀察而言,學會一項工具,能讓你直接地開始做一些事,而工作輸出的效果和價值會受限於你的分析思路。


認清並接受自己能力的邊界,依此合理「使用自己」,並用工具來擴展邊界。

我個人是一個BI實施公司的BA(業務分析師),所以平常會跟較多的業務人員和技術人員打交道。就我的觀察而言,學會一項工具,能讓你直接地開始做一些事,而工作輸出的效果和價值會受限於你的分析思路。在實際工作情況下,更多的人是先理解技術和工具,再逐步地去總結出自己的「道」,即方法和經驗。你去問很多的初級技術人員,他們很清楚地了解工具的特性,但不見得真的有很清晰的分析思路,所謂思路,都是在「需求」和工作壓力之下,結合學習和經驗,激發出的產物。

哪一些更重要?這取決於你所處的階段。不同的人在不同的階段會遇到不一樣的瓶頸,常見的情況就是,懂了技術會慢慢發現終歸要「搞定人」,而側重於搞定人的也持續地依賴於技術對於效率的巨大提升。

如果非要分一個先後,從題主的描述來看,只是為了獲得進入數據分析行業的門票,可以優先對「工具」的學習。萬事開頭難,當你能夠使用一個分析工具處理數據,並且形成這個工具支持的輸出結果,這就已經以為著你能應用這個數據,在別人具體的要求下,形成具有價值的結果。無論你是否真的有思路,至少你能順著工具自帶的邏輯,邁出第一步。這是因為技術工具本身就是他人思維的產物,比起大而全地去學習方法論,技術工具的使用和輸出是明確的,能更快地讓學習者試錯,不斷明確方向。有了明確的應用場景,就能有針對性地查漏補缺,在過程中形成屬於自己的思想,去補充那些阻礙你使用的方法缺失點。

君子生非異也,善假於物也。

從這個點來看,其實無需強行地將工具和分析方法對立。因為在數據分析領域,工具中本身就蘊含著很多的分析方法,而對著一堆分析方法的概念,你是無法想像技術的應用場景的,對於形成結果本身,很難產生可量化的明確成果,這對於剛剛入門或者期待轉行的人來說,過於虛無縹緲。重要的是行動起來,精進技能,並發現工作和生活中值得分析的數據和價值。

總的來說,在實際的業務分析場景下,只要不是高精尖的複雜統計問題。分析方法會讓你的分析工作錦上添花,但是它更多可以通過特定問題和情境壓力下的激發,通過和同事討論還有實時學習,進而解決問題。而如果你完全不懂一個工具,在存在學習門檻的情況下,你面對的問題,可能是根本無法動手這樣十分尷尬的境地。



按具體工具技能來說,當前數據分析工作涵蓋的內容主要有如下幾大方面:

1.BI(商業智能)軟體/技術平台操作:Tableau、Power bi、帆軟、Qlik、IBM等,有些公司會有內部的BI軟體,比如阿里的Quike BI,功能上以數據可視化為主體,外加數據調用和清洗治理功能。(前端分析報表開發-區別於傳統軟體開發前端,更偏向於業務數據分析,這些軟體都不難)

2.統計分析軟體:Excel(一定不能忽視的技能,是理解很多業務場景的基礎)、SAS、Sass等(跟BI軟體有趨同和取代趨勢)

3.SQL、資料庫開發、ETL(日常取數,後端資料庫及數據倉庫搭建)

4.統計學

5.分析模型、算法(業務向分析模型OR)

6.Python或者R(數據挖掘、AI)

2015年開始,敏捷BI軟體開始擠占市場並迅速取代傳統BI的統治地位,進而國內還是國外都開始大肆涉足BI領域,其實敏捷BI並不是比傳統BI高級,但是敏捷BI可以代表BI的重要發展方向,其最主要的一個特徵就是 :個人及小型團體獲取並分析數據的門檻大大降低。而也由於這個核心特徵,數據分析師這個崗位自16年起被宣傳得很熱。但目前其涵蓋的內容其實偏廣,需要求職者們仔細的考量和權衡。

從崗位職責來看,數據分析師這個崗位所涵蓋的工作內容可以分為以下幾個方向(這是一個複合型崗位):

1.業務數據分析。在網際網路企業,專業的業務型數據分析師主要是通過數據模型和專業知識,對用戶和業務如何「增長」做出分析,或者對產品本身的效果,通過數據的維度進行監控,並得出建議。總得來說是一個支持溝通崗位,要求對業務十分了解,有清晰的邏輯和溝通能力,輸出形成各種分析報告。對於技術的要求主要停留在Excel、敏捷BI軟體的基本使用和出色的文字及PPT能力上,需要能用SQL語言進行基本的數據獲取。

2.BA(商業/業務分析,注意英文單詞的區別)這既是一個崗位(Business Analysis,作為崗位/角色主要是分析業務和數據需求,以支持IT運維或項目實施),也是一個國外興起的新興專業(Business Analytics,作為專業是偏統計和數據科學方向)。作為崗位來說:要懂技術而不需要會技術,要懂業務並且化為技術邏輯。核心職責是「需求分析」,即結合客戶業務需求,歸納文檔,製作報表/產品原型,形成數據字典,提供給技術實施(前端後端)人員查看。業內的話,這個崗位還會要兼顧售前(區別於銷售,主要是投標、報價方面的工作)、產品經理、項目經理的部分或者全部職能。視公司情況而定(此崗位以乙方公司居多)(甲方乙方也會有區別,但核心職能不變)。作為專業來說:這是一門統計學+商科(偏經濟、財會、金融)+計算機科學的複合學科。

3.技術實施人員(偏前端報表方向):一般來說,要求精通BI軟體、會Excel、會用SQL進行ETL工作。乙方公司的主要職責是前端報表開發(做好前端圖表計算邏輯、完善交互、美觀介面、與後端ETL核對數據);甲方公司的主要職責是:結合新需求製作報表、運維(修改前端報表)、取數、同時兼顧一些溝通與匯報職能等。

4.數據挖掘和AI大數據開發,這個需要結合Python和R語言(目前主流是Python),技術向更深,需要編程基礎,同時需要掌握較為複雜的技術邏輯和統計學模型。也有稱其為數據科學家(data scientist)。

從發展趨勢上來說,數據分析師的第一、二種是溝通型+技術型複合崗位,第四種是高級技術崗位,但第三種,目前市面上基數最大,但很容易被學會了BI前端軟體的業務人員取代。眼下BI的概念正在逐步降溫,隨著更多的人了解BI,掌握BI工具很難支撐起一個獨立崗位的工作內容。

數據分析師這個崗位,長遠來看是容易被「邊緣化」的一個崗位,更多的是一個角色,而很難作為一個獨立的崗位存在,必然是依附於業務或者IT,而逐漸地化為IT或者業務人員的一種技能。單純地「幫助決策、設定目標」「提供數據分析支持」這種類似於「軍師」一般的存在,並非不可能,但現實角度來說,做到這樣很難。當然比起很多職業,它有其特殊性和優勢,但這是建立在對崗位和技能清晰的認知之上的。

關鍵字: