「過(guò)去」以往在增量時(shí)代,每天都有新的分析領(lǐng)域、新的技術(shù)據分( ???)市場(chǎng)被開(kāi)發(fā)。尤其是型數析能型在互聯(lián)網(wǎng)、電商等領(lǐng)域的力模紅利期,似乎只要做(zuo)好單點(diǎn)的數據突破就能獲得市場(chǎng)。??這個(gè)蠻荒時(shí)代,分析業(yè)務(wù)運營(yíng)主要依靠是技術(shù)據分經(jīng)驗和直覺(jué)驅動(dòng)。比如跨境電商領(lǐng)域初期,型數析能型憑借世界工廠(chǎng)平臺的力模優(yōu)勢,國內廠(chǎng)家似乎只需基于經(jīng)驗選品即??可大賣(mài)。數據
「現在」但是分析隨著(zhù)規則的成熟,更多玩家的技術(shù)據分進(jìn)(╬?益?)入,市場(chǎng)從藍海變?yōu)榧t海,型數析能型進(jìn)入到存量期,力模僅靠經(jīng)驗驅動(dòng)的增長(cháng)模式不再有效。還是拿跨(′▽?zhuān)?)境電商舉例,由于賣(mài)家的(de)劇增,海外市場(chǎng)的飽和,跨境電商就進(jìn)入存量運營(yíng)時(shí)代,已經(jīng)不存在絕對的藍海市場(chǎng),每個(gè)細分領(lǐng)域都有許多(duo)競(′?`)爭對手。此時(shí),要??求商家從粗放運營(yíng)轉為精細化運營(yíng),也就是用數據分析報告決定市場(chǎng)是否值得投入,用數據選品,用數據做經(jīng)營(yíng)分析,用數據庫存管理。
當然,不是說(shuō)純定量的數據分析決定了一切,經(jīng)(jing)驗就不重要了。??而是說(shuō)在決策的過(guò)程中,數據結論占據的比例與以往相比更大,同時(shí)業(yè)務(wù)經(jīng)驗也是必不可少的部分。
「未來(lái)」互聯(lián)網(wǎng)逐漸成為“傳統行業(yè)”的未來(lái),人工智能、元宇宙等由數據驅動(dòng)的行業(yè)越來(lái)越依賴(lài)數據分析。還有眾多制造業(yè)亟待數字化轉型,以期在全球供應鏈中提高制造環(huán)節的附加值。也就是說(shuō),在未來(lái),數據(ju)驅動(dòng)業(yè)務(wù)將更頻繁。
數據分析的本質(zhì)是「沙盤(pán)演練」:戰場(chǎng)上,指揮員(yuan)們在指揮部的地形模型前「推演」敵我雙方的趨勢確定作戰方案;商場(chǎng)上,管理層通過(guò)數據間的運算關(guān)系(xi)「推斷」運營(yíng)的發(fā)展進(jìn)而做決策。
基于這樣的定義可以知道數據分析的目的是為了做對當下運營(yíng)發(fā)展有利的決策,那它是如何做到的呢?為了解答這個(gè)問(wèn)題,可以從前(′▽?zhuān)?面的定義中引申出幾個(gè)關(guān)鍵概念:數據,運算關(guān)系,推斷,決策。
最通用的理解,數據是被存儲起來(lái)的信息。從應用的角度,數據是把事物做量化處理的工具,萬(wàn)物皆可數據化:數值數字是數據,文本、圖像、視頻等同樣都是數據。
按字段類(lèi)型劃分,可以把數據分為:
按結構劃分,可以把數據分為:
根據數據連續的屬性不同,還可以分為:
孤立的數據往往沒(méi)有參考價(jià)值,比如量化(?Д?)一??個(gè)人,身高是180cm,并不能意味什么。比如網(wǎng)易云音樂(lè )的用戶(hù),每個(gè)用戶(hù)的年齡是數據,對使用產(chǎn)品的人群年齡進(jìn)行分段比如18-24歲,該年齡段人數占比的ヾ(′▽?zhuān)??指標對網(wǎng)易云音樂(lè )來(lái)說(shuō)才有價(jià)值。
指標的作用在于「度量」業(yè)務(wù)的發(fā)展:
這些指標(點(diǎn))通過(guò)一??定的結構可以編織而成指標體系(線(xiàn)、面)衡量局部、甚至是全局的業(yè)務(wù)。
「沙盤(pán)演練」中,指揮員通過(guò)軍事沙盤(pán)上??的地形,及敵我雙方的工事、兵力部署、火器配置等情況,分(fen)析敵情,制定(ding)作戰方案。數(shu)據把現實(shí)中的運營(yíng)抽象到數(′?_?`)字世界中,通過(guò)指標體系,應用各種分析方法(業(yè)務(wù)分析、產(chǎn)品分析、用戶(hù)分析、經(jīng)營(yíng)分析......),幫助經(jīng)營(yíng)做決策。
趙括熟讀兵書(shū),卻不能活用,淪為紙上談兵的笑話(huà)。所以獲得分析能力后,不能照本宣科,要結合實(shí)際業(yè)務(wù)場(chǎng)景做決策。
數據分析落地涉及流程創(chuàng )新、變革管理,用新的思維解決業(yè)務(wù)問(wèn)題。但這個(gè)過(guò)程并不是強迫變革,需要(yao)借助對業(yè)務(wù)的理解及軟性的能力來(lái)使分析平滑落地。
站在“前人”的肩膀上,可以走得更遠。餅干哥哥根據多年數據分析工作經(jīng)驗沉淀出了數據分析師能力模型,跟著(zhù)它“按圖索驥”,補充自身缺失的能力,最終形成獨立、落地的數據分析能力。
完整的數據分析師能力體系應該包括
在建(jian)立數據分析思維之前,應該先在底層認知達成共識。
什么是認知?是對事物底層邏輯的了解,是對是世界萬(wàn)物的判斷,認知的本質(zhì)就是做決定。也(ye)就是說(shuō),為了幫ヽ(′▽?zhuān)?ノ助數據分析中每個(gè)決策的有效性(選擇什么指標、分析方法?接下來(lái)做什么?等等),需要先建(jian)立底層認知。
這一步,我們需要去明確數據分析??的(de)定義:數據(ju)分析ヾ(′▽?zhuān)??是什么?目的/產(chǎn)出???分析流程?
同學(xué)們(′?_?`)在求職過(guò)程中會(huì )發(fā)現,同樣是數(shu)據(ju)分析師崗位,但是面試的內容千差萬(wàn)別,有考察機器(qi)學(xué)習、統計學(xué)等專(zhuān)業(yè)能力的,也有考察市場(chǎng)/行業(yè)分析的,還有考察產(chǎn)品分析的。
這就是認知上的偏差:當一些同學(xué)認為數據分析就是用Excel做表、python寫(xiě)腳本、機器學(xué)習建模時(shí)(其實(shí)這些只是組成數據分析能力的一部分),求職市場(chǎng)對數據分析師的要求更為完整。
回過(guò)頭來(lái)看,數據分??析??到底是什么?筆者認為?,數據分析是一個(gè)過(guò)程,是利用數據能(neng)力做分析的過(guò)程(cheng):從發(fā)現問(wèn)題、分析原因,到落地建議;??這還是一個(gè)“解構”的過(guò)程:從整體拆到局部,從一般到特殊,從面到線(xiàn)到點(diǎn),不斷下鉆剖析,找到具體可落地的點(diǎn)。
了解完什么是數據分析??后,深入思考一個(gè)問(wèn)題:這個(gè)過(guò)程的最終產(chǎn)出的交付(′ω`)物是什么?ヽ(′▽?zhuān)?ノ
要回答這個(gè)問(wèn)(wen)題,我們需要回到數據分析的本質(zhì):解決業(yè)務(wù)問(wèn)題??。也就是回到業(yè)務(wù)層面的需求是什么,才能決定(ding)最后落地交付物:
最常見(jiàn)的數據分析場(chǎng)景,就是業(yè)務(wù)發(fā)現銷(xiāo)售額下降、(′▽?zhuān)?)用戶(hù)流失、產(chǎn)品跳失率高,也就是業(yè)務(wù)層面出現了一個(gè)問(wèn)題待解決,此時(shí)需要數據分析師介入幫助從數據層面挖掘原因、給出解決建議。
分析過(guò)程可能是做一些探索性數據分(′ω`*)析、統計分析、機ヽ(′▽?zhuān)?ノ器學(xué)習建模,甚至是做AB測試實(shí)驗,(′;ω;`)最終交付分析報告,或者模型部署上線(xiàn)。
有時(shí)業(yè)務(wù)可能并不存在確切的“問(wèn)題”,更(geng)多旨在通過(guò)加深對現有場(chǎng)景的理解,來(lái)提高現有業(yè)務(wù)模型、策略的效果;比如,現在業(yè)務(wù)使用的是客單價(jià)平均值將客戶(hù)分為高、低兩個(gè)人群??進(jìn)行營(yíng)(′?_?`)銷(xiāo),此時(shí)數據分析( ?▽?)師通過(guò)對消費者的洞察分析,給予更精準的人群劃分方案:利用客單價(jià)分位數,將客戶(hù)分為三個(gè)人群,這樣業(yè)務(wù)利(li)用更新后的策略進(jìn)(jin)行營(yíng)銷(xiāo)設計,提高轉化效果。
分析過(guò)程可能是做相關(guān)分析、回歸分析,甚至是無(wú)監督的聚類(lèi),來(lái)對現狀進(jìn)行解釋。
按照需求的時(shí)效性,可以把業(yè)ヾ(^-^)ノ務(wù)需求分為臨時(shí)需求和常規需求,而前面兩者屬于業(yè)務(wù)的臨時(shí)需求,或者說(shuō)是專(zhuān)項分析需求。對于常規需求,主要旨在提高業(yè)務(wù)流程的效率,比如對于電商運營(yíng)中的商品庫存管理業(yè)務(wù),運營(yíng)需要及時(shí)查詢(xún)庫存情況,并(bing)結合銷(xiāo)售趨勢對低庫存量的商品進(jìn)行補單;此時(shí),數據分析師可以通過(guò)交付“低庫存預警報表”來(lái)幫助優(yōu)化該流程效率。
支持診斷的內容主要集中在自動(dòng)化的報表,??甚至是商業(yè)智能(BI)體系的搭建。
如果??說(shuō)前面是基于已知模式的??分析,那么業(yè)務(wù)中還存在一種(zhong)需求,就是對??未知的探索。(′?`*)最為典型的場(chǎng)景則是對市場(chǎng)、對消費者的洞察后,給出品牌及業(yè)務(wù)增長(cháng)的策略。
分析過(guò)程更多是基于行業(yè)、基于市場(chǎng),使用如PEST、SWOT、波特五力等商業(yè)分析模型。
至此,我們知道了數據分析是什么,以及最終的產(chǎn)出交付物,那這個(gè)過(guò)程如何實(shí)現的呢?從落地的角度來(lái)看,數據分析是一個(gè)從發(fā)散到收斂的過(guò)程:業(yè)務(wù)理解-數據探索-分析模型-落地交付-產(chǎn)品生命周期
數據分析是從業(yè)務(wù)到數(′?`*)據再回到業(yè)務(wù)的過(guò)程,所以理解業(yè)務(wù)是數據分析的起點(diǎn)ヽ(′▽?zhuān)?ノ。
“無(wú)場(chǎng)景不分析”、“脫離業(yè)務(wù)(′ω`)場(chǎng)景的分析都是耍流氓”等資深數據分析師的建議無(wú)??不說(shuō)明業(yè)務(wù)場(chǎng)景的重要性??。數據分析能力模型中的業(yè)務(wù)場(chǎng)景模型:用戶(hù)-產(chǎn)品-場(chǎng)(′ω`)景,就是為了幫助讀者理解業(yè)務(wù)場(chǎng)景而設計的,在這里不贅述。
不知道讀者有沒(méi)這樣的體??驗?就是領(lǐng)導交代任務(wù)給你,或者???是(′ω`)朋友有求于你時(shí)(shi),執行力強的人很快就完成了任務(wù)請求,但是最后卻被告知這結果并不是對方想要(yao)的?這種情況很常發(fā)生在初??入數據分析崗位的(′;д;`)新同學(xué)身上,原因歸根結底就是沒(méi)有做好問(wèn)題定義!
在理解了需求所處的業(yè)務(wù)場(chǎng)景后,可以
其實(shí),很多企業(yè)都在討論數據分析師的價(jià)值在哪?從這一現象可以看出數據分析師需要時(shí)刻關(guān)注價(jià)值產(chǎn)出,圍繞價(jià)值的開(kāi)展工作。
如果說(shuō)前面??定義問(wèn)題是明確做什么,那在這一步就是要明確做到什么程度?
比如面對銷(xiāo)售額下降的問(wèn)(′_`)題,做數據分析,最終是產(chǎn)出一份數據分析報告就好了,(′▽?zhuān)?)還是說(shuō)需要介入到測試實(shí)驗,給ヾ(′?`)?出增長(cháng)策略?如果是后者,那對銷(xiāo)售額的提升幅度要提升多少才有價(jià)值?(??-)?是不痛不癢的1%還是要達到顯著(zhù)的10%?
如果不在價(jià)值層面做思考,并付諸價(jià)值落地的行動(dòng),最后很容易產(chǎn)生“價(jià)值在哪”的靈魂拷問(wèn),面臨被優(yōu)化的風(fēng)險。??
在業(yè)務(wù)理解階段,我們是站在業(yè)務(wù)層面與需求方溝通(′_`),但是(′?ω?`)數據分析的核心部分都是在數據層面進(jìn)行的。所以在正式開(kāi)始分析之前,我們需要把業(yè)務(wù)需求轉成數據需求,這個(gè)過(guò)程就是數據探索。
拿到業(yè)務(wù)需求時(shí)的定義問(wèn)題階段,需要數據的輔助:用數據透視業(yè)??務(wù),判斷現狀與描述是否一致。比如,業(yè)務(wù)說(shuō)銷(xiāo)售額下降了需要分析,但是這個(gè)下降是和誰(shuí)比(??-)??環(huán)比下降但是同比提升,同比下降,但是和競品相比是提升的。
這個(gè)步驟比較多的是使用探索性數據分析(Exploratory da??ta analysis),或者說(shuō)通過(guò)常(?????)(chang)見(jiàn)的統計指標來(lái)對數據??現狀(zhuang)進(jìn)行剖析。
如果說(shuō)第一步是在用數據驗證需求的有效性,那這一步則是真正把業(yè)務(wù)問(wèn)題轉為數據需求。
此外,還需要判斷數據質(zhì)量及能做的特征工程,比如某些字段缺失率太高,這會(huì )影響特征的構建。??
了解業(yè)務(wù)、明確數據需求后,就可以挑選合適的武器(分析方法、模型框架)上陣。
概括來(lái)說(shuō),有四種分析方法:
指標的好壞、特征是否顯著(zhù)等都┐(′?`)┌可以通過(guò)比較分析的方法來(lái)實(shí)現,比如常見(jiàn)的歸因業(yè)務(wù)場(chǎng)景,本質(zhì)就ヽ(′ー`)ノ是??做比較,通過(guò)橫向、縱向的比較找出原因。
分析方(fang)法(′_ゝ`):比如T檢驗、??方差分析、同比環(huán)比、同期群分析等
分析變量之間的相關(guān)性是重要的分析場(chǎng)景。比如業(yè)務(wù)中想知道提高廣告預算是否能、甚至是能提升多少的銷(xiāo)售業(yè)績(jì)?這樣的相關(guān)性分(fen)析或許能找到最優(yōu)投放ROI的配置方案。
分析方法:卡方、皮爾遜(Pearson)相關(guān)系數、斯皮爾曼(Spearman)相關(guān)系數、結構分析等
不論是對企業(yè)銷(xiāo)售的預測、還是對用戶(hù)行為的預測,都能幫助提升業(yè)務(wù)效率,比如常見(jiàn)的預測用戶(hù)流失(′▽?zhuān)?)分析,及時(shí)得到高概率流失的人群名單,運營(yíng)通過(guò)提前營(yíng)銷(xiāo)干預,提高用戶(hù)留存率;常見(jiàn)的銷(xiāo)售預測能幫助企業(yè)在供應鏈側做準備。這類(lèi)場(chǎng)景主要應用的是機器學(xué)習中的有監督分類(lèi)模型。
分析方法:線(xiàn)性/邏輯回歸、決策樹(shù)、時(shí)間序列分析、貝葉斯等;
分析方(fang)法:Kmeans???聚類(lèi)、DBScan聚類(lèi)等;
交付落地的最佳實(shí)踐是讓數據和分析從理論滲透到業(yè)務(wù)中,對流程進(jìn)行變革提效。
在交付給業(yè)務(wù)之前,需要先對給出的解決方案做有效性評估:
分析如果涉及模型的開(kāi)發(fā)使用ヾ(′?`)?,需要通過(guò)AB測試,或者ROC等指標來(lái)證明模型在數據層面上的有效。在數據層面完成驗證后,回到業(yè)務(wù)分析需求,評估交付的(de)方案在業(yè)務(wù)層面上的有效落地。
數據分析是圍繞業(yè)務(wù)價(jià)值而展開(kāi)的,所以在最后的落地,也得就價(jià)值進(jìn)行討論,
A. 途徑是對流程的優(yōu)化(降本提效)還是對數據的優(yōu)化(數據體系效率、數(′?_?`)據質(zhì)量)?
B. 這方式能多大程度上幫助解決?比如對業(yè)務(wù)的提升是10%還??是30%?是對單次項目??的應用,還是說(shuō)可以部署到日常流程中,在更長(cháng)時(shí)間、更廣范圍內影響業(yè)務(wù)?
如何做到?講數據故事:起因(需求定義)、過(guò)程(分析邏輯)、結局(重要結論)是否引人入ヽ(′ー`)ノ勝(??被認可)。
這個(gè)過(guò)程需要制作PPT向上匯報、與業(yè)務(wù)溝通,甚至是做跨部門(mén)的演講。
不論是業(yè)務(wù)模型還是算法模型,最終都有一個(gè)“靴子落地”的過(guò)程--落地實(shí)施。模型測試有效、與業(yè)務(wù)達成共識后就到了模型的部署上線(xiàn)階段:
接在分析生命周期最后的是(shi)分析產(chǎn)品的生命周期:以產(chǎn)品的思維看待數據分析,交付至業(yè)務(wù)落地的模型應用就是產(chǎn)品。數據分析這個(gè)過(guò)程并不是靜態(tài)(′ω`*)、單次的,而是一個(gè)PDCA不斷迭代升級的過(guò)程。??(??這個(gè)分析產(chǎn)品的定義包括分析服務(wù)、(′ω`)數據產(chǎn)品。)
從產(chǎn)品思維的角度,分析結論落地到業(yè)務(wù)流程中,對??流程進(jìn)行再造,提高運營(yíng)效率。
當數據分析流程成熟后,大量重復執行的流程可以抽取出( ?° ?? ?°)來(lái),形成自動(dòng)化的產(chǎn)品,用于服務(wù)數據分析(主要對象為數據分析師,也包括運營(yíng)),這就是數據產(chǎn)品。分析師的結論模型就可ヽ(′?`)ノ以部署到現有的數據產(chǎn)品中,優(yōu)化分析效率。
之所以要從產(chǎn)品思維的角度來(lái)看數據分析過(guò)程,是因為要像迭代產(chǎn)品那樣去迭代分析模型:不(′?`)論是優(yōu)化算法參數,ヾ(′?`)?還是調整分析框架,都能得(′ω`)到更優(yōu)的結(′▽?zhuān)?)論。
在數據分析??生命周期第??一步的“理解業(yè)務(wù)”中,我們提到業(yè)務(wù)場(chǎng)景(???)的重要性。??
根據業(yè)務(wù)經(jīng)驗,筆者沉淀了一套便于理解的模型:業(yè)(′?_?`)務(wù)場(chǎng)景ヽ(′▽?zhuān)?ノ = 用戶(hù) × 產(chǎn)品 × 場(chǎng)景
也就是說(shuō),要理解業(yè)務(wù),??就要了解用戶(hù),熟悉產(chǎn)品,明確分析所處的上下文場(chǎng)景。它們決定了分析的目標、處理邏輯以及落地建議。
對數據分(fen)析有了底層認知、了解業(yè)務(wù)場(chǎng)景后,就需要有看得見(jiàn)摸得著(zhù)的(de)“招式”來(lái)行動(dòng):思維方法、工具技術(shù)和項目能力這三板斧能組成不同招式應對多變的問(wèn)題。
經(jīng)常(chang)看到有人說(shuō)數據分析如做飯,如果(guo)是這樣的話(huà),
很多人學(xué)做ヽ(′ー`)ノ飯,可能是因為在抖音或B站看到某個(gè)美食視頻,然后就開(kāi)始按照(′?`)視頻步驟備料烹飪。這個(gè)過(guò)程,ヽ(′ー`)ノ也就是數據分析中學(xué)習思維方法的過(guò)??程。數據分析也是先有思維方法,才能談得上是分析。
剛開(kāi)始學(xué)做飯時(shí),通常先學(xué)基礎的煎、炒、炸、烤、煮、蒸、燜、拌烹飪方式。這些(xie)基礎的能力在數據分析中就是統計學(xué)、相關(guān)分析、歸因分析等(°o°)通用分析思維。
正如美食有八大菜系,分別滿(mǎn)足不同地域人群的口味,數據分析在(′;ω;`)不同場(chǎng)景下,也┐(′д`)┌有不同的“分析”招式來(lái)滿(mǎn)足不同的業(yè)務(wù)需求:
習得了做飯的方法后,就可以選擇幾件趁手的器皿,來(lái)提高烹飪效率。
之所以不是先選擇器皿再研究做飯流程,是因為工具始終是工具,完成同一個(gè)目標或許有多種工具可以實(shí)現,再不濟我用原始(′;ω;`)的土灶也能燒飯。
不過(guò)對于部分復雜的烹飪需求,也是需要選擇特定的器皿才能完成??。
常見(jiàn)的工具技術(shù)及應用:
菜做好后一定要及時(shí)出鍋、裝盤(pán)、上菜,要不然再ヽ(′ー`)ノ美味的菜肴也只是空中閣樓。
項目能(O_O)力強調的是數據分析項目的落地。理論的分析方法如何在業(yè)務(wù)場(chǎng)景中落地賦能,體現數據價(jià)值?這是很多企業(yè)數據團隊在討論的課題。
說(shuō)項目能力像是烹飪最后的上菜階段,其實(shí)不太嚴謹,因為落地能力是一種軟性的能力,貫穿分析項目的整個(gè)過(guò)程:
版權聲明:本文內容由互聯(lián)網(wǎng)用戶(hù)自發(fā)貢獻,該文觀(guān)點(diǎn)僅代表作者本人。本站僅提供信息存儲空間服務(wù),不擁有所有權,不承擔相關(guān)法ヽ(′▽?zhuān)?ノ律責任。如發(fā)現本??站有涉嫌抄襲侵權/違法違規的內容, 請發(fā)送郵件至 [email protected] 舉報,一經(jīng)查實(shí),本站將立刻刪除。