亚洲女同成aV人片在线观看|亚洲www啪成人一区二区麻豆|亚洲国产中日韩精品综合|亚洲国产成人精品一级片|亚洲无码在线视频免费

快速導航×

淘寶用戶(hù)行為分析案例(數據分析Day6實(shí)戰)發(fā)表于: 2026-05-04 17:25:53

淘寶用戶(hù)行為分析案例(數據分析Day6實(shí)戰)

一、淘寶項目背景

本數據報告以淘寶app平臺為數據集,用戶(hù)通過(guò)行業(yè)的分析分析指標對淘寶用戶(hù)行為進(jìn)行分析,從而探索淘寶用戶(hù)的案例行為模式,具體指標包括:日PV和日UV分析,數據y實(shí)付費率分析,淘寶復購行為分析,用戶(hù)漏斗(dou)流失分析和用戶(hù)價(jià)值RFM分析。分析??分析

二(er)、??案例數據來(lái)源

三、數據y實(shí)提出問(wèn)題

1.日PV有多少

2??.日UV有多少

3.付費率情況如何

4.復購率是淘寶多少

5.漏斗流失情況如何

6.用戶(hù)價(jià)值情況

四、理解數據

本數據集共有104萬(wàn)條左右數據,用戶(hù)數據為?淘寶APP2014年11月18日至2014年12月18日的分析分析用戶(hù)行為數據,共計6列字段,案例列字段分別是數據y實(shí):

user_id:用??戶(hù)身份,脫敏

item_id:商品ID,脫敏

behavior_type:用戶(hù)行為類(lèi)型(包含點(diǎn)擊、收藏、加購物車(chē)、支付四種?行為,分別用數字1、2、3、4表示(shi))

user_geo??hash:地理位置

item_c??ategory:品類(lèi)ID(商品所屬的品類(lèi))

time:用戶(hù)行為發(fā)生的時(shí)間

五、數據清洗

# coding:utf-8im??port pandas as pdimpo??rt numpy as pyimport matplotlib.pyplot as pltimport se??aborn as(′_`) snsimport re#設置列數據全顯示pd.set_option('display.max_columns', None)data_user = pd.read_csv(r'.\tianchi_mobile_recomm??end_train_user.csv')missing(′▽?zhuān)?Total = data_user.isnull().sum()missingExist = missingTotal[missingTotal > 0]missingExist = missingExist.sort_values(ascending=False)print(missingExist)print(missingTotal)(′?`*)

存在缺失值的是User_geo??hash,有717785條,不能刪除缺失值,因為地理信息在數據集收集過(guò)程中做過(guò)加密轉(⊙_⊙)換,因此對數據集不做處理。

data_user.head()# 拆分數據集data_user['date'] = data_user['time'].map(lambda s: re.compile(' ').split(s)[0])data_user['hour'] = datヾ(′?`)?a_usヾ(′?`)?er['time'].map(lambda s: re.compile(' ').split(s)[1])data_uヽ(′ー`)ノser.head()??#查看data_user數據集數據類(lèi)型:data_user.dtypes#發(fā)現time列和date列應該轉化為日期類(lèi)數據類(lèi)型,hour列應該是字符串數據類(lèi)型。#數據類(lèi)型轉化data_user['date']=pd.to_datetime(data_user['date??'])data_user['time']=pd.to_datetime(data_user['time'])data_use(′ω`)r['hour']=data_user['hour'].astype('int64')data_user.dtypes#異常值處理data_user = data_user.sort_values(by='time',ascend(′▽?zhuān)?)ing=True)data_user = data_user.reset_index(drop=True)d(′?ω?`)ata_user.describe()

image.png

通過(guò)觀(guān)察數據集的四分位數,總數,平均值,方差等,發(fā)現數據集并無(wú)異常值存在。

六、用戶(hù)行為分析

(1)pv和uv分析

PV┐(′?`)┌(訪(fǎng)問(wèn)量):即Page View, 具體是指網(wǎng)站的是頁(yè)面瀏覽量或者(′;ω;`)點(diǎn)擊量,頁(yè)面被刷新一次就計算一次。

UV(獨立訪(fǎng)客)(╯°□°)╯︵ ┻━┻:即Unique Visitor,訪(fǎng)問(wèn)您網(wǎng)站的一臺電腦客戶(hù)端為一個(gè)訪(fǎng)客。

1)(′?_?`)日訪(fǎng)問(wèn)量分??析

# pv_dail??y記錄每天用戶(hù)操作次數,uv_daily記錄每天不同的上線(xiàn)用戶(hù)數量pv_daily = data_user.groupby('date')['user_id'].count().reset_index().rename(columns={ 'user_id': 'pv'})uv_daily = data_user.groupby('date')['user_id'].apply(lambda x: x.drop_duplica(′?_?`)tes()ヽ(′?`)ノ.count()).reset_index().rename( columns={ 'user_id': 'uv'})fig, ax(╬?益?)es = plt.subp???lots(2, 1, sharex=True)pv_daily.plot(x='date', y='pv', ax=axes[0])uv_daily.plot(x='date',(?????) y='uv', ax=axes[1])axes[0].set_title('pv_daily')

結果顯示如上圖所示,在雙十二期間,pv和uv訪(fǎng)問(wèn)量達到峰值,并且可以發(fā)現,uv和pv兩個(gè)(???)訪(fǎng)問(wèn)量數值差距比較大,同時(shí),因為數據集總人數大約是10000人左右,因此,通過(guò)nv值可以分析出雙十二期間淘寶用戶(hù)的日活躍大概是45%浮動(dòng)。

#小時(shí)訪(fǎng)問(wèn)量分析#pv_hour記錄每小時(shí)用戶(hù)操作次數,uv_hour記錄每小時(shí)不同的上線(xiàn)用戶(hù)數量pv_hour=data_user.groupby('hour')['user_id'].count().reset_index().ren(′?_?`)ame((⊙_⊙)columns={ 'user_id':'pv'})uv_hour=??d( ?ω?)ata_u(′ω`)ser.groupby('hour')['use(′?ω?`)r_id'].apply(lambda x:x.drop_dup(//ω//)licat??es().count()).reset_index().rename(columns={ 'user_i??d':'uv'})fig,axes=plt.subplots(2,1,sharex=True)pv_hour.plot(x='hour',y='pv',ax=axes[0])uv_hour.p(′?`)lot(x=ヾ(′▽?zhuān)??'hour',y='uv',ax=axes[1])axes[0].set_t(╬?益?)itle('pv_hour')axes[1].set_title('uv_hour')

圖表顯示:pv和( ?ヮ?)uv在凌晨0-5點(diǎn)期間波動(dòng)(′?_?`)情況相同,都呈下降趨勢,訪(fǎng)問(wèn)量都比較小,同時(shí)??在晚上18:00左右,pv波動(dòng)情況比較劇烈,相比來(lái)看(′?`)u??v不太明??顯,因此晚上18:00以后是淘寶用戶(hù)訪(fǎng)問(wèn)app的活躍時(shí)間段。

#不同行為類(lèi)型用戶(hù)pv分析pv_detail=data_user.groupby(['behavior_type','hour'])['user_id'].count().reset_index().rename(columns={ 'user( ?° ?? ?°)_id':'total_pv'})fig,axes=plt.subplots(2,1,sharex=Tru??e)sns.pointplot(x='h??our',y='total(′ω`)_pv',hue='behavior_type',data=pv_detai(′_`)l,ax=axes[0])sns.pointplot(x='hour',y='total_pv',hue='behavior_type',data=pv_detail[pv_detail.behavior_type!=1],ax=axes[1])axes[0ヾ(′?`)?].set_title('pv_dif?ferent_behavior_( ?ヮ?)type')#axes[1].set_title('uv_different_behavior_type')

有圖表顯示:點(diǎn)擊這一用戶(hù)行為相比較于其他三類(lèi)用戶(hù)行(xing)為,pv訪(fǎng)問(wèn)量較高,同時(shí)三種用戶(hù)行為的波動(dòng)情況基本一致,因此晚上這ヽ(′▽?zhuān)?ノ一時(shí)間段不管哪一種用戶(hù)行為,pv訪(fǎng)問(wèn)量都(′?_?`)是最高的。從圖2可以看出,加入購物車(chē)這一用戶(hù)行為的pv總量高于收藏的總量,因此在后續漏斗流失分析中??,用戶(hù)類(lèi)型3應該在2之??前分析。

七、用戶(hù)消費行為分析

(1)用戶(hù)購買(mǎi)次數情況(kuang)分析data_user_(′ω`)buy=da??ta_u??ser[data_user.behavior_type==4].groupby((???)'user_id')['behavior_type'].count()sns.distplot(data_user_buy,kde=False)plt.title('daily_user_buy')

圖表顯示:淘寶用戶(hù)消費次數普遍在10次以?xún)?,因此需要重點(diǎn)關(guān)注購買(mǎi)次數在10(′?`)次以上的消費者用戶(hù)群體。

(2)日ARPPU

ARPPU(average revenue per paying user??)是指從每位付費用戶(hù)身上獲得的收入,它反映的是每個(gè)付費用戶(hù)的平均付費額度。

ARPPU=總收入/活躍用戶(hù)付費數??量

因為本數據集中沒(méi)有消費金額,因此在計算過(guò)程中用消費次數代(dai)替消費金額

人均消費次數=消費總次數/消費人??數

data_use_buy1=data_user[data_user.(′?`)behavior_type==4].groupby(['date','user_id'])['behavior_type'].co(╬ ò﹏ó)unt(??).reset_in┐(′ー`)┌dex().rename(columns={ 'behavior_type':'total'})d(′ω`)ata_use_buy1.groupby('date')(′?_?`).apply(lambda x:x.total.sum()/x.total.count()).pl(′?`)ot()plt.title('daily_ARPP(°ロ°) !U')

圖表顯示:平均每天消費次數在1-2次之間波動(dòng),雙十二(??ヮ?)?*:???期間消費次數達到最高值。

(3)日ARPU

ARPU(Average Revenue Per User) :平均每用戶(hù)收入,可通過(guò) 總收入/AU 計算得出。它可以衡量(╯°□°)╯產(chǎn)品的盈利能力和發(fā)展活力。

活躍用戶(hù)數平均消費次數=消費總次數/活躍用戶(hù)人數(每天有操作行為的為活躍)

d(′?_?`)ata_??user[ヽ(′▽?zhuān)?ノ'operation']=1data_use_??buy2=data_??user.groupby(['date','user_id','behavior_type'])['opera(?Д?)tion'].cou??nt().reset_index().rename((′Д` )columns={ 'operation':'total'})data_use_buy2.groupby('date').apply(lambda x:x[x.behavior_type==4].total.sum((??ヮ?)?*:???)/le(′ω`)n(x.user_id.unique())).plot()plt.title('daily_ARPU')

(4)付費率#付??費率=消費人數/活躍用戶(hù)人數

data_use_buy2.(°o°)groupby('date').apヾ(^-^)ノply(lambda x:x[x.behavior_type==4].total.count()/len(x.user_id.unique())).plot()plt.ti??tle('daily_af??ford_rate')

(5)同一時(shí)間段用戶(hù)消費次數分布

data_user_buy3=data_useヽ(′ー`)ノr[data_user.behavior_type==4].groupby(['user_id','date','hour'])['operation'].sum()??.rename('buy_count')sns.distplot(data_user_buy3)print('大多數用戶(hù)消費:{ }次'.format(data_user_buy3.mode()[0]))

image.png

八、復購情況(kuang)分析

#復購情況,即兩天以上有購買(mǎi)??行為,一天多次購買(mǎi)算一次#復購率=有復購行為的(???)用戶(hù)數/有購買(mǎi)行為的用戶(hù)總數date_rebuy=data_user[data_user.behavior_type==4].groupby('user_id')['date'].apply(lambda x:len(x.unique())).rename('rebuy_count')print('復購率??:',round(date_rebuy[date_rebuy>=2].count()/date_rebuy.count(),4))

復購率: 0.8717

#所有復購時(shí)間間隔消費次數分布data_day_buy=data_user[data_user.??behavior_type==4].groupbyヽ(′?`)ノ(['user_id','dat( ?° ?? ?°)e']).operation.cou???nt().reset_index()dataヽ(′ー`)ノ_user_buy4=data_(′_ゝ`)day_buy.groupby('user_id').date.apply(lamb(????)da x:???x.sort_values().diff(1).dro??pna())data_user_buy4=data_user_buy4.map(lambda x:x.days)data_user_buy4.value_counts().plot(kind='bar')plt.title('time_gaヾ(′ω`)?p')plt.xlabel('gap_day')??plt.ylabel('gap_count')

多數用戶(hù)復購率(?Д?)為0.4693,消費次數隨著(zhù)消費時(shí)間間隔的增加而不斷下降,在1-10天??之內復購次數比較多,10天之后復購次數淘寶用戶(hù)很少在進(jìn)行復購,因此需要重視10天之內的淘寶用戶(hù)復購行為,增加用戶(hù)復購。不同用戶(hù)平均復購時(shí)間呈正態(tài)分布,但是總體來(lái)看,呈現逐漸下降趨勢。多數淘寶用戶(hù)平均復購時(shí)間集中在1-5天時(shí)間間隔內。

九、漏斗流失分析

漏斗分析是一套流程式數據分析,它能夠科學(xué)反映用戶(hù)行為??狀態(tài)以及從起點(diǎn)到終點(diǎn)各階段用戶(hù)轉化率情┐(′?`)┌況的重要分析模型。

data_user_count=data_user.groupby(['behavior_type']).count()data_user_??count.head()pv_all=data_user['user_id??'].count()print(pv_a??ll)

12256906

十、用戶(hù)行為與商品種類(lèi)關(guān)系分析#不同用戶(hù)行為類(lèi)別的轉化率

data_category=data_user[data_user.behavior_type!=2]??.groupby(['??item??_category??','behavior_type']).operation.count().??unstack(1).rename(columns=??{ 1:'點(diǎn)擊量',3:'加入購物車(chē)量',4:'購買(mǎi)量'}).fillna(0)data_category.head()
亚洲女同成aV人片在线观看|亚洲www啪成人一区二区麻豆|亚洲国产中日韩精品综合|亚洲国产成人精品一级片|亚洲无码在线视频免费 通山县| 保康县| 嘉峪关市| 青河县| 天水市| 新营市| 亚东县| 南华县| 南充市| 孙吴县| 本溪| 东台市| 鹤庆县| 梨树县| 三穗县| 孙吴县| 邓州市| 洛隆县| 苏尼特左旗| 建德市| 鄄城县| 会泽县| 海晏县| 特克斯县| 彭水| 临夏县| 定日县| 蒙自县| 玉龙| 炉霍县| 上思县| 江北区| 彭山县| 随州市| 诸暨市| 和林格尔县| 石景山区| 迁西县| 民乐县| 岳阳市| 永丰县| http://444 http://444 http://444 http://444 http://444 http://444