怎樣利用數據挖掘潛在用戶(hù)?(利用數據挖掘潛在用戶(hù)的4個(gè)步驟)     DATE: 2026-05-05 08:38:45

文章分享了??一種挖掘潛在用戶(hù)的樣利用數用戶(hù)算法,與大家分享,ヽ(′ー`)ノ據挖掘潛希望可以給大家帶來(lái)啟發(fā)。利用

你是數據否收到過(guò)促銷(xiāo)短信?

你是否在打開(kāi)APP時(shí)發(fā)現有商家推送優(yōu)惠消息?

這只是簡(jiǎn)單的群發(fā)么?當然不是。

你在網(wǎng)站上的挖掘所有行為,代表著(zhù)你的潛用意向和需求,所以通過(guò)算法,個(gè)步網(wǎng)站就能把你推(°ロ°) !送給相應店家。樣利用數用戶(hù)

你以為網(wǎng)站靠賣(mài)賣(mài)賣(mài)賺錢(qián),據挖掘潛對沒(méi)錯,利用賣(mài)的數據就是你。

這只是挖掘個(gè)玩笑,接下來(lái)要講的潛用是,玩笑背后的個(gè)步真實(shí)買(mǎi)賣(mài)——如何挖掘潛在(╯°□°)╯用戶(hù)。

你關(guān)注過(guò)B端客戶(hù)的樣利用數用戶(hù)需求嗎?

潛客推薦

區別于“猜你喜歡”:發(fā)現用戶(hù)是幫助B端客戶(hù)挖掘潛客;??猜你喜歡是幫助用戶(hù)更了解自己的需求。以淘寶為例,為用戶(hù)推送她關(guān)注的紅色連衣裙,用推薦算法;那推薦哪個(gè)賣(mài)家的這條裙子呢,那就是要用到挖掘潛客了。

算法不同:猜你喜歡主要是相┐(′д`)┌似度算法,潛客推薦主(?????)要是客觀(guān)賦權和評分算法。

潛客推薦有什么用?

如果你是普通用戶(hù),那么看完整篇文章你就明白你是怎么收到商家短信的。如果你是B端PM,試試看也做一款這樣的產(chǎn)品,或者提提建議也行。如果你是B端商家(jia),考慮下你是??否也??有這個(gè)需求。

接下來(lái)要介紹的發(fā)現潛客算法:

怎么找到潛在用戶(hù)?

1.算法數據支撐

全網(wǎng)用戶(hù)的所有行為:為了更好地說(shuō)明,簡(jiǎn)化為瀏覽、收藏、在線(xiàn)咨詢(xún)這三種行為。

這里涉及到一個(gè)概念“差異驅動(dòng)”:當評價(jià)對象在某一指標的差異越大時(shí),我們認為這個(gè)評價(jià)指標的重要性越大。

所以,這三種行為代表用戶(hù)購買(mǎi)意愿由弱到強。

2.算法邏??輯

第一步:計算行為的出現概率

首先,通過(guò)近一( ?ω?)個(gè)月的用戶(hù)行為數據,算出瀏覽、收藏、在線(xiàn)咨詢(xún)這三種行為出現的概率,依次記做P’1、P’2、P’3,假設計算結果為70%、20%、10%。

第二步:為不同行為客觀(guān)賦權

我們需要利用信息熵來(lái)對行為客觀(guān)賦權。主觀(guān)上,也可以自定義權重,當然也能根據上一步的概??率來(lái)賦權,但為了更精確地進(jìn)行用??戶(hù)評分,需要用特定算法來(lái)處理。

首先,信息熵計算

信息熵是衡量一個(gè)系統的有序化程度,熵越大表示信息無(wú)序化程度越高,信息效用越(yue)低。比如球場(chǎng)上一方??勝率為70%另一方30%,比兩方勝率??不明確(均為50??%)的熵要小,勝率越明確信息越有效。

其原ヽ(′?`)ノ理可( ?ヮ?)參考論文《利用信息熵??計算評價(jià)指標權重原理及實(shí)例》,作者羅進(jìn)。

信息熵由信息論之ヾ(?■_■)ノ父Shannoヾ(?■_■)ノn提出 ,公式(shi)為:

這里的Pi就是代表某一??行為的概率,該公式是正相關(guān)的關(guān)系,但本文中“用戶(hù)行為的P’i越小表示行為越(yue)重要,故權重越小”,為了糾正變量之間的關(guān)系,取其倒數Pi=1/P’i,這樣才( ?ヮ?)符合我們需求——變量負相關(guān)??。

接著(zhù),數據歸一化處理(li)

由于不同行為的性質(zhì)不同,如果直接用原始值進(jìn)行對比,就會(huì )突出數值較高的指標在綜合分析中的(de)作用,同時(shí)弱化數值較低的指標的作用,從而使各指標以不等權參加運算分析。為避免這一點(diǎn),會(huì )(hui)對數據進(jìn)行無(wú)量綱ヽ(′▽?zhuān)?/化處理,也??稱(chēng)歸一化。算法多樣化,一般是算(′?_?`)出標準差或極值來(lái)作為歸一化的系數,記做C。

具體計算方法和原理可參考:http://www.docin.com/p-674202391.html

最后,行為權重計算

加入歸一化系數,使權重統一化,公(???)式為:

第三步:行為分值確定

給每種行為(′?_?`)分配分值:

設瀏覽行為的分值為T(mén)1,則收藏T2=T1*(W2/W1),電話(huà)咨詢(xún)T3=T1*(W3/W1)

第四步:用戶(hù)評分

小明??今天瀏覽、收藏、電話(huà)咨詢(xún)的次數記為a、b、( ?ω?)c,那么其分數為:

效果評估

首先,此算法可以有多種變種。如果要做得更圓滿(mǎn),應該還要考慮權重的時(shí)間變化(比如永遠以??最近30天的行為(′?`*)來(lái)計算概率)、加入用戶(hù)的消極行為(取關(guān)(guan)、投訴、差評)、用戶(hù)習?慣(購買(mǎi)周期、頁(yè)面停留時(shí)間等)、用戶(hù)現狀(已購哪些、已退?哪些、收藏哪些)等完善用戶(hù)畫(huà)像。