黃天文將用戶增長分為三大流派,分別是市場營銷派、實驗增長派和技術派,下面簡單介紹下這三大流派:
1、市場營銷派——做品牌和花錢買流量
市場營銷派做不好,叫流量獲取,這活誰都能干,只要給錢就有量;做的好才叫用戶增長,通過對渠道精細化運營來調控獲客成本和質量。
2、實驗增長派——提出增長假設,做實驗
即,發現問題、提出想法、預期效果、測試、復盤,這5步稱之為一個增長周期,不斷循環這5步,致使數據達到增長目標。
3、技術派——就是大家常說的“增長黑客”,運用技術套利,實現低成本增長。
市場營銷和實驗增長派在之前的文章里已經介紹過(詳見本人之前的文章《如何用更少的錢,帶來更優質的量?| 渠道質量評估模型》和《沒有護城河的流量池,用戶來得快,流失更快》),所以今天就來個技術派跟大家分享一下。
真正做到know your customer(不是反洗錢的KYC哦),要像個“跟蹤狂”一樣,跟蹤用戶的關鍵行為,這個用戶看了首頁、又看了視頻頁、看了13篇文章、分享了1篇文章、點擊下單按鈕了、最終購買了某件商品。
從第一次啟動APP到購買的整個過程,都是你監控的范圍。甚至能通過購買前的一些行為,來預測用戶的購買概率,從而推動成交量的增長。
其實技術派的例子也是屢見不鮮:
如網飛(Netflix)通過分析客戶觀看的電影和節目,發現凱文史派西參演的電影和政治題材的電視劇都非常受用戶歡迎,所以才有的網飛制作電視劇《紙牌屋》;
商務智能公司RJMetrics的團隊發現,在使用其免費產品期間,用過軟件編輯圖表的用戶與沒用過此功能的用戶相比,轉化率高出一倍之多,隨后每多使用一次,其購買的可能性就會提高。
通過以上幾個例子,大家可以知道,大體邏輯就是基于用戶的行為,來判斷用戶另外一種行為的概率。紙牌屋的例子是通過用戶的觀看習慣,來推斷新產品是否受歡迎。RJMetrics公司是通過購買前的某些行為,來判斷用戶是否購買產品。
因此,我們就引出今天的主題:技術派是如何利用邏輯回歸模型實現用戶增長的——這也是增長三部曲的最后一部。
雖然在當下,深度學習模型已經成為時尚,但邏輯回歸仍然堅守在第一線,靠的就是其高時效性與高準確度性。許多銀行和金融平臺利用此模型預測借款人違約的概率,在金融領域都能站住腳,足以看出邏輯回歸的江湖地位。
很多運營同學聽到邏輯回歸模型都會大驚失色,覺得難度系數過高,所以下文提供了難易兩條路線供大家參考。第一條是“懶人”路線,第二條是“挑戰”路線。
“懶人”路線就是按照下文的步驟,把需求提給技術,也就是建模的過程交給技術(別跟我說技術不會邏輯回歸模型,只可能是你魅力不夠~~),在技術的輔助下,將模型結果拿來用就OK,適合所有運營人士;
“挑戰”路線則是自己建模分析,有時候人不逼一下自己怎么能行呢!沒準從此走上了用數據說話的道路,告別“數據神棍”。另外告訴大家一件事,數據運營比運營更來錢,運營的同學還在等什么,趕緊往數據轉吧哈哈哈~~
今天來跟大家分享的題目是,如何運用邏輯回歸模型促成交,提高GMV。
在做模型之前,確立自己的目標是什么?那就是讓用戶下單,重點放在沒有下單的用戶身上。如何去做?根據用戶行為,構建模型,找出下單用戶畫像。之后呢?我們要做兩件事。第一,引導沒有下單但已經具備下單潛質的用戶(預下單用戶)下單。第二,引導用戶成為預下單用戶。
選出你認為對下單有影響的變量,然后給到技術,讓技術算法大神根據這些行為list(變量)和最后是否下單(因變量)做一個模型,并告訴你模型的可行性和篩選后剩下的變量。如下圖:
用戶行為list圖
最后告訴你這個模型O不OK就搞定,OK就進入下一環節,不OK再繼續改善模型,直到模型成功為止。
有想挑戰的同學,推薦的建模工具有SPSS和python,如果是初學者的話,建議使用SPSS,操作簡單,不需要編程能力,網上有大量的邏輯回歸模型的教學視頻,快的一周,慢的一個月怎么也玩明白了。
簡單的說,邏輯回歸模型其實就是:將歷史用戶在下單前或者未下單前的行為,放進模型中,模型會模擬出一個方程,之后我們根據方程套用到新的用戶身上,來判斷哪些用戶下單的概率高,哪些行為對用戶下單影響較大,最后根據模型來做后續的策略。
下面我們就來簡述一下建模過程。
(1) 數據預處理
如下圖所示,紅色的“是否下單”這一列是目標值,指的是歷史用戶最終是否下單;藍色的各列是用戶下單前的行為。
下圖可以這樣解讀,每一行就代表著用戶從進入平臺到下單(未下單)的全路徑行為。
樣本數據圖
如上圖所示,模型中分為兩種變量,一種是連續變量,比如“瀏覽頁面數”,是按照自然數統計的;另外一種是啞變量,比如“是否下單”,1代表下單,0代表未下單。
到此為止樣本數據都已經處理完成,接下來就把這些數據導入到模型中,模型會給出相應的反饋結果。
(2) 檢驗模型
不是把數據扔進模型后就完事了,還要看一下模型擬合優度,說白了就是模型能不能用。如下圖
模型評估
這里只看步驟二紅框里的幾個數字就可以。
第一個是-2對數擬然值,這個值越低越好,在100以下就算可以接受,1000以下嘛也將將可以。第二個就是卡方&顯著性(Sig),卡方一般小于100,Sig<=0.05即可,說明模型當中的變量(用戶行為)對下單有顯著影響。
看完這3個數,就證明模型擬合優度OK,可以使用。當然除了統計學外,也可以通過AUC值作為模型的評價標準。
勞煩技術大神或算法大神把下單用戶的行為告訴你,并且把倍數關系告訴你,如下圖:
倍數關系圖
上圖的“是否注冊”為2.909,表示注冊的用戶,其下單的概率是未注冊用戶的2.909倍,換而言之,注冊比不注冊下單率高了近3倍。
再看 “生命周期”,生命周期長與生命周期短的比值0.998,說明生命周期越長,下單的概率越小。
至此第二階段就已經完成了,開始進入第三階段,模型應用篇。
將上面(一)中的數據輸入到模型中,待模型通過檢驗后,反饋給我們的數據,就是今天的重點。
模型方程變量圖
上圖的B代表邏輯回歸的系數,SE為標準誤,Wald是Wald卡方值,df為自由度,Sig是顯著程度,Exp(B)代表概率。
模型采用的是向后Wald法,篩選變量,步驟1中,模型發現是否“完成任務”對下單影響不顯著,所以在步驟2時,剔除掉此變量,留下的變量都是Sig<0.05的顯著變量。
通過B值構建邏輯回歸模型:
1.069是否注冊+0.93瀏覽新聞視頻數+0.06APP停留時長+0.076主頁停留時長+0.052啟動次數+0.004瀏覽頁面數+0.194看過頁面A+0.767看過成交頁-0.02生命周期-3.571
通過Sig我們可以知道:
當Sig<0.05時,該變量十分顯著,經過篩選(步驟2),這些變量的Sig全部小于0.05,說明我們選取的行為對下單的影響是非常顯著的。
通過EXP(B)我們可以得到的結論是:
有過該行為的用戶是沒有該行為用戶下單率的倍數。以“是否注冊”為例,在其他變量不變的情況下,注冊用戶的下單概率是非注冊用戶的2.909倍??催^頁面A的用戶是沒看過頁面A用戶的1.214倍。
模型結果解讀后,是不是覺得有很多東西值得我們去做的,模型雖好但若不能落地等于沒做,還是那句老話,不能將數據分析落地執行的業務需求都是耍流氓,所以我們這就開始講解模型的應用場景。
這一步開始“懶人”路線和“挑戰”路線就合并了,我也終于從“精神分裂模式”回歸成一個人了,不論是運營還是數據運營都可以完成本章內容,這一章可千萬別懶了。
下面列舉幾個應用場景,供大家參考。
應用場景一 模型觸達用戶
觸達可以分為兩種,全自動觸達和半自動觸達:
(1)全自動觸達:
通過上述回歸模型,在程序內可以將每一個用戶的下單概率算出來,篩選出下單概率高的用戶,自動觸發短信、PUSH或者紅包。
(2)半自動觸達:
半自動指的是我們并不用上述模型計算概率的方法選擇觸達用戶,而是將模型輸出的行為(變量)倍數關系作為參考,手動去選擇行為的閾值,這樣做可能會比全自動化計算出來的用戶多一點,在預算不吃緊的情況下可以用這種方式進行觸達。如下圖紅框所示:
半自動閾值圖
應用場景二 產品化即時彈窗
當用戶滿足上面提到的行為時,自動觸發彈窗,引導用戶下單。
這種方法其實要比場景一的轉化率高很多,因為觸達短信屬于后置動作,用戶在收到短信時,可能已經錯過最好轉化時機。而自動彈窗,會在用戶意愿值最高時,及時提醒并轉化。
這種產品化彈窗并不少見,比如騰訊的和平精英游戲,會在你獲得勝利(吃雞)時,彈出窗口,提醒你去應用商店給游戲打分。這樣做不僅能夠提高用戶評分率,還能保證好評率,是一種經典的產品運營方式。
應用場景三 產品化調整
通過模型我們知道提高下單轉化的三個重點指標依次為注冊、看過頁面A和看過成交頁。
那么我們從產品層面,要做一些調整,比如通過強制注冊或者調小注冊頁的跳過按鈕來提高注冊率;調整成交頁的下單按鈕的大小、位置和顏色;改變頁面A的入口深度,讓用戶更容易進入該頁等等;不要小看這些操作,比如下圖,將注冊頁由表單形式改成分布式,注冊率就能提升7%,如下圖所示:
產品改動提升注冊率圖
總而言之,我們通過改動產品,帶動重點指標增長,從而提高下單轉化率,是一種“曲線救國”的方法。
模型的拓展主要分為兩個方面,自身優化和橫向拓展。自身優化主要是針對下單模型如何進一步優化,提高準確度;橫向拓展是將模型套用到其他業務上,不光下單可以使用該模型,用戶留存、UGC互動行為等都可套用。
至此,整個邏輯回歸模型流程已經介紹完畢,后續還有多種分析方法以及策略,在這里只是拋磚引玉,就不多贅述了。
今天講的邏輯回歸模型可能有些硬核,其實模型原理很簡單,就是根據用戶的行為,去推斷用戶另一種行為的概率。邏輯回歸模型是一線機器學習工程師最愛模型,并非浪得虛名,熟練掌握此模型會對業務有非常大的幫助。
最后,我們就把今天分析的過程捋一捋:
模型流程圖
(1)確定增長目標
(2)用戶行為數據準備
(3)模型調試
(4)模型結果解讀
(5)模型的應用(產品層、技術層、運營層)
今天給大家介紹的技術派用戶增長之邏輯回歸模型就到這里了,這也是用戶增長三大流派中最難的一種,但也并非可遇不可求,相信自己。