在開始分析之前,我們需要了解貸款業務的流程,即每個用戶從購買到最終還款所涉及的所有環節。壹般來說,網貸的流程可以概括為:
通過用戶行為路徑分析,我們可以得到:
適用於對產品運營中的關鍵環節進行分析監控,找到薄弱環節,通過用戶引導或產品叠代進行優化,提升改造效果。
選擇壹個子集,分別統計每天申請貸款和審批貸款的新用戶和老用戶數量,然後計算新用戶的放款率。最後,使用合並功能將新的用戶結果表與舊的用戶結果表拼接起來。結果如下:
接下來,我們需要知道每天老用戶的數量,來計算用戶的還貸率。在這裏,老用戶的定義是:#前壹天借出,第二天繼續借的新用戶是老用戶#。對於存量老用戶,我們暫時不考慮,只看前壹天借款的人第二天是否繼續借款,該筆借款視為老用戶借款還款,所以我們取新用戶借款透視表前29天的數據+5月1的人員構成。
形成用戶路徑匯總表,計算每個節點的轉化率。
計算轉換漏鬥並計算匯總數據:
結果如下:
從結果來看,從PV到UV有很大的下降。正常情況下,壹個廣告可能會吸引10%-30%左右的用戶,但是點擊量非常巨大,所以造成這個結果。
從整體來看,很明顯4%的註冊人數比較低,也就是說用戶點擊很多,但是註冊人數很少。是否說明這個渠道有問題?我可以對比不同渠道的轉化漏鬥分析,看看是整個行業的轉化率低,還是單個渠道低,還是這個渠道用戶群不是我們想要的。
在消費金融公司,經常會通過日常監測發現,某個消費貸款產品的壹次超額率在逐漸上升。我們需要降低壹次通過率來減少產品帶來的損失,同時通過率也不能太明顯。
分析目標:通過數據探索和分析,制定能夠有效降低壹次通過率的策略。
分析思路:因為我們要分析的策略在申請時會被用來判斷客戶是否會逾期,所以策略分析的基本思路就是把這些有初次業績的客戶在申請時的數據還原出來(這個還原是指提取客戶在申請時各個維度的數據,越多越好),然後利用這些數據找出可以區分好壞客戶的變量,制定策略。
可以得出整體壹次通過率為30.76%。
這裏使用的是單變量分析的方法。單變量分析的主要目的是篩選出區分好壞較好的變量,以便制定策略。在小金公司的日常工作中,會有壹個團隊負責抓取變量,計算處理變量的數據。他們在不斷獲取和處理很多可能對風控有幫助的數據,並提供給我們的風控團隊,我們的風控人員需要從這幾千個變量中找出能夠控制逾期風險的變量,而不至於錯誤地拒絕很多好客戶。
統計結果如下:
統計結果如下:
在變量分析之後,這個時候,我們會選取比較有效的變量,這就涉及到壹個衡量變量是否有效的指標,提升程度。壹般來說,就是衡量拒絕最差部分客戶後,整體風控的改善效果。提升程度越高,變量越能有效區分好顧客和壞顧客,錯誤拒絕好顧客的可能性越小。如下,通過對所有變量的提升度進行逆序排列,發現個人信用查詢總數和客戶信用等級提升度最高,分別達到1.93和1.71。
通過上壹步的單變量分析,我們篩選出了改善程度最高的兩個變量:“信用查詢次數”和“信用評級”。如果拒絕這兩個變量最差的客戶,對整體逾期的影響將是。這種影響意味著我們假設‘信用查詢總數>;3,265,438+03客戶= 265,438+0全部拒絕後,其余客戶逾期率較拒絕前有所下降。最後我們得到的是,信用查詢量下降了3.4%,信用評級下降了7.5%。
用戶在使用產品的過程中有壹個用戶行為過程,不同時期用戶的表現可能有所不同。群體分析的主要目的是分析相似群體隨時間的變化,核心是比較分析同壹時期不同時間群體用戶的行為差異,所以也叫同時群體分析。
那麽在金融風控領域,最常用的壹個場景就是賬齡分析,用來監測用戶逾期率的變化。如下圖,M2和M3的逾期率比較高,然後調整風控策略,再進行分組分析,看策略是否有效。
結果如下:
這裏生成的新字段,orderperiod是用戶下單的月份,cohortgroup是根據每個用戶下單的最早時期生成用戶組,兩者是不壹樣的。
接下來,按用戶組和月份字段分組:
結果如下:
在orderperiod字段中,我們可以看到2019-01對應的最早消費月份是2009-01,02,03,05,但是2009-02,03,05對應的最早消費月份是相對而言的。
獲取:
因此:
註意上圖中每壹列代表當月最早的消費組,cohortperiod代表1,2,3,4月最早消費組的情況。例如,2019-01代表1月中最早消費群體的1、2、3、4月。
總而言之:
對同壹生命周期階段的用戶進行垂直分析,從而比較相似群體隨時間的變化,從上圖可以看出,用戶留存率是隨時間遞減的。
同時,通過對比不同時間的同期組,可以看出留存率有高有低的表現。從上圖可以看出,2065438年2月下跌,2065438年4月又上漲。
可能是在2019-03的時候用戶活動導致了這樣的結果,從而驗證了活動改進取得了明顯的效果。