模型的設計對模型最終是否能實現其目標起著舉足輕重的作用。為了保證模型的設計可以滿足模型的目標,審批人員應需要關註的是從哪些方面對模型的設計進行評估。總結來說,以下方面要特別留意。
要解決的業務問題
建模人員應該用簡單易懂的語言對模型要解決的業務問題進行描述。這些描述應該包括壹個或多個已達成***識的業務原則或核心價值,如客戶的行為、銀行員工的參與度、競爭對手的動作、經濟形勢的變動、合規的需要、公司戰略的考慮等。例如,信用卡部門要設計壹個申請評分模型來測算新客戶出現不良貸款的風險。這個模型在新客戶審批過程的應用中,需要審批人員和客戶進行溝通,手動輸入壹些關鍵的模型變量數值,在很多情況下還需要對模型的評分結果進行覆蓋。這種模型在業務中的應用方式就需要在模型設計開發的過程中,考慮如何解決驗證客戶提供信息的真實性、員工手動輸入數據的可靠性、對模型評分結果覆蓋的審批案例如何進行表現監控等問題。
目標變量的定義
建模人員應該對目標變量的定義進行如下描述:明確描述目標變量的定義,並說明為何這樣的定義與要解決的任務問題是相關的;明確定義目標變量的表現時間窗(performance window)和觀察時間窗:例如,目標變量可以定義為未來12個月貸款出現至少壹次60天或60天以上逾期的概率。在這個定義裏,“未來12個月”為表現時間窗,“貸款出現至少壹次60天或60天以上逾期”為觀察時間窗。如果模型需要滿足監管部門的要求,此定義是否滿足監管部門的要求;為何選擇這樣的定義而不是其他定義;對定義可能產生的誤解進行澄清,如定義是在客戶層面還是賬號層面的,定義是在觀察期之間的表現還是在觀察期結束的時間點的表現等。
樣本的選擇
建模人員應該對建模樣本的選擇進行如下描述:樣本選擇的方法,如有隨機抽樣和非隨機抽樣(有目的抽樣),其中隨機抽樣方法包括簡單隨機抽樣、等距抽樣、分層隨機抽樣、整群抽樣幾種常用類型;非隨機抽樣也稱為有目的抽樣,包括全面抽樣、最大差異抽樣、極端個案抽樣、典型個案抽樣幾種常用類型;樣本的大小,為了增強可測性和檢驗的準確性,應該盡量增大樣本容量,但同時還應考慮可行性和經濟成本;建模樣本、保留樣本、驗證樣本的劃分;樣本可能有的偏差,如必須通過審批的條件限制、經過客戶自然流失後的樣本、外部因素的變化對樣本的影響如產品特征、競爭對手的策略、經濟周期、季節性因素等。