從金融科技平臺人人貸看CNN 在金融科技領域的運用

首頁 > 企業資訊 >正文

【摘要】據媒體報道,近期,Facebook、微軟等巨頭已開始著手打擊deepfake濫用,斥資1000多萬美元舉辦deepfake檢測挑戰賽。谷歌也宣布了開源大型deepfake視頻數據集,以支持社區對deepfake檢測的研究。

  金評媒JPM  ·  2019-10-31 11:05
從金融科技平臺人人貸看CNN 在金融科技領域的運用 - 金評媒
作者: 金評媒JPM   

據媒體報道,近期,Facebook、微軟等巨頭已開始著手打擊 deepfake 濫用,斥資 1000 多萬美元舉辦 deepfake 檢測挑戰賽。谷歌也宣布了開源大型 deepfake 視頻數據集,以支持社區對 deepfake 檢測的研究。

今年6 月,一段利用DeepFake機器學習算法生成的Facebook 創始人馬克·扎克伯格的講話視頻引起軒然大波。

人們驚訝的不是視頻內容本身,而是DeepFake 機器學習算法的進步之迅速。由AI生成的視頻仿真程度越來越高,導致辨別這些內容真偽越來越困難。如果這類技術被大規模濫用,很可能會帶來不可估量的負面影響。

從技術角度看,引發關注的DeepFake 機器學習算法由卷積神經網絡(Convolutional Neural Network, CNN)催生而來。后者是深度學習(Deep Learning)技術中極具代表性的神經網絡結構。目前,CNN 已經在圖像處理領域取得了很大成功。全球最大圖像識別數據庫ImageNet 數據集上,許多成功的模型都是基于CNN。

1.png

華爾街日報報道,今年3 月英國一家能源公司CEO 被犯罪分子通過電話騙取了22 萬

歐元。負責這起詐騙案理賠的保險公司調查后認為,犯罪分子利用了DeepFake 類軟件工具,

通過模仿這位CEO 的德國老板的特殊口音獲取其信任,并最終得逞。

可見,DeepFake 并非只是換臉,其含義已經泛化為利用AI 生成虛假音頻、視頻、圖像等內容的行為。DeepFake 也并不只代表某個特定算法模型或軟件工具,而是一類算法的應用集合。

在對數據和風險高度敏感的金融行業,DeepFake 以假亂真的效果很可能會影響到銀行、金融科技公司等機構對使用者開展KYC(了解你的客戶)比如遠程客戶認證等關鍵環節。

金融業是對數據高度敏感的行業。在以CNN 為代表的深度學習大量運用之前,金融行業對數據的處理很大程度上是根據已知經驗和規律做出判斷。

比如,卡車司機群體的健康或意外風險較高,保險公司在對這部分投保客戶測算建模時一般會提高保費價格。再比如,公務員群體的工作較為穩定,還款意愿和能力相對更容易判定。這兩個例子中共同的數據變量是職業,不同職業對金融業務風險會產生顯著影響。

但已知經驗和規律畢竟有限,以此為基礎的一些強假設大多數情況下自變量(比如:年齡、職業)和因變量(風險)滿足線性關系。而在實際的金融業務開展過程中,采集來的數據之間常常存在非線性關聯。

在這種情況下,數據分析人員可以通過變量衍生和變換技術來彌補線性模型表達能力的不足。例如,用戶在央行征信中心的征信報告中會留下銀行等金融機構的查詢記錄,單條查詢記錄可能跟用戶的資質沒有太大關聯,但是,如果我們統計用戶在一定期限內的被查詢次數,這就是用戶對于貸款饑渴程度的一個很好的度量,也跟用戶資質有較大的關系。

在這個例子中,“用戶的征信報告被貸款機構查詢的記錄”到“用戶一定期限內的被查詢次數”就是一次非線性的變量衍生過程。在變量衍生后,數據分析人員以標準的變量評估方法為基礎,結合KYC 的經驗判斷衍生和變換后的變量是否是一個“好”的變量。數據分析人員的經驗、能力甚至靈感決定了能否找到良好的非線性變換,以對用戶的資質做更準確的評價。

但受限于數據分析人員的精力和能力限制,要找到更理想的衍生變量進而發現其中的邏輯關系并不容易。利用CNN 構造并訓練模型,通過調整參數將模型性能調整到理想狀態,可以解決這個問題。

以金融科技企業人人貸的業務流程為例,人人貸將采集到的用戶數據可視化為一張“圖片”,圖片中的每一個像素定義為每一個變量的取值。通過批量分析用戶“圖片”,可以發現高風險用戶在圖片的某些區域上有持續的共同或相似之處。與此同時,也會發現一些圖片區域的取值在高風險和低風險的用戶之間并無差異,即在風險識別的目標下無效的變量區域。

得益于數據降維,CNN 模型能夠顯著減少需要處理的數據量級,將算力要求控制在可接受范圍內。更重要的是,基于CNN 的風險識別模型可以晝夜不停地工作,所處理的數據量級和復雜程度也遠遠超過數據分析人員采用的傳統統計分析方法或傳統機器學習。

經過多年業務實踐,人人貸認為在信貸風險管理領域,存在成功應用CNN 的前提條件。值得注意的是,人人貸并不是運用CNN 來完成信貸風險決策,而是將CNN 用于傳統信用評估流程中的“變量衍生”環節,也就是把CNN 網絡的輸出作為衍生變量的重要備選。

在風險識別之外,人人貸作為國內領先的金融科技企業,較早采用了第三方服務商的人臉識別解決方案,能夠準確、高效地完成客戶身份驗證。其中的人臉識別算法也大量使用了CNN 相關技術。就目前而言,第三方人臉識別解決方案提供商的算法已經相當成熟,可以有效防御2D 照片、3D 人臉模型攻擊,反身份欺騙成功率可達99.5%。

基于CNN相關技術的應用,人人貸得以將金融科技有效滲入業務全流程,極大的提高了風控流程的效率,進而將服務全流程智能化、系統化。

上一篇文章                  下一篇文章
作者的其他文章
評論:
    . 點擊排行
    . 隨機閱讀
    . 相關內容
    猪饲料可以做什么赚钱