很多人都在做数据的生意 同盾科技创始人讲了4个问题

不同于其他行业的数据生意,好的第三方风控机构需要收集到全行业的数据,并让它们都流动起来。

授课人:同盾科技创始人蒋韬

很多人都在做数据的生意,征信市场有什么机会?

中国的征信市场足够大,但是做得好的基本都是国外的风控机构,因为国内的数据往往集中在金融、电商等少数领域,缺乏全行业打通的数据。如果只拥有单一领域的数据,判断的维度会显得单一,并且多只能欺诈事件发生后才能列出黑名单。如果能搜集到全行业的数据,就有可能预判出嫌疑人。

要实现风险的共享,只能够靠第三方的中立机构去完成。因为一家深耕某一行业的公司如果要做全行业的数据收集,就像是一名运动员同时还要去做裁判。假如有一家机构不做电商、信贷、P2P等,并能在机构间承担风险共享、风险传递的作用,让全行业的数据都流动起来,那么价值会非常大。

同盾科技这样的公司的目的不是将行骗者绳之以法,而是在欺诈行为发生之前就将其制止。比如在你申请一笔银行贷款时,背后就有这套模型给出的建议,根据你的行为判定信用等级,给你放贷或是拒绝。

如何让数据成为“侦探”?

你不知道欺诈分子会干些什么,不知道具体的欺诈模式是怎样的,只能从一大堆用户行为数据中去分析。输入各种变量和维度,比如地点、登录的时间、所用的终端,刷卡的金额后,建模人员就能教会机器去发现异常。以一个盗卡的模型为例,它的细分变量多达3000多个。发现异常后,机器根据建模的维度综合打分,最后判断是否存在风险。

这是数据累计和机器学习的结果,但需要根据公司的场景不断的反馈和修正,才能提升效果的准确度。同盾科技总部背景电视上有一张数字中国地图,若存在安全风险,在地图上就会跳出红色的小圆点,并有数字不断跳动。你能很容易地根据小红点的数量,以及各类指标的跳动,监控当下的欺诈事件,并给出预警。

做数据生意有哪些难点?

关键在于数据和建模,而建模的基础是海量数据的收集,很多公司是不愿分享数据的。

除了数据难以收集,数据生意的见效也非常慢。只能从测试优化模型,通过时间积累数据。防欺诈的风控分为三大块:名单、异常分析和交叉验证。名单即最初的基础数据,基本只能靠网上公开爬取,比如把法院的公开信息列入数据库。而异常分析则不需要数据,可以自己做技术研发,比如通过浏览器来跟踪鼠标的轨迹和分析键盘的键入偏好等,这相对容易追踪。最难的是交叉验证,雪球需要滚起来才能变大,这意味着只有接入数据的机构足够多,效果才能好。

模型的建立也要因场景而异,你首先要摸清这个行业业务的流程,甚至成为专业人士,才能根据反馈建模。比如汽车金融,买一手车是消费分期,二手车就是抵押贷款。并且每个客户要求的数据审批率都不同,汽车金融公司的审批率原先的自动化率只有约30%,其余都要靠人力审批,你要想办法去提高。

如何获取用户?

同盾科技最初都是给熟悉的开公司的朋友免费试用。当公司发展的关键还是要拿下大客户,这才能拥有品牌背书,但获取这样的客户只能靠测试效果说话。

比如同盾签下全球知名金融服务商捷信,测试时就是把其跑出的风控结果和捷信自有风控的结果去对比,看预判和误判的成功率。如果判定结果为“拒绝贷款”的客户,在另一套模型中通过了贷款,并且在约定时间内还款正常,就是一个误判的结果。然后把同盾的数据模型和捷信的模型比对,如果预判和误判相减后的数字能够带来更多正向的收益,就是一个好的效果。

值得注意的是,第三方的数据模型目的不是去跑赢客户的模型,而是要和其相互补充,产生联防和协防的价值。

本文版权归第一财经周刊所有
未经许可不得转载或翻译
未登录用户
全部评论0
到底啦