天津十一选五36期

来源“雷锋网”? ?作者:郭佳

老实巴交的农民林建国怎么也想不到,他有天竟会成为别人眼中的“老赖?#20445;?#34987;追债公司逼着还钱。

这还要从前段时间有人来村里招工说起,他和一些村民被要求填一张包含姓名、身份证号、家庭住址等信息的表格,当时为了能快点上工挣钱,大家都没犹豫就填了。

后来他们才知道,这就是一个陷阱,所谓的招工只是幌子,诈骗团伙要的可不是他们廉价的?#25237;?#21147;,而是上面所填的真实信息,通过这些信息来申请信用卡,然后刷卡透支,从而让这些信息就变为真金白银。

但从未跟信用卡打过交道的林建国们,却从此进入了各大银行的黑名单,背负债务不说,还被抹上了信用污点,连整个村子都被银行归为了欺诈地址。以后在申请信用卡、贷款的过程中,如果出现了这个地址,就会很麻烦。

上面这个故事改编自天云大数据 CEO 雷涛对雷锋网所讲的一个真实案例,这其实暴露出银行在传统的信用审核?#20852;?#36935;到的难题,即银行虽然拥有上亿万级的信息数据库,掌握着身份、联系方式、设备信息和?#20160;?#20449;息等数据,但这种识别已经无法应对日益演进的欺诈技术和模式,而雷?#26410;?#39046;团队正在做?#27169;?#23601;是希望能用人工智能的技术,解决这个问题。

面对信用卡欺诈,AI 能做些什么?

面对信用卡欺诈,传统的信用审核?#24515;?#20123;短板?

大家在申请信用卡时,其实?#21069;炎约?#30340;数据都提交给银行,以证明我是一个有偿还能力并且守信用的人,银行多年来会有一套?#32422;?#30340;辨别系统。

在传统的银行系统里,这些数据库更多的呈现为一种二维的结构,叫关系型数据库。如何理解?我们先来看这样一个例子。

?#38505;?#21644;老王两个人准备相互担保进行骗贷,然后一起跑路,在银行传统的风控架构下,这种行为很容易被发现,因为维度很小,可以迅速的通过数据库来查询。

但目前真实的骗贷状况是,?#38505;擰?#32769;王、老李、?#38505;浴⒗现?#30340;企业形成了一个担保圈,打算集体跑路,当银行现在要做一个5度甚至是6度的查询时,依据传统的计算方式,已经无法解决这个问题了。

在防止信用卡欺诈方面,国内目前的风控都是 rule base(规则驱动)?#27169;?#26356;多的是根据经验来,抽象出系列规则,每一条规则触发一种欺诈场景,交叉组合相应的业务逻辑来进?#20449;卸希?#30001;此来做出风控模型。

但目前,这种方式在效率、?#34892;?#24615;、全面性?#32422;?#25104;本上都面临问题。与此同时,随着互联网金融的兴起,非现场交易的增多,这种模型会加剧银行风险防控的难?#21462;?/p>

雷涛曾接触过很多金融行业的客户,以前,他们看一个进件(信用卡申请资?#24076;?#26102;,会注重本身是否健康真实,即有没有违?#25216;?#24405;,姓名、身份证号、电话号码等信息是否真实,但这还是会出现问题。

比如刚刚讲的案例,村民的信息确实是真?#27169;?#20154;也没有出现过违?#25216;?#24405;,还是出事了。金融业的风控发展到今天的趋势,其实会把不同的进件连接起来看深层次的关系,看从中能否发现潜在的风险。

面对信用卡欺诈,AI 能做些什么?

简单来说,就是要在申请和进件之间建立关联,骗子手里的资源有限,他填的电话、地址、推荐人等信息,或多或少会在每天十几万个进建中重复。

我们会把不同的进件连接起来进行识别,在这个过程?#24615;?#21152;新的维度,如果有其中一个欺诈电话号码,和他有关系的有好几个进件,那我就会认为它有问题。

雷涛所说的短板,其实就是现有的风控模型对于数据处理能力的不足,这次,他想借力人工智能来解决这个问题。

人工智能做些什么?

对于金融业而言,在信息、数据大爆炸的今天,会面临以下两个问题:

  1. 数据来源多,且存储在不同系统,缺乏数据同步机制、数据无法共享。
  2. 数据利用不充分,?#29575;?#34892;销、审批、风险、策略研究、催收?#24247;?#19994;务部门系统形成信息孤岛。

那主打“人工智能”的天云,是如何应对这些难题?#27169;?/p>

面对信用卡欺诈,AI 能做些什么?

这跟信用卡反欺诈又有何关系?

其实在金融行业,多年来积累了一定的数据,无论是人行的个人征信数据,还是部分银行间可以相互流通的数据。(后者的意思是,如果你建行的信用卡逾期了,再申请工行的信用卡,就会遇到麻烦)

将这些数据通过特征表达的方式转化到数据模型后,机器就可以借此来表达以往很难描述的金融现象,因此特别适合处理风险、欺诈?#32422;?#37329;融产品的营销,这些依靠过往经验难以准确定?#24247;?#20107;件。

具体到信用卡申请场景,这些数据包括申请人的社交数据、联合推广人信息数据、申请人信息数据、单位联系数据?#21462;?/p>

雷涛告诉雷锋网(公众号:雷锋网),这么做有3点?#20040;Γ?/p>

一是融合了信用卡申请?#26041;?#30340;各个业务数据,解决了数据孤岛的问题;

其次,这个过程中会引入第三方数据,比如银联数据等,扩展了数据的维度;

第三,通过构建申卡客户的社交复杂网络提供客户的社交数据,在拓展覆盖维度的同时,以弱变量来体现强变量,并且实现了社交数据的高频率更新,提高了数据的准确?#34892;?#24615;。

未来的打算

将 AI 赋能金融反欺诈,其实在国外早已开始,雷涛坦言,目前在银行反欺诈方面中国与北美的差距还是很大?#27169;?#30789;谷的金融科技创业公司很早就将这一技术应用起来了。

比如,京东和百度同时投?#23454;?#32654;国金融科技公司Zest Finance,便是一家明星公司。

它们利用机器的深度学习,从大?#24247;?#25968;据中提取变量,并采用多个预测分析模型,其中就包括欺诈模型。

除了反欺诈,其在预付能力模型等方面也用来帮助用户降低信贷成本,它的核心竞争力就是数据挖掘能力和模型开发能力。

虽然目前在保?#23637;?#21496;或者是运营商中,都有用机器学习的算法来做用户流失风险预警,交叉推荐等数据挖掘的工作,但目前这在国内,却面临很多困?#22330;?/p>

雷涛告诉雷锋网,一个很大的问题是人才的不足,很多做数据科学的人,一般对编程领域较为陌生,而熟悉编程的人又不懂算法。

天云正在做的就是将数据科学?#19994;?#31639;法能力,与懂业务的编程人员相结?#24076;?#30446;前已经通过人工智能算法建立现金分期响应模型,预测筛选办理此业务的高概率客户,在信用卡反欺诈方面,也建立可循环授信模型,对客户行为特征进行分类,并确立客户对循环授信响应评分。对于一些评分高的客户,他们可?#26434;行?#25512;送循?#21453;?#26381;务,从而提高银行利润。

为何国际上基本成熟的业务天云要亲自再来做?在采访中,雷涛提到“后IOE”时代。

“IOE” 其实是对IBM、Oracle、EMC的简称,其中 IBM 代表硬件?#32422;?#25972;体解决方案服务商,Oracle 代表数据库,EMC 则代表数据存储。

随着国内去IOE浪潮的兴起,大?#31185;?#19994;开始在X86服务器、开源数据库产品、分布式存储解决方案等方面开展研究和探索,而天云正是其中之一。

就如同虽然 Windows 操作系统虽然可以用,但我们依然要研发国产自主可控的操作系统,尤其是金融等关乎国计民生的重要领域。

而这,也是目前为何国内有很多公司?#36861;?#25237;入有关数据库的研发和应用的重要原因之一。在外企工作过多年的雷涛透露,他们目前有很多员工就是来?#26434;贗BM、Oracle、EMC?#21462;!?#27491;是因为我们这些人见过最好的产品是什么样,我们才有信心把它做出来,甚至做的更好。”

? ? ? 原文链接? ? ?本文转自雷锋网,如需转载请至雷锋网官网申请授权。

天津十一选五36期