在大数据的“未来战场”中 BAT没有人能一家独大

2017-02-23 18:15 来源:中国网  我有话说
2017-02-23 18:15:00来源:中国网作者:责任编辑:赵刚

  近日,总部位于美国洛杉矶的金融科技公司ZestFinance推出了用于信贷审批业务的自动化机器学习平台,注册商标为ZAML?。信贷机构可借助ZAML系统对大量的非传统信用数据进行分析,从而在提供消费信贷时降低信贷决策的风险,特别是会对信用记录较少的借款人进行风险评估,从而更加安全地放贷。

  对于熟悉互联网金融的读者而言,ZestFinance并不陌生,因为京东和百度的相继入股,ZestFinance在国内也名声大噪。资料显示,2015年6月,ZestFinance获得京东D轮1.5亿美元投资;2016年7月,ZestFinance又获得百度投资E轮,并与百度展开合作。此次ZestFinance推出ZAML平台,有望与百度类型丰富的大数据资源尤其是行为数据相结合,提升对申贷用户的信用判断能力,进而提供高效、稳健的信贷服务。

  ZAML有什么特点?

  ZAML与众不同的地方是,它借助于机器学习来分析成千上万的传统和非传统变量,从而更精确地为借款人、包括信用记录简短或根本没有信用记录的群体评分。

  ZAML可以对21个不同大类的海量数据进行分析,如经过隐名处理的消费者网上购物习惯、借款偿付记录以及购物交易等。在这个平台上还可以添加非传统信用变量,如某客户如何填写申请表以及登陆贷款机构网站浏览了哪些内容等。正因如此,百度与ZestFinance联手把其用户的搜索、定位和支付数据转化为信用评分。

  总体而言,ZAML有两个比较突出的地方。首先,ZAML是基于机器学习的信贷审批技术平台,不是一个简单的数据挖掘平台,而是利用了人工智能技术;其次,ZAML更多通过对用户的行为数据进行分析,来判断用户的信用。

  ZAML可以充分释放百度海量用户行为数据的价值

  ZAML是一个着重分析用户行为进行信用状况评价的机器学习平台。这与百度有非常大的契合点,可以衍生很多合作的机会。

  百度拥有大量用户行为数据,可以用ZAML来进行分析解读,如用户搜索过的词汇、用户在不同网站之间的跳转、用户的浏览时间等,还有用户在贴吧、地图、外卖等方面形成的数据。这些数据的特点是类型丰富,包含了用户浏览信息、行动轨迹、消费购买等多种行为。这些数据是一个蕴含高价值的富矿,需要有专门的技术进行挖掘。而ZAML正是这样的技术。

  ZAML通过机器学习等人工智能技术来分析用户行为数据,有广阔的应用前景。数信互融联合创始人、前SAS中国研发中心技术负责人刘时斌认为,从信贷全流程风控的角度看,人工智能等技术与金融的结合,重点应用在于反欺诈、评价还款能力还款意愿、违约预警、催收。

  ZAML推出的这个机器学习平台,会对于百度以及其他金融机构进行反欺诈、评价还款能力还款意愿、违约预警、催收等活动,提供技术支持。平台将各种行为数据进行综合,可以为用户进行全面的画像,形成多种分析维度,加深对用户信用状况的理解。

  刘时斌认为,在反欺诈方面,网上行为数据会有很大帮助,多维度评估欺诈风险,对数据进行验真,以及进行借贷人群的深度关联等。

  例如,对于一个申请家装贷的用户,ZAML可以分析该用户在百度留存的一些数据,如果这个用户此前并没有进行装修方面的搜索,也没有浏览过家装网站的相关数据,则该用户存在欺诈的嫌疑。如果该用户有大量相关行为记录,则欺诈的可能性会较小。

  下一步需要确定该用户的信用水平,可以再联系该用户经常浏览的网站类型,经常使用的APP的类型,以及使用的时间段、时长等,综合确定该用户的信用状况。如果该用户经常浏览与其工作相关的网站或APP,且时间长、频次高,则该用户可能工作较为稳定,人也较为上进,信用风险就小一些。

  当然,这样的逻辑属于比较简单的逻辑,机器学习技术则可以捕捉、判断更深层次的逻辑,以及人所想象不到的关联,更进一步挖掘百度数据的价值,判断用户的信用状况,增强百度的风控能力。

  ZAML与百度合作,还可以对那些信用数据较少的用户进行信用评价

  普惠金融服务要求对那些传统金融机构服务不了的人群提供金融服务。这里面的一大难点在于这类人群实在是缺少数据来佐证风控,让金融机构巧妇难为无米之炊。例如中老年人、蓝领群体、农民工等,缺少信用卡工具,没有电商交易与金融交易的相关数据,很难判断信用状况,如何对这类群体进行信用评估,进而为之提供金融服务?ZAML结合百度的行为数据,为解决问题提供了一个可选项。

  ZAML作为一个基于机器学习的消费者信贷审批技术平台,使用机器学习与深度学习技术,有望通过更有效的算法充分挖掘数据背后隐含的信息,放大数据的价值。机器学习中的深度学习,之所以称为“深度”,是指模型增加了层数以及每一层的节点数量。深度神经网络一般有5-10多层的隐层节点,突出了特征学习的重要性,通过逐层特征变换,将样本在原空间的特征表示变换到一个新特征空间,从而使分类或预测更加容易。特征越来越多,对借款人的画像的角度也就越来越多,相互佐证,交叉验证,可以在数据量并不充足的背景下有效评价用户的信用状况,提升风控实力。

  这样的技术再结合百度的数据,可以加强对信用数据较少的用户的信用评价水平。这些用户可能没有信用卡,可能很少在电商购物,但相信他们会使用过百度的搜索、地图等服务,去查询信息、获取位置,毕竟这是更基本的需求。这就使得百度会拥有一些这类用户的行为数据。通过全方位搜集各种行为数据,如用什么手机,下载了多少APP,喜欢什么游戏,有怎样的地理位置运行轨迹,在网上浏览了哪些网页,搜索了哪些关键词,经常是哪个时间段上网等,都可以组成很多不同的特征向量,从不同维度对用户的信用状况进行揭示。

  这些特征向量与用户信用程度的相关性或强或若,可以通过模型进行测算,为不同的特征赋予不同的权重,综合判断用户的信用状况。在这一过程中,大数据带来了各种维度的数据信息,机器学习、深度学习等技术则提升了信用模型、反欺诈模型的精准度和有效性。

  除了服务于百度金融业务,百度的互联网行为数据还可以补充信用缺失人群的信用数据,根据这些数据与ZAML的技术,提升信用判断能力,通过开放平台的形式开放这些能力,为金融机构服务于信用缺失人群提供技术支持,构建起跨场景的金融产品。蚂蚁金服和京东金融的场景优势在消费交易,腾讯金融的场景优势在社交,百度与ZAML的结合则可以横跨多种场景,从多角度判断信用。

  BAT做大数据:各怀绝技,没有人能一家独大

  结合ZAML的机器学习技术,百度有了将自身海量行为数据进行使用并变现的路径。而互金领域的其他重量级选手如蚂蚁金服、腾讯互联网金融、京东金融也都在挖掘自身大数据的价值。

  众所周知,阿里和京东在电商数据方面有优势;腾讯最大优势在于社交领域,拥有海量社交数据;相比之下,百度的数据优势体现在维度多样,尤其是互联网行为数据异常丰富,百度不仅在搜索数据方面有优势,同时通过旗下多种应用也积累了用户在贴吧、地图、外卖等方面形成的数据。电商数据应用到金融最容易,但社交数据和互联网行为数据也有各自独到的应用场景,比如社交数据对于欺诈分子的关联探索,可以帮助做反欺诈;一旦找到合适的开发技术,百度的互联网行为数据就能设计出跨场景的金融产品,用技术突破场景的限制。。阿里的芝麻信用尽管也在建设开放平台,争取获得更多维度的数据,但它和百度的基因不同,要建立跨生态圈的信用评价体系还有很长的路要走。

  巨头之所以成为巨头,就在于有技术、有资源。在未来,互金行业的竞争必然是数据资源与技术的竞争。

[责任编辑:赵刚]

手机光明网

光明网版权所有

光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明员工 | 光明网邮箱 | 网站地图

光明网版权所有

立即打开