2017中国互联网大会:BI到DI,看机器学习的巨大应用前景

2017-07-13 17:47 来源:中新网 
2017-07-13 17:47:43来源:中新网作者:责任编辑:赵刚

  中新网7月13日电 7月12日,2017中国互联网大会高层年会举行,友盟+首席数据官李丹枫分享了《从BI到DI》 的演讲,从“人+机器”的层面,讲述了DI在金融风控等领域的应用。

  友盟+作为一家第三方全域数据服务公司,目前服务135万个APP,685万个网站,通过这些服务每天可以收集到信息的设备量是14亿,每天处理的数据量是280亿。基于大体量的服务和数据,友盟+可以做一系列的基于数据的应用。

  友盟+的传统业务本质上是BI(Business Intelligence),即数据的收集和数据的可视化。BI跟AI的主要区别是什么?如果把今天作为一个时间原点,BI提供的能力是回顾历史,通过历史去判断原因与结果的关系,为今后做主导。而AI是数据+决策,从可视化到决策是质的变化,AI是说未来会发生什么。

  李丹枫首先在演讲最开始再次提到了“DI”,“DI”是友盟+提出一个概念,Data Intelligence。当下的AI是弱人工智能,而弱人工智能的前提是信息的数据化,弱人工智能最大的驱动力就是数据。

  BI需要很多人工的介入,友盟+采集数据产生报表,报表再可视化,输送给运营人员,包括硅谷的增长黑客,也是通过人工去看过去的运营数据,找到一些能对增长造成作用的关键点,这些对人的要求是非常高的,这些数据会产生一些规则,这些规则是在统计层面上的。

  DI是人+机器,机器会提供辅助帮助人类更好的做决策。整个模型是从规则升级到机器学习的模型。实时数据与历史数据相结合,可以通过训练机器学习模型,完成设定的目标,预测未来。

  友盟+已经将DI应用到很多垂直领域,从客户的反馈看效果是非常好的,从以下案例可进行进一步的阐述:

  第一,广告行业。在互联网广告很重要的是用户定位,即在庞大的用户群体中找到精准的目标用户。目前大部分的定位功能是通过人工进行判断,比如一个旅游APP要推新品,有性别、年龄、地域分布三张统计表,人工分群会按照预判将“年龄段:20-34岁”+“性别:女性”+“地域:北上广浙江”的人群组合起来,投放广告,这就是人工产生的模型。

  而机器模型Look-alike Model,是这样工作的:比如你以1万个核心的高价值用户作为种子用户,去寻找跟这1万人特征最相近的群体。友盟+的数据几乎是覆盖了中国的互联网网民,可以通过DI的方式很精准的找到跟这1万人相近的群体。

  并且数据维度越丰富,用户群定位就越准确。这与传统的定位相比有非常大的好处,人工分群能够承担100个、500个、最高1000个维度,但是机器可以轻松的完成上千万个维度。企业可以在非常庞大复杂的全域数据中找到需要的人群,这是机器学习为广告领域带来的好处。

  另外,因为友盟+的数据是互联网和移动互联网的设备行为数据,通过很多尝试后,看到了数据在金融风控上的作用。借用古语“物以类聚,人以群分”,将设备行为数据开放到金融的整体链路上,从获客、反欺诈到授信、贷后管理、逾期催收等,都有很强的预测作用。尤其友盟+的数据覆盖领域庞大,普惠金融场景都是通过移动端来进行操作的,基本上每一个移动端的设备都可以在U-DIP中找到相对应的数据,这些数据可以金融企业做很深入的风控管理,同时友盟+也希望在这个领域中,将行为数据的价值发挥的更大。

  针对金融场景,友盟+很快会推出金融开放平台。市场上对数据很敏感,一是用户隐私问题,另一个是所有权问题,友盟+在合规、安全的前提下首先把数据开放出来,也希望将数据融合在一起,让数据价值最大化。

  友盟+会把脱敏后的数据、行业数据以X的变量的形式提供在平台上,第一方可以提供他们的Y变量,也可以整合自己的数据和通过其他方式拿到的第三方数据,在这个平台上共同建立一个模型,建立一个模型以后,这个模型会放在一个安全的生产环境中,这样可以集中多方数据资源提供更好的服务。

[责任编辑:赵刚]

手机光明网

光明网版权所有

光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明员工 | 光明网邮箱 | 网站地图

光明网版权所有

立即打开