English


百度AI严打医疗变体词广告 2018上半年打击超3亿

2018-07-14 10:17 来源:中国网 
2018-07-14 10:17:49来源:中国网作者:责任编辑:张琳
  互联网的进阶让虚假医疗广告越发肆虐,骗子骗术不断升级,非法医疗机构通过各种“变体词”形式躲避监管漏洞坑害广大网民。对此,百度正在通过人工智能技术对变体词广告严加打击, 2018年上半年仅医疗变体词推广拒绝量就超3亿。

为了吸引眼球和绕过监管,通过替换某个字体、改变顺序等方式迷惑网民的“变体词虚假广告”是近年来常见问题。由于中国语言博大精深,同义词、同音词、近音词,加之繁体字、简体字等的混用,造成很多特定词语变体种类繁多,令人难以识别。互联网推广中,如“京东”变“京i东”属于间隔词变体,“阿里”和“阿狸”属于谐音变体,“盼盼防盗门”和“朌朌防盗门”属于形似字变体。这是投机者牟取暴利的违法手段,让很多互联网平台不胜其扰。

  为全面打击变体词,百度近年来加持AI技术对正规的机构进行品牌保护。“盼盼”防盗门的品牌保护就是一个典型的例子。

  此前,有广告主以“朌朌”进行推广,试图以假乱真“盼盼”防盗门。百度AI风控系统监测到此情况后,自动升级添加“朌朌”等多个变体词,严禁其他品牌使用“盼盼”变体词进行防盗门推广,保障盼盼防盗门品牌不受侵害。据百度技术人员介绍,“盼盼”的品牌变体词十分常见,且“盼盼防盗门”全名是“亚萨合莱盼盼门业”,用户检索时并不会搜全称,需要根据用户真实意图进行保护。而“盼盼”因有很多重合度,如熊猫盼盼、盼盼食品,还有盼盼防盗门等,可以说相当复杂。在AI风控系统升级后,百度可根据相关内容进行精准识别,最后展示相应的搜索结果。

百度AI严打医疗变体词广告 2018上半年打击超3亿

  在医疗领域,变体词的情况更是司空见惯,且更为复杂。如胃癌的变体词“胃|癌”“胃cancer”等;癜风变体形式有百癜风、bai癜风、白I癜风、baidianfeng等。令人震惊的是,“痔疮”一词的变体词在百度AI系统历史监测中高达32种之多,而且未来还会出现更多样形式。百度AI系统反馈,“痔疮”的32种形式中,就“痔”的写法就有超过8种,如娡疮、庢疮、峙疮、志疮、致疮等;而“疮”的写法更是五花八门,如庢创、痔怆、痔創、痣瘡、痣窗、痣创等。按照排列组合算,像“痔疮”这样的医疗变体推广数量十分庞大,传统的人工监测和技术完全手足无措,必须用AI才能解决这一难题!

百度AI严打医疗变体词广告 2018上半年打击超3亿

  百度变体识别原理-以“痔疮”为例

  百度相关负责人表示:“对于医疗领域变体词的整治,投机者的骗术不断更新换代,仅靠传统的治理方式难以彻底根除。所以我们引入了AI技术,经过几次升级,全面对正规的医疗机构的名称进行保护,同时严厉打击虚假医疗广告。“

  一方面,百度通过机器系统对发布者进行资格审查和内容审查,同时,利用机器系统实现对95%以上的信息进行扫描过滤,每天过滤超过4.7亿条。另一方面,百度强化技术研发,用技术创新精进变体词监测力度。早在2016年,“一种授权信息的识别方法及装置”的变体词专利得到国家权威认证,该技术通过解析获取预定网站的内容,能够识别所述预定网站的内容中的徽标信息,并根据预定授权信息和所述徽标信息确定所述预定网站的合法性。

  技术加持后,百度AI审核拒绝医疗变体词推广量日均达160万,2018年上半年拒绝医疗变体词推广量超3亿。

  为了全面遏制屡禁不止的医疗广告,百度还推出了很多重量级的举措,如公立医院品牌保护计划。截至7月初,百度对公立医院名称(含简称)的品牌保护总量达到30252个。品牌保护后,搜索这些受保护的公立医院名称(含简称),将优先显示官网,且不出现商业广告。

[责任编辑:张琳]

手机光明网

光明网版权所有

光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明员工 | 光明网邮箱 | 网站地图

光明网版权所有