反低俗算法作基因,内容作狗粮
2018年3月28日,今日头条的“灵犬”小程序正式上线。TA是一个反低俗的小助手,在微信和今日头条app内都可以搜索到。
这样听起来好似不如其他狗狗萌,但TA胜在聪慧,而且对精神粮食却有着独特的“嗅觉”和判断力。
打开“灵犬”后,输入一段文字或文章链接,就能检测其内容质量指数,并得到鉴定结果,包括:是否可以获得算法推荐,是否需要引入人工判断等。
原来,“灵犬”搭载了经过反复训练的反低俗算法模型。对于输入的内容,“灵犬”会先进行提取、分词和语义识别,然后根据算法规则,输出对应的分数、评级和结论。这一切,都在短短几秒内完成。
“灵犬”已经快满周岁了,比起刚出生的时候,智商和嗅觉的范围又扩大了一圈。
昨天,今日头条宣布“灵犬”2.0全面上线。除了反色情低俗,还加入了反暴力谩骂和反标题党能力。
据小wifi了解,作为反色情低俗、反暴力谩骂模型,“灵犬”整体识别准确率约为85%,反标题党模型的识别准确率达90%。同时,在海量用户“喂养”下,“灵犬”掌握的技术模型每天都在持续优化迭代。
“云养”的灵犬,240万人已“投食”
“灵犬”靠云养长大。截止至目前,已经有240万人向TA“投食”过精神食粮。小wifi也从同行那儿搜刮了一些“狗粮”,“喂”给大家瞧瞧。
公众号:杜绍斐
标题:《等你腰坏了再看这篇,就彻底告别性生活了》
经过“灵犬”的识别,这篇文章“命中犯色气低俗模型,不应获得算法推荐。”
其实,这篇稿子写的是当代人不良的工作生活习性容易导致各种腰部疾病,并提出了如何预防及治疗。明明是非常实用的健康知识,偏偏用性生活作噱头,难怪被“灵犬”嫌弃低俗。
公众号:果壳
标题:《虽然每天你都在吃猪肉,但中国土猪或许已经濒临灭绝了》
经过“灵犬”的鉴定,这篇文章“需要引入人工判断”。
小wifi在测试“灵犬”时,发现TA非常谨慎,涉及科普健康类的审核不会轻易作出判断,会要求引入人工判断。
事实上,“灵犬”只是头条审核机制中反低俗部分的一个简化版。在内容方面,今日头条拥有目前国内最大的审核团队,人数近万人。
公众号:WiFi新连接
标题:《40万人泡汤跨年!果然没有什么是泡汤解决不了的》
小wifi在自己的稿件中挑了一条,从标题党和低俗色情两个维度测试。小wifi原本以为会被“灵犬”嫌弃标题党,经过“灵犬”的鉴定,这篇文章都算规规矩矩,“可以获得算法推荐”。
标题中的“40万人泡汤”是实实在在的统计数据,所以“灵犬”不算其夸张。
公众号:黎贝卡的异想世界
标题:《这个颜色的单品,简直就是来抢钱》
这篇从标题党和低俗色情两个维度测试,得分差距很大。文章是推荐几款美妆用品,几乎不涉及低俗,所以“灵犬”的反低俗模型对其评分很高,但标题略有隐晦的夸张,文中无法给出确切肯定,所以“灵犬”给分谨慎并再一次求助背后智囊团。
“良币驱劣币”的征程,灵犬只是一环
从前有人的地方才是江湖,如今有流量的地方就有市场。而市场内商品质量的良莠不齐,一直以来是许多企业的头痛之处。
打击低俗低质内容被传播,可以说是全球互联网企业的共同征程。
海外小wifi就拿Facebook举例。早在前两年,Facebook就分别针对文字贴和视频贴展开过低俗低质内容的打击。
比如针对包括诱导用户进行点赞、分享、评论、投票或其它动作的帖子,Facebook团队通过算法降低这些垃圾信息的出现频次、对数十万个帖子进行审核,同时使用机器学习技术对相关内容进行分类和标记,被判定为垃圾内容的帖子将会在信息流中被限流,以此让用户能更少地接触到它们。
再放眼国内,互联网顶级流量大户们诸如微信、今日头条等,也是为打击低俗低质内容不断献策并实施。
像是小wifi的“根据地”微信公众号,早在2015年就发布过关于低俗低质内容整顿公告。去年,微信公众号加大了对于发布低俗低质内容账号的处罚力度:多次违规处理后仍继续发送违规内容的,或是故意利用各种手段恶意对抗,进行永久封号处理。
2012年,今日头条在国内第一个提出了建设以智能分发为主的内容平台。如今,在全球范围内,智能分发已经成为内容行业的标配。
今日头条通过技术,提升信息匹配的效率,促进创作与交流。反之也通过技术抵御低俗低质内容的流通。
去年11月举行的今日头条生机大会上,今日头条CEO陈林宣布,2019年这一年,今日头条将启动平台生态升级,建设好基础设施,更好地服务创作者。
换句话说,就是扶持更多的优质内容创作者,继续打击平台藏匿着的低俗低质内容,用“良币驱逐劣币”。
让“信息创造价值”,是今日头条长期以来在付诸努力的目标。
其中就开放技术模型,和行业一起提高平台生态标准这一点来说,小wifi刚刚喂了半天的那只萌狗“灵犬反低俗助手”,就是提高平台生态标准、打击低俗低质内容的一环。