B站UP主的抱怨:B站审核为什么越来越慢?
导语:其一是政策层面的内容合规,要符合监管的要求。监管要求的内容可参考最新实行的《网络信息内容生态治理规定》,对于各项违规内容都做了详细规定,大致概括可分为涉政、违禁、暴恐、色情等四类,这部分是政策红线, 其一是政策层面的内容合规,要符合监管的要求。监管要求的内容可参考最新实行的《网络信息内容生态治理规定》,对于各项违规内容都做了详细规定,大致概括可分为涉政、违禁、暴恐、色情等四类,这部分是政策红线,一旦触及,轻则约谈,重则下架、封禁。 其二是社区氛围的良性导向,如谩骂、隐私等。这一类型的内容虽然不会触及监管红线,但倘若内容社区充斥各种负能量,对于社区氛围是非常严重的损害,伤及用户体验,导致用户流失,影响产品商业利益。这一类型内容风控还包括对于产品运营主体的保护,例如对吐槽公司工作人员的内容进行限流处理、对平台和产品的诅咒进行删除等,属于商誉和公关层面的维护,同时也是对产品官方公信力的维护。 其三是社区用户安全的保证。对于内容和社区产品而言,平台内一定会存在导流、灰产、诈骗等不法手段,如何保护平台内用户的财产安全和产品体验,是非常关键的,互联网发展至今,导流、诈骗等行为往往是成熟的灰黑产产业链所为,他们拥有丰富的反监查和防过滤经验,揪出他们并进行处理,需要平台与其斗智斗勇。 2. 内容风控的方法和手段 在最早期的阶段,对内容进行风险控制,只能通过编辑人工进行审核。这种方式需要大量的人力物力,而且稿件审核需要时间长,时效性也被大大削弱。一般的公司,很难负担起庞大的内容审核团队。 之后,诞生了关键词过滤等手段,成为成本较低,并且使用最为广泛的内容风控措施。对于命中预设的违禁关键词的内容,直接阻止发出或者转交人工审核。这种方式性价比极高,耗费成本小,但基本可以过滤掉大多数的违规内容。 关键词过滤存在的问题也很明显,准确率较低,经常出现误伤和漏网的情况,对于内容和社区平台来说,这是不能容忍的,前文已经讲过,哪怕一篇违规内容被放出来,产品都有可能被封禁。再加上网络的普及,越来越多的人学会了通过拼音、乱码、谐音等方式绕开关键词,关键词过滤逐渐不再能胜任内容风控的工作任务。 以上基本还属于规则的范畴,之后内容风控的发展,就进入了AI+策略的时代。 AI方面,其实叫机器学习更加准确,这是一套组合拳。举个例子,对于一个视频稿件的审核,就需要对整个视频进行逐一拆帧,然后通过OCR文字识别检查字幕,此时对于字幕的检查和文字内容的检查基本一致,文字识别涉及到NLP分词、语义理解等AI技术;对于画面,则是图片识别,识别图片中可能出现的违禁内容,这里涉及到一个准确率的问题,暴恐视频不能够通过,但游戏视频也存在战斗画面,如何保证不误伤;对于音频,则需要两个方面的审查,一方面是视频当中的语句,将语音转文本,再通过文字的审核策略来审核,另一方面是音调识别,例如识别音频当中的娇喘等无语句的声音。 机器学习还是就稿件论稿件,而一个优秀的内容风控平台,是需要配合策略的。策略产品经理是近几年一个特别火的岗位,提供更精细化的、动态的、效率的产品解决方案。对于策略来说,内容的风控不能只在单个内容上,还需要结合更高的维度,给与更加精细化的识别判断。策略要从单个内容出发,延伸到发布该内容的用户基础信息、关系链、过往内容、实名可信度等等诸多维度进行调参和计算,以判断这名用户的这条内容是否需要更细致的识别。 这里要特别强调一点,即使平台的机器算法再先进,所有的内容还都需要过人审核。所有内容过人,所有内容过人,所有内容过人,重要的事情说三遍,至于原因,还是上面那一条,内容和社区平台不容有半点闪失。 不过机器平台越先进,能够为人工审核提供的辅助也就越全面准确,人工审核的效率自然也就变高,审核人员的压力也相应减弱。 另外,对于内容风控,又会有前置风控(先审后发)和后置风控(先发后审)等不同的方式,关于这一点,以后有机会再详细分析优劣和适用场景。 对于B站来说,随着内容量越来越大,单纯的对审核人工进行扩容,恐难以解决问题。相比抖音、今日头条、西瓜视频等头条系产品、背靠百度AI的爱奇艺、腾讯视频、阿里大文娱旗下的优酷视频,B站崛起晚、资源少、技术储备弱,在机器辅助审核上还比较弱势,今后加强内容风控技术,优化内容审核策略,改善审核后台的体验,不失为一个好方法,毕竟工欲善其事,必先利其器。 (编辑:二游网_173173游戏网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |