本站公告

  • 版权说明:网站所有内容均来自互联网用户共享内容,不代表波克斗地主立场,若侵犯您的权益,请与我们联系。

  • 投诉/建议:欢迎与波克斗地主合作、投诉、建议,意见可以发送详细内容至邮件:15983226@qq.com 。

揭秘:AI鉴黄师是怎么工作的 如何培养

揭秘:AI鉴黄师是怎么工作的?如何培养?

网络媒体的发展催生了一个充满神秘色彩的职业——鉴黄师,不少宅男心中的 梦想工作 。

殊不知,鉴黄师实则是一个无比艰辛的工种:熬夜、劳累、枯燥……但即便像上了发条一样地工作,他们依然越来越难满足短视频时代鉴黄堵漏的需求。

今年四月,快手、火山小视频因传播低俗信息被约谈。自此,对互联网色情内容的打击力度愈发升级。

人工智能鉴黄师便由此应运而生,AI的出现极大地解放了挣扎在鉴黄大业一线的人工鉴黄师们。

目前在我国上线的 AI鉴黄师 ,不仅能鉴别黄片黄图,连带有情色信息的语音内容也能够快速捕捉。近期上线公测的阿里巴巴AI语音鉴黄反垃圾服务,不仅能支持中文、日文、英文等多国语言,还能识别东北话、四川话、广东话等方言,就连无语义的呻吟声也能识别出来。

带着满满的好奇,《环球时报》记者采访了AI智能鉴黄在图片、语音和语义三大领域的领先技术团队,请他们揭开AI鉴黄师的神秘面纱。

AI鉴黄师是怎么工作的?

在图像鉴黄领域起步较早的图普科技公司运营总监姜泽荣介绍,图像鉴黄的原理首先是要制定色情图片的分类标准,然后收集大量素材,进行分类标注,最后用这些标注好的素材去训练图片,让机器去学习各个分类里面的特征,不断调整自己模型的参数,并最终得到最佳的识别模型。

当机器对图像进行识别以后,这些图像数据会转化为数字化的信息,带入到模型里面进行计算,根据计算值将图片标注为 正常、性感、色情 三个类别。如果在人工复核环节发现机器识别有误,则会有针对性地对相同场景的图片进行数据学习,并调整参数,直到错误率达到最低值。

AI鉴黄师如何培育起来的?

早在2020年图普科技就开始利用AI来识别静态图像里的色情元素,但是早期的素材收集工作却困难重重。 公司刚成立时,一天起码有六个小时都在搜集数据,简单说,就是看黄图、黄片,然后把它们扔到数据库中。一开始我们只能依靠自身力量搜集素材,每天都在号召亲友宅男贡献出自己收藏的资源,但是来源比较单调,主要是大陆和岛国片为主。收集的关键全靠寻找‘对的人’,只要找对了人,方能以一敌百。直到后来有了客户提供的海量数据才算真正走向正轨。只有数据覆盖场景越全面,模型才能越精准。

相比语音识别和图像识别,不良信息在语义方面的识别则发展略晚。相比之下,它却更能够捕捉语言间细微的、不易被察觉的 软色情 信号,而中文也是语义识别领域最难做的语言。专注于AI语义识别的三角兽科技公司技术总监亓超告诉《环球时报》记者,该公司目前在语义方面的 鉴黄 主要体现在人工智能交互系统当中,也就是常见的 人机对话 。

(责任编辑:波克斗地主)