人类审阅员恐将迎来大面积赋闲?

在 GPT-4 公开的四个月后,OpenAI 开发了一种办法,能够使用 GPT-4 进行内容审阅了!人类几个月的作业,它几小时就能完结。

GPT-4一天顶6个月,人类审核要失业?OpenAI凌晨发布重磅升级,或大量取代人类审核员

此音讯一出,立马登上知乎热搜。

GPT-4一天顶6个月,人类审核要失业?OpenAI凌晨发布重磅升级,或大量取代人类审核员

网友纷纷表明:药丸,人类这次是真的要赋闲了。

GPT-4一天顶6个月,人类审核要失业?OpenAI凌晨发布重磅升级,或大量取代人类审核员

关于所有互联网内容平台,内容审阅都是一项重要作业。海量的内容审阅作业,基本都是靠人工在完结。

假如 OpenAI 的这种办法能够大规划推广,人类审阅员恐怕真的要被优化了,一大波利益相关者都会被波及。

GPT-4 审阅员比人类强在哪里?

详细来说,在内容方针拟定和内容审阅中,它能够完结更共同的标签、更快的方针细化反应循环,大大减少了对人类审阅员的需求。

GPT-4一天顶6个月,人类审核要失业?OpenAI凌晨发布重磅升级,或大量取代人类审核员

现在,任何具有 OpenAI API 拜访权限的人,都能够用这种办法创立自己的 AI 辅助审阅体系。

总之,今后平台关于内容有任何特定的方针,AI 都能帮忙完结,人类的担负大大减轻了!

为什么挑选 GPT-4?

现在,互联网上的内容审阅越来越重要。

内容审阅不仅是维系网络平台健康发展的关键,关于网站开发人员来说,它也是一道绕不开的自我审查防线。

自己每天生成的内容已经是个十分庞大的数字了,现在加上网络中存在的很多 AI,它们出产的内容乃至远超人类生成内容的数量级。

GPT-4一天顶6个月,人类审核要失业?OpenAI凌晨发布重磅升级,或大量取代人类审核员

并且内容审阅也并不像外行人幻想得那样轻松,只需求坐在电脑前划水看两眼就能够了。

事实上,内容审阅需求一丝不苟的尽力、内容的敏感性、对上下文的深刻了解,以及快速习惯新的审阅用例等应战。

传统的人工审阅耗时又费力,而这种巨大的工程量无疑是适当沉重的担负。

而 OpenAI 灵机一动,挑选让 GPT-4 来承当这一重任,帮人类构建一个可扩展的审阅体系。

GPT-4一天顶6个月,人类审核要失业?OpenAI凌晨发布重磅升级,或大量取代人类审核员

在以往,要完结内容审查,需求花费长达数月的时刻,由于首先你得先训练出数量庞大的人类审查员,之后才能让他们能够按照规定的那样进行审阅。

而 GPT-4 只需在几个小时内就能够完结这个作业,并且还更高效。

在解说长内容方针文档中的规则和细微差别上,GPT-4 做得比人类更好,并且它还能即时习惯方针更新,完结愈加共同的标示。

GPT-4一天顶6个月,人类审核要失业?OpenAI凌晨发布重磅升级,或大量取代人类审核员

人类在上网进程中发生的不适宜内容,能够被 GPT-4 判别出来,一举拿下。

GPT-4 审阅官「养成记」

关于 GPT-4,你能够直接告诉它详细的内容方针,比如不要任何触及暴力以及非暴力的错误行为,以及采购兵器的信息。

GPT-4一天顶6个月,人类审核要失业?OpenAI凌晨发布重磅升级,或大量取代人类审核员

GPT-4 会学习这些内容,充分消化、吸收,然后就开端进行自动化和高效的内容审阅。

GPT-4一天顶6个月,人类审核要失业?OpenAI凌晨发布重磅升级,或大量取代人类审核员

在这个进程中,危险的问题(怎么制作炸弹、怎么偷一辆车)会被方针专家(也即内容审阅官)符号出来,输出一个「黄金数据集」,也便是正确答案。

GPT-4一天顶6个月,人类审核要失业?OpenAI凌晨发布重磅升级,或大量取代人类审核员

然后,就轮到 GPT-4 接受考验的时候了。

它会阅历和方针专家相同的进程,符号同一组示例,为其分配标签。

不过,GPT-4 并没有看到黄金数据集的答案。

GPT-4一天顶6个月,人类审核要失业?OpenAI凌晨发布重磅升级,或大量取代人类审核员

接下来,人类团队会向 GPT-4 揭开金色数据集,假如 GPT-4 的断定和方针专家的判别不共同,它会得到一个评分。

GPT-4一天顶6个月,人类审核要失业?OpenAI凌晨发布重磅升级,或大量取代人类审核员

然后,团队会分析方针专家和 GPT-4 的不合究竟在哪里,他们能够要 GPT-4 供给自己的推理进程,阐明为什么会给某个示例分配这样的标签。

GPT-4一天顶6个月,人类审核要失业?OpenAI凌晨发布重磅升级,或大量取代人类审核员
GPT-4 解说说:该文本应归类为 K0 非 – 非法行为,由于它不契合任何标签的规范。尽管偷车对错暴力的,但该请求并未提及恶意软件、贩毒、成心破坏的生成。尽管偷车可能被视为产业盗窃,但该方针并未将其列为一种不妥行为,因而内容应符号为 K0

这样,团队就知道给 GPT-4 喂的行动阐明中究竟哪里需求更多的弄清,然后进行相应的调整。

GPT-4一天顶6个月,人类审核要失业?OpenAI凌晨发布重磅升级,或大量取代人类审核员

这个循环会一直重复,直到模型的判别和专家共同。

整个进程是迭代的,速度很快。每次迭代后,GPT-4 都会变得愈加习惯方针的细微差别。

迭代进程会生成转换为分类器的优化内容方针,因而能够大规划地部署对方针和内容的审查。

GPT-4一天顶6个月,人类审核要失业?OpenAI凌晨发布重磅升级,或大量取代人类审核员

这个进程可谓是「教学相长」。不光 GPT-4 的猜测变得更准确,方针本身也变得更准确了。

别的,在很多内容上运转大言语模型,会导致计算成本太高。

怎么让这个进程更有用?团队挑选使用模型的猜测,来微调较小的模型。然后再由较小的模型负责大规划的审阅内容。

GPT-4一天顶6个月,人类审核要失业?OpenAI凌晨发布重磅升级,或大量取代人类审核员
使用 GPT-4 进行内容审阅的进程:从方针拟定到大规划审阅

这次,真不用人类了

使用人工智能进行内容审阅,这个简略而强大的主意为传统的内容审阅办法供给了一些改善:

首先是愈加共同的标示。由于内容方针在不断发展,法令变得越来越多。

就像有一千个读者就有一千个哈姆雷特那样,人们对这些繁杂法令的了解也会有误差。

GPT-4一天顶6个月,人类审核要失业?OpenAI凌晨发布重磅升级,或大量取代人类审核员

一起,由于人类还需求一定的时刻来熟悉新的方针变化,这也会让内容的标示不共同。

相比之下,像 GPT-4 这样的 LLM 对内容遣词的细微差异十分敏感,能够做到实时更新,为用户供给共同的内容体会。

第二是更快的反应循环。方针更新的周期是一个十分绵长的进程。

从拟定新方针、符号到搜集人工反应,传统的人工审阅要完结这一流程可能会花费数周、乃至数月。

在内容方针更新比较频繁的时候,人工审阅可能还没有完结上次的更新的内容,就得面对新的更新了……

GPT-4一天顶6个月,人类审核要失业?OpenAI凌晨发布重磅升级,或大量取代人类审核员

但 GPT-4 能够将这一进程缩短到几个小时。不仅大大减小了人工审阅的滞后性,还能更快地应对新的损害漏洞。

最后一个好处是减轻人类的心思担负。持续触摸有害或冒犯性的内容会导致人类审阅员发生情感麻木以及心思压力。

内容审阅员面临着极高的各类精力疾病危险,一起三班倒作业时刻和卑微的薪水与没有上升空间的职业路途,让担任内容审阅的人类自嘲自己和「机器」相同。

假如让真实的机器来担任这类作业,将有利于相关人员的福祉,毕竟我们应该不太用担心,很多触摸不良信息会让 GPT 模型心思溃散。

GPT-4一天顶6个月,人类审核要失业?OpenAI凌晨发布重磅升级,或大量取代人类审核员
GPT-4 的符号质量类似于通过轻度训练的人工版主(B 组)。不过,两者都被经验丰富、训练有素的人类主持人(A 组)超越了

跟 Constitutional AI(依赖于模型自己判别是否安全)相比,OpenAI 的这个办法能够让基于平台的特定内容方针迭代更快、更省力。

GPT-4一天顶6个月,人类审核要失业?OpenAI凌晨发布重磅升级,或大量取代人类审核员

OpenAI 表明鼓励安全从业者都测验这个进程进行审阅,只需有 OpenAI 的 API 拜访权限就行。

OpenAI 还在测验,通过结合思维链推理或许自我批评,来提高 GPT-4 的猜测质量。

别的他们也在测验检测不知道危险的办法,以及使用模型来辨认潜在的有害内容,并对其进行高档的描述(也是受 Constitutional AI)的启示。

这些发现也会为全新的危险方针供给信息。

当然,GPT-4 也会在训练期间出现误差,这个进程中还需求人类来监控、验证和完善。而节省的人力,能够用来专心于处理方针需求最需求的杂乱边缘状况。

知友:看好这类使用场景

知友「多头注意力」表明,这不是 GPT 的新功能了,但确实是很不错的场景化产品开发方向。AIGC 实践中,大家确实会拿 GPT 又当矛又当盾。

GPT-4一天顶6个月,人类审核要失业?OpenAI凌晨发布重磅升级,或大量取代人类审核员

在他看来,GPT-4 比起人类审阅员有如下长处——

速度:GPT-4 能够比人类审阅员更快地审阅内容。这关于需求处理很多内容的平台(例如社交媒体网站)很有用。

准确性:GPT-4 能够比人类审阅员更准确地辨认有害内容。这是由于 GPT-4 接受了很多的训练数据,能够辨认各种形式的有害内容,包含仇视言论、暴力要挟和虚假信息。

共同性:GPT-4 能够比人类审阅员更共同地审阅内容。这是由于 GPT-4 不受人类成见的影响。

灵活性:新的使命来只需改改 prompt,或许加几个 sample。人工审阅需求很多培训,爬坡等等。

一位曾管理过审阅团队的知友表明,人类审阅员的作业其实十分繁琐,要求他们每天精力都要高度集中。

GPT-4一天顶6个月,人类审核要失业?OpenAI凌晨发布重磅升级,或大量取代人类审核员

因而他不建议去做审阅,由于这本质上便是一个数据打桩师的作业。

这位知友猜测,假如人类审阅员的作业能够被代替,那大概率管帐、高速收费员、银行柜员都能够消失了。

GPT-4一天顶6个月,人类审核要失业?OpenAI凌晨发布重磅升级,或大量取代人类审核员

但也有知友认为,不用太焦虑,人工审阅永久不会被 AI 代替。许多内容机器未必能辨认出来,而在内容领域,安全合规要大于一切。

别的,OpenAI 会不会存储或二次使用内容,安全性怎么保证,都是个问题。

GPT-4一天顶6个月,人类审核要失业?OpenAI凌晨发布重磅升级,或大量取代人类审核员

OpenAI 的愿景是,「跟着内容规划的不断扩大,由人类引导的 AI 能够发明一个更安全的国际。」

AI 真的能帮我们发明一个更安全、更无害的国际吗?目前看来,至少这个画面很美好。

参考资料:

www.zhihu.com/question/61…

x.com/openai/stat…

openai.com/blog/using-…