GPT-4 发布了，赶紧申请 API 候补名单-六虎

介绍

GPT-4（Generative Pre-trained Transformer 4）是 OpenAI 开发的一种大型言语模型。它在 GPT-3 的基础上进一步优化和扩展，供给了愈加准确和全面的言语了解与生成能力。以下是官网介绍：

GPT-4 是一个多模态大型言语模型（支持承受图画和文本输入，以文本形式输出），也是 OpenAI 努力扩展深度学习的最新里程碑。虽然 GPT-4 关于许多现实场景的处理比人类差，但它在各种体现专业和学术能力的 benchmark 上，已体现出和人类适当的水平。
例如，GPT-4 经过了模仿律师考试，其分数在应试者的前 10% 左右；相比之下，GPT-3.5 的得分却在倒数 10% 左右。OpenAI 表示，他们花了 6 个月的时刻来运用对抗性测验程序，以及经过 ChatGPT 的经验教训迭代调整 GPT-4，从而在真实性和可控性等方面取得了有史以来最好的成果（虽然远非完美）。
咱们还开源了 OpenAI Evals，这是咱们用于主动评价 AI 模型性能的结构，答应任何人报告咱们模型中的缺陷，以协助辅导进一步改进。

在随意的谈话中，GPT-3.5 和 GPT-4 之间的差异或许很奇妙。当任务的复杂性到达满足的阈值时，差异就会出现——GPT-4 比 GPT-3.5 更牢靠、更有构思，而且能够处理更纤细的指令。

OpenAI 还将机器学习模型的传统 benchmark 用于评价 GPT-4。成果显现，GPT-4 现已远远超越现有的大型言语模型，以及大多数最先进的 SOTA（state-of-the-art）模型。benchmark 数据如下：

在 MMLU benchmark 中（一个基准数据集，包括来自于 STEM、人文、社科等 57 个学科的选择题，它用于测验 LLM 的世界知识和问题解答的能力），GPT-4 处理中文的准确度大约是 80%，现已优于其他 LLM 的英文体现，比如 GPT-3.5、Chinchilla、PALM。

输入

用一个句子解说灰姑娘的情节，其中每个单词必须以字母表中从 A 到 Z 的下一个字母开头，不重复任何字母。
输出

A beautiful Cinderella, dwelling eagerly, finally gains happiness; inspiring jealous kin, love magically nurtures opulent prince; quietly rescues, slipper triumphs, uniting very wondrously, xenial youth zealously.（翻译：美丽的灰姑娘，热切的栖居，总算取得美好；激起妒忌的亲人，爱情神奇地孕育出富贵的王子；悄然拯救，拖鞋成功，联合无比，热心青年。）

输入

我能够用这些质料做什么？
输出

你能够用这些质料做许多选择！一些或许性包括：- 煎饼或华夫饼 – 可丽饼 – 法度吐司 – 煎蛋卷或菜肉馅煎蛋饼 – 乳蛋饼 – 奶油冻或布丁 – 蛋糕或纸杯蛋糕 – 松饼或面包 – 饼干。这些只是几个例子，但或许性是无穷无尽的！
输入

这张图有什么好笑的？并对图片中的每部分进行描绘。
输出

图片显现了一个 “Lightning Cable” 适配器的包装，总共包含三个部分。

图片 1：一部智能手机，其充电端口插着一个 VGA 接口（大的蓝色 15 针接口，通常用于电脑显现器）。

图片 2：”Lightning Cable” 适配器的包装上有一张 VGA 接口的图片。

图片 3：VGA 连接器的特写，结尾是一个小的 Lightning 连接器（用于为 iPhone 和其他苹果设备充电）。

这张图片中的幽默来自将过期的大型 VGA 连接器插入小型现代智能手机充电端口的荒谬做法。

输入

[文章来自：en.wikipedia.org/wiki/Rihann…] 描绘她在超级碗比赛中的体现以及它的特别之处（文章很长，要比 GPT3.5 能处理的文本长出一倍，下面是截图）。
输出

出于多种原因，蕾哈娜 (Rihanna) 的超级碗 LVII 中场秀表演很特别。首先，这是她五年多来的第一次现场表演，也是她第一次登上超级碗中场秀的头条新闻。此外，她还创造了前史，成为第一个在怀孕期间在超级碗上表演的人。该节目自身广受好评，许多人称誉她充满活力的表演和令人形象深入的歌声。它还取得了巨大的收视率，成为前史上收视率第二高的中场秀。

上面的示例看起来很简略？OpenAI 紧接着展示了高档用法 —— 读论文。简略来说就是给 GPT-4 供给论文的图片格式文件，让它阅览并总结出要点。作用如下：

答复图片中包含的提问内容等操作：

甚至答复图片中对应题号的问题：

GPT-4 跟 GPT-3.5 相似，对训练数据中断后（2021 年 9 月）所产生的工作不太了解，也会犯一些在咱们看来很简略的推理性错误，给用户供给不合理的主张，以及在生成的代码中引入安全漏洞。

在内部的对抗性真实性评价中，GPT-4 的得分比最新的 GPT-3.5 高 40%：

也就是说，即使 GPT4 生成的答案更准确，但也只是比 GPT-3.5 愈加可信了 40% 而已！

在运用言语模型输出时，尤其是在高风险上下文中，应非常当心，运用与特定用例需求匹配的准确协议（如人工检查、附加上下文基础或完全避免高风险运用）。

关于这些潜在性的危险因素，团队也聘请了来自多个不同行业的专家对模型进行了优化调整，但是其详细作用，还需要等后面场景使用较为广泛后，才干得出结论。

假如你有 ChatGPT Plus 订阅会员，则能够直接在 chat.openai.com 上取得 GPT-4 拜访权限，无需等候。不过有必定约束，在 4 小时内，最多只能发布 100 条信息。

取得拜访权限后，用户当前仍是只能向 GPT-4 模型宣布纯文本请求，图画输入依然只是研究预览阶段，得等一些时刻才对外敞开。

OpenAI 已面向开发者敞开 GPT-4 API 的请求通道，想运用的话，能够先提交请求，进入 waitlist 中等候经过。

请求通道：openai.com/waitlist/gp…

假如请求成功，会收到一封官方的邮件：

本文正在参与人工智能创作者扶持计划