在不久前的全球云计算科技前沿盛会——re:Invent 2023大会上，Werner Vogels 博士，亚马逊云科技的副总裁兼首席技能官第十二次在 re:Invent 亮相。在主题讲演中，他提到了生成式 AI 将逐步具备文明认识这个点非常令人感兴趣。

生成式AI的文明认识是指人工智能体系具有对不同文明背景、价值观、传统习俗以及文明差异的了解和适应能力。这种文明认识能够让AI体系更好地了解和回应不同文明环境下的用户需求，并在沟通和创造中考虑到多元化的人文因素。

一、生成式AI的文明流利性

生成式AI的文明流利性是指AI体系在生成内容或进行创作时，能够以流利、自然的方法表达和出现特定文明的言语、风格和特征。它能够适应不同文明的表达方法，使生成的内容更加靠近方针文明的习气、规范和口音。

浅谈生成式AI的文明认识——听亚马逊 CTO Werner Vogels讲演后感

大言语模型要想触达全球用户，必须到达与人类自身相同的文明流利性。Werner Vogels 博士提到近几个月开端出现一些非西方语境的大言语模型，比方用阿拉伯语和英语数据练习的 Jais、中英双语模型 Yi-34B，更符合中文语境的文心千帆以及用大量日语网络语料库练习的 Japanese-large-lm。这些痕迹表明，具有文明准确性的非西方模型将向数亿人提供生成式 AI，其影响将会涉及教育、医疗等方方面面。除了特定言语，文明流利性还将模拟特定文明的风格和口音，使生成的内容更靠近方针文明。经过学习言语的语调、语速、语音特色和当地方言等特征，生成具有特定文明风格的内容，这一点值得期待！

二、生成式AI的文明创造力

生成式AI的文明创造力是指AI体系在创作或生成文明相关内容时，能够展现出独立思考、共同观点和立异主意的能力，然后产生与传统文明不同且具有共同价值的著作。

生成式AI经过学习大规模的文明数据，包含文本、图画、音频等，能够对不同文明的特色和风格进行了解。经过深化学习文明的言语、习俗、艺术表达方法等方面的知识，AI体系能够从不同文明中罗致创意和启发，构成自己的创造力。比方下图Midjourney Model 5.2生成的水墨画《奔马图》

生成式AI在生成内容时能够进行创造性的组合。经过将不同文明元素、风格和主题进行新颖和共同的组合，能够产生跨文明融合和立异的著作。这种创造性的组合能够打破传统的文明捆绑，创造出与众不同的文明表达形式。

三、生成式AI的文明敏感性

生成式AI的文明敏感性是指AI体系在生成内容或进行创作时，能够充分考虑不同文明背景、价值观和敏感性，防止产生得罪、歧视或不当的著作，防止触及用户的文明禁忌，以尊重和容纳各种文明。

这儿博士还举了个例子：佐治亚理工学院（Georgia Institute of Technology）的研究人员在本年早些时候发布的论文中证明，即便向一个大言语模型提供清晰提及伊斯兰祈祷词的阿拉伯语提示词，生成的回复依然是主张与朋友们一同喝酒，而喝酒在伊斯兰文明中是不当之举。这种情况在很大程度上与可用练习数据有关。现在被用于练习众多大言语模型的 Common Crawl 数据集大约有 46% 的内容是英语，而且不管何种言语，更大份额的可用内容以西方文明为根底（明显倾向于美国文明）。如果将相同的提示词输入用阿拉伯语文本预练习且专门生成阿拉伯语呼应的模型，就会得到更符合文明背景的回复，比方主张喝茶或咖啡。

作为生成式AI的研究人员，为了提高文明敏感性，在研究时数据集应该尽可能涵盖不同文明背景的样本，防止集中于某一特定文明视角。经过运用广泛和多元的数据集，AI体系能够学习到不同文明的表达方法和特征，削减对特定文明的偏见。

文明和言语并非完全相同，一个模型即便能给出最完美的翻译，也未必具有文明认识。随着无数历史和经验被融入模型，我们将会看到大言语模型开端构成更广泛的世界性视角。能够信任在未来几年里，文明将在技能的设计、部署和运用方法中发挥至关重要的作用，其影响将在生成式 AI 中体现得酣畅淋漓。

另外2023 re:Invent 2023 下一站 GenAI @活动即将在各个城市敞开，一切的开发者都能够登车体会包含 Amazon PartyRock、Amazon Q、Amazon CodeWhisperer 等产品在内的丰富实践，并在旅程中与技能专家、开发者讨论AI的更多立异与未来的可能性。下一站 GenAI @ Let’s 构！

浅谈生成式AI的文化意识——听亚马逊 CTO Werner Vogels演讲后感

一、生成式AI的文明流利性

二、生成式AI的文明创造力

三、生成式AI的文明敏感性

作者信息

浅谈生成式AI的文化意识——听亚马逊 CTO Werner Vogels演讲后感

一、生成式AI的文明流利性

二、生成式AI的文明创造力

三、生成式AI的文明敏感性

相关文章

ESP32学习笔记（46）——MQTT客户端

ICCV 2023 | 旷视研究院入选论文亮点解读

Pandas中你一定要掌握的时间序列相关高级功能

深入浅出理解word2vec模型 (理论与源码分析)

作者信息