**内容一览:**2022 年 AI 范畴开展不断提速,新技能效果纷纷落地,模型迭代加快升级。本文总结了 2022 年 AI 范畴各大公司的技能成就。
**关键词:**年终盘点 大厂 技能创新
2022 年在此起彼伏的咳嗽声中接近尾声,这一年,AIGC 成为人工智能范畴最大黑马,ScienceAI 有了更多实际落地的应用,这一年咱们阅历了各大厂商缩减预算、裁撤员工,也体验了逢凶化吉的技能狂欢……
今日,咱们将经过这篇文章,与各位同行共同回忆 2022 年那些人工智能范畴具有打破性含义的研发效果。
data2vec
语音、视觉及文本自监督学习的通用框架
**发布组织:**Meta AI
**发布时刻:**2022 年 1 月
项目地址:
github.com/facebookres…
data2vec 是一个**大一统的多模态自监督学习模型,**能够以较高的功能处理图画、文本、语音等使命。
12 月 16 日 data2vec 2.0 发布,与现有的计算机视觉自监督算法比较,相同精度下速度快了 16 倍。
data2vec 2.0 原理简介
AlphaCode
竞赛等级代码生成 AI
**发布组织:**DeepMind
**发布时刻:**2022 年 2 月
项目地址:
github.com/deepmind/co…
**AlphaCode 凭借大型语言模型,根据问题的语言描绘构建代码。**在 Codeforces 挑战赛中,AlphaCode 击败了 46% 的参赛者。该研究不只登上了 Science 封面,还被该杂志评入年度十大科学打破。
AlphaCode 概览
DallE 2
文本到图画的生成东西
**发布组织:**OpenAI
**发布时刻:**2022 年 4 月
**项目地址:**openai.com/dall-e-2/
**DallE 2 根据文本描绘,能够创立更加具有现实主义色彩的艺术图画。**与 OpenAI 2021 年发布的 DallE 比较,DallE 2 能够生成更实在、更准确的图画,且分辨率提高了 4 倍。
An astronaut riding a horse in a photorealistic style
DallE 2 生成的图画示例
Gato
全能型智能体
**发布组织:**DeepMind
**发布时刻:**2022 年 5 月
项目地址:
www.deepmind.com/blog/a-gene…
**Gato 是一个全能型智能体,**能够玩雅达利游戏、对图画进行描绘、谈天以及根据上下文决议输出文本、关节扭力或其他 token。
这种通用模型解决一切使命类似人工智能,终究或超越特定于专门范畴的模型。
ESM Fold
蛋白质结构猜测模型
**发布组织:**Meta AI
**发布时刻:**2022 年 7 月
项目地址:
github.com/facebookres…
**ESM Fold 是一个猜测蛋白质序列的模型,**能够直接进行高准确度、端对端、原子层级结构猜测。它仅运用单个输入序列,只需检查单个蛋白质序列,这极大加快了推理速度。
用 ESM Fold 进行单序列结构猜测
Make-A-Video
根据文本生成视频的 AI 系统
**发布组织:**MetaAI
**发布时刻:**2022 年 9 月
**项目地址:**makeavideo.studio/
Make-A-Video 是一个文本-视频生成模型,它经过带有文字描绘的图画,来学习常用的描绘方法,一起运用无标签视频,了解和学习移动方法。
Make-A-Video 生成的视频风格多样,对文本复原度高,是生成短视频方面的 SOTA 模型。
根据文本描绘生成视频的部分示例
AlphaTensor
改进矩阵乘法,提高计算速度
**发布组织:**DeepMind
**发布时刻:**2022 年 10 月
项目地址:
github.com/deepmind/al…
AlphaTensor 改进了现在最优的 4*4 矩阵乘法,并且进一步提高了其他 70 余种不同巨细矩阵乘法计算速度。该效果登上了 Nature 封面,被 Scinece 杂志评入年度十大科学打破。
AlphaTensor 架构一览
Magic 3D
text-to-3D content 创立东西
**发布组织:**NVIDIA
**发布时刻:**2022 年 11 月
项目地址:
deepimagination.cc/Magic3D/
NVIDIA 入局 AIGC,**凭文字描绘就可生成 3D Mesh 模型。**它结合 image conditioning 技能以及根据文本提示的修改方法,供给了一个控制 3D 组成的新思路,使得创立高质量 3D Mesh 模型成为可能。
Magic 3D 经过两个阶段创立 text-to-3D content
ChatGPT
超级对话模型
**发布组织:**OpenAI
**发布时刻:**2022 年 11 月
项目地址:
openai.com/blog/chatgp…
ChatGPT 的训练运用了 RLHF (Reinforcement Learning from Human Feedback),与 InstructGPT 运用的方法相同,仅在数据搜集设置上有细微差别。
ChatGPT 能够像人类一样谈天沟通,完结编撰邮件、视频脚本、文案、翻译及代码等使命。自上线以来,引起了海内外很多开发者的争相试用和热烈评论,可谓 2022 年开发人员参加度最高的技能项目。
ChatGPT 训练过程概览
PointE
根据文本描绘生成 3D 点云
**发布组织:**OpenAI
**发布时刻:**2022 年 12 月
项目地址:
github.com/openai/poin…
用 PointE 根据文本提示生成 3D 点云的过程分为三个步骤:
1、根据文本提示,生成一个组成视图 (synthetic view)
2、根据组成视图,生成 coarse point cloud (1024 point)
3、根据低分辨率点云和组成视图,生成 fine point cloud (4096 Point)
使用 PointE 单卡 1 分钟生成 3D 点云,text-to 3D 告别高算力耗费时代。
冬去春来,畅想 2023
2022 行将画上句点,2023 注定是充满不知道的一年,AIGC 范畴会有哪些新效果?ScienceAI 将怎么应对基础科学与 AI 穿插带来的挑战?芯片研发、国产操作系统,又会发生哪些新打破?
你对 2023 年人工智能范畴的技能和应用有哪些预判,欢迎留言沟通评论~