我报名参加金石计划1期应战——分割10万奖池,这是我的第26篇文章,点击检查活动详情
日报合辑 | 电子月刊 | 公众号下载资料 | @韩信子
人均『月入过万』?元世界范畴就业现状究竟如何
自2021年元世界元年之后,大批元世界相关岗位如漫山遍野涌现在市场上。从耳熟能详的元世界社交、虚拟人、区块链,到大部分人极少接触的底层技能建立,如何快速了解元世界职业?相关范畴的发展前景如何?人才供需、薪资待遇、人才要求又有什么共同之处?智联招聘发布《2022元世界职业人才发展陈述》,浅显易懂解析元世界范畴职场现状。
公众号回复『日报』获取完整版陈述。
元世界技能在各行各业的运用状况
- 2022年1-7月元世界相关招聘岗位同比增加16.6%
- 元世界人才招聘高度会集在信息技能产业,向教培、传媒、制造等范畴逐渐浸透
- 一线城市元世界人才需求占全国一半,新一线城市增加快
- 政策发力下,武汉、杭州元世界人才需求增速亮眼
- 研发与规划岗是元世界主力军,U3D人才最吃香
- C言语、JAVA等底层技能是硬通货,3D建模、特效规划技能至关重要
元世界岗位薪资水平
- 2022元世界相关岗位均匀薪资18515元/月
- 深度学习岗均匀月薪39971元,位居第一
- 人工智能技能“钱景光明”,复合型人才薪酬更高
工具&结构
『uie pytorch』通用信息抽取 UIE 的 PyTorch版
github.com/heiheiyoyo/…
Yaojie Lu 等人在 ACL-2022 中提出了通用信息抽取一致结构 UIE(Universal Information Extraction)。该结构完成了实体抽取、联系抽取、事件抽取、情感分析等使命的一致建模,并使得不同使命间具有杰出的搬迁和泛化才能。
为了方便大家运用 UIE 的强壮才能,PaddleNLP 借鉴该论文的办法,基于 ERNIE 3.0 常识增强预练习模型,练习并开源了首个中文通用信息抽取模型 UIE。
该模型可以支撑不限制职业范畴和抽取方针的要害信息抽取,完成零样本快速冷启动,并具有优秀的小样本微调才能,快速适配特定的抽取方针。本代码库是UIE的pytorch版本完成。
『MPSX』基于 MPSGraph 的 ONNX 推理引擎
github.com/prisma-ai/M…
prisma-ai.com/
MPSX 是一个基于 MPSGraph 的 ONNX 推理引擎,经过简略的几个步骤,你就可以用 MPSX 跑 ONNX 模型推理,不过大家需求了解 Metal API。
『GEEML』Google Earth Engine 机器学习包
github.com/Geethen/gee…
geethen.github.io/geeml/
GEEML 是一个 Python 工具包,它使得你可以方便运用并行处理和谷歌地球引擎的大容量终端,从谷歌地球引擎提取卫星数据。它支撑以 csv 的方式提取传统机器学习的数据(表格数据)和提取 GeoTiff 图画补丁用于深度神经网络。它有以下特性:
- 支撑并行导出图画或稀疏图画(例如,GEDI)
- 支撑导出点或多边形的栅格值(ee.FeatureCollection)
- 支撑归纳多边形内的栅格数据(ee.FeatureCollections)
- 支撑提取表格局和深度神经网络(DNN)类型的数据集
『Diffusion Bee』M1/M2芯片苹果电脑上的开源Stable Diffusion图形界面运用
github.com/divamgupta/…
diffusionbee.com/
Diffusion Bee 供给了最简略的方式在 M1 Mac 上本地运行 Stable Diffusion 模型用于 AI 创作,它配有一键式装置程序,不需求依赖性或技能常识。且模型彻底在本地运行,没有数据被发送到云端。
『Selective』白盒特征挑选库
github.com/fidelity/se…
Selective 是一个白盒特征挑选库,支撑分类和回归使命的无监督和有监督的挑选办法。具有以下特色:
- 支撑简略到杂乱的挑选办法:方差法、相关法、统计法、线性法、基于树的法、或自定义法。
- 自动的使命检测。不需求指定特征挑选办法适。
- 内置并行化的交叉验证对多个挑选器测验。
- 检查成果和特征的重要性。
博文&分享
『MATH 318 A: Advanced Linear Algebra Tools and Applications』华盛顿大学 线性代数进阶工具与运用 课程
sites.math.washington.edu/~m318/
www.youtube.com/watch?v=R3I…
Math 318 是一门线性代数进阶课程,解说『矩阵』这一运算符和数据组织方式,重点是矩阵的结构、几许含义与运用。 注意!学习本课程前。需求掌握基础的线性代数常识。
课程前半部分的核心内容是特征值和特征向量,后半部分的核心内容是奇异值和一般矩阵的奇异值分解 (SVD)。除此之外,课程还解说了一些新型的向量空间,如多项式向量空间(vector spaces of polynomials,运用于插值和求解多项式方程)、有限域上的向量空间(vector spaces over finite fields,运用于纠错码)和复向量空间(complex vector spaces,运用于傅里叶分析)。
- Eigenvalues and Diagonalization / 特征值和对角化
- Permutations and Determinant / 排列和行列式
- Difference Equations / 差分方程
- Nonnegative, Positive and Markov matrices / 非负、正和马尔可夫矩阵
- Orthogonality / 正交性
- Projections / 猜测
- Symmetric matrices and Quadratic Forms / 对称矩阵和二次方式
- Positive Semidefinite Matrices / 半正定矩阵
- Polynomial Vector Spaces / 多项式向量空间
- Singular Value Decomposition / 奇异值分解
- Vector spaces over finite fields / 有限域上的向量空间
- Complex Vector Spaces / 复向量空间
『Applications of Deep Neural Networks with Keras』深度神经网络运用(Keras)可下载书本
github.com/jeffheaton/…
书本PDF:arxiv.org/pdf/2009.05…
作者 Jeff Heaton 自 2016 年开端,在圣路易斯华盛顿大学教授 T81-558 深度学习课程,并将课件与作业等资料放在GitHub上,并收拾为此书。作者运用 Tensorflow 创建了最开端版本的内容,后续搬迁到了 Keras,并在部分章节运用了 PyTorch 等更多库。内容章节如下:
- Python Preliminaries / Python预备课程
- Python for Machine Learning / Python机器学习
- Introduction to TensorFlow / TensorFlow 简介
- Training for Tabular Data / 表格数据练习
- Regularization and Dropout / 正则化与Dropout
- Convolutional Neural Networks (CNN) for Computer Vision / 计算机视觉的卷积神经网络 (CNN)
- Generative Adversarial Networks / 生成对立网络
- Kaggle Data Sets / Kaggle 数据集
- Transfer Learning / 搬迁学习
- Time Series in Keras / Keras 中的时刻序列
- Natural Language Processing with Hugging Face / Hugging Face与自然言语处理
- Reinforcement Learning / 强化学习
- Advanced/Other Topics / 高档/其他主题
- Other Neural Network Techniques / 其他神经网络技能
数据&资源
『System Design Resources』体系规划资源集
github.com/InterviewRe…
体系规划资源集,这儿列写部分内容主题,更多内容可点击上方链接检查:
- Video Processing / 视频处理
- Cluster and Workflow Management / 集群和作业流办理
- Service Mesh / 服务网格
- Practical System Design / 有用体系规划
- Distributed File System / 分布式文件体系
- Time Series Databases / 时刻序列数据库
- Network Protocols / 网络协议
- Subscription Management System / 订阅办理体系
- NoSQL Database Internals / NoSQL 数据库内部结构
- NoSQL Database Algorithms / NoSQL 数据库算法
- Database Replication / 数据库复制
- Containers and Docker / 容器和 Docker
- Capacity Estimation / 容量估算
- Microservices / 微服务
- Load Balancing / 负载均衡
- Alerts and Anomaly Detection / 警报和反常检测
- Distributed Logging / 分布式日志记录
- Batch Processing / 批量处理
- Real Time Stream Processing / 实时流处理
研讨&论文
公众号后台回复要害字 日报,免费获取收拾好的论文合辑。
科研发展
- 2022.09.11 『神经网络』 Git Re-Basin: Merging Models modulo Permutation Symmetries
- 2022.09.09 『运动组成』 TEACH: Temporal Action Composition for 3D Humans
- 2022.08.25 『图画生成』 DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation
⚡ 论文:Git Re-Basin: Merging Models modulo Permutation Symmetries
论文时刻:11 Sep 2022
范畴使命:神经网络
论文地址:arxiv.org/abs/2209.04…
代码完成:github.com/samuela/git…
论文作者:Samuel K. Ainsworth, Jonathan Hayase, Siddhartha Srinivasa
论文简介:Experimentally, we demonstrate the single basin phenomenon across a variety of model architectures and datasets, including the first (to our knowledge) demonstration of zero-barrier linear mode connectivity between independently trained ResNet models on CIFAR-10 and CIFAR-100./经过试验,咱们在各种模型架构和数据集上证明了单盆现象,包含在CIFAR-10和CIFAR-100上首次(据咱们所知)证明了独立练习的ResNet模型之间的零妨碍线性形式衔接。
论文摘要:深度学习的成功得益于咱们可以相对容易地处理某些大规模的非凸优化问题。尽管非凸优化是NP-hard,但简略的算法–通常是随机梯度下降的变种–在实践中对大型神经网络的拟合表现出惊人的有效性。咱们以为,在考虑了隐藏单元的一切或许的排列对称性之后,神经网络损失景象包含(几乎)一个单一的盆地。咱们介绍了三种算法,对一个模型的单元进行排列,使其与参阅模型的单元保持一致。这种转化发生了一组功能同等的权重,这些权重坐落参阅模型邻近的一个近似于凸的盆地中。经过试验,咱们在各种模型结构和数据集上证明了单盆地现象,包含在CIFAR-10和CIFAR-100上独立练习的ResNet模型之间首次(据咱们所知)证明了零妨碍线性形式衔接。此外,咱们还发现了风趣的现象,即在各种模型和数据集上,模型的宽度和练习时刻与形式衔接有关。最终,咱们评论了单一盆地理论的缺陷,包含对线性形式衔接假定的反例。
⚡ 论文:TEACH: Temporal Action Composition for 3D Humans
论文时刻:9 Sep 2022
范畴使命:Motion Synthesis, 运动组成
论文地址:arxiv.org/abs/2209.04…
代码完成:github.com/athn-nik/te…
论文作者:Nikos Athanasiou, Mathis Petrovich, Michael J. Black, Gl Varol
论文简介:In particular, our goal is to enable the synthesis of a series of actions, which we refer to as temporal action composition./咱们的方针是完成一系列动作的组成,咱们称之为时刻性动作组成。
论文摘要:给定一系列自然言语描绘,咱们的使命是生成三维人类动作,这些动作在语义上与文本对应,并遵循指令的时刻次序。特别是,咱们的方针是完成一系列动作的组成,咱们称之为时刻性动作组成。现在,文本条件下的动作组成技能只将单个动作或单个句子作为输入。这部分是因为缺少适宜的包含动作序列的练习数据,但也是因为其非自回归模型表述的计算杂乱性,它不能很好地扩展到长序列。在这项作业中,咱们处理了这两个问题。首要,咱们使用了最近的BABEL动作文本集,它有广泛的标记动作,其中许多是在一个序列中呈现的,并在它们之间有过渡。接下作的口述动作组合”,为各种各样的动作和言语描绘的时刻组合发生实际的人类动作。为了鼓励这项新使命的作业,咱们在咱们的网站上供给了咱们的代码供研讨之用。
⚡ 论文:DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation
论文时刻:25 Aug 2022
范畴使命:Image Generation,图画生成
论文地址:arxiv.org/abs/2208.12…
代码完成:github.com/XavierXiao/…
论文作者:Nataniel Ruiz, Yuanzhen Li, Varun Jampani, Yael Pritch, Michael Rubinstein, Kfir Aberman
论文简介:Once the subject is embedded in the output domain of the model, the unique identifier can then be used to synthesize fully-novel photorealistic images of the subject contextualized in different scenes./一旦主体被嵌入到模型的输出域中,仅有的标识符就可以用来组成主体在不同场景中的彻底立异的逼真图画。
论文摘要:大型文本-图画模型在人工智能的发展中完成了一个明显的腾跃,可以从给定的文本提示中组成高质量和多样化的图画。但是,这些模型缺少仿照给定参阅会集的主体外观和组成不同背景下的新颖演绎的才能。在这项作业中,咱们提出了一种 “个性化 “的文本-图画分散模型的新办法(根据用户的需求对其进行专业化处理)。只需输入一些主题的图画,咱们就可以对预练习的文本-图画模型(Imagen,尽管咱们的办法并不局限于一个特定的模型)进行微调,使其学会将一个共同的标识符与该特定主题绑定。一旦主题被嵌入到模型的输出域中,仅有的标识符就可以被用来组成该主题在不同场景中的全立异逼真图画。经过使用嵌入在模型中的语义先验和新的自体类先验保存损失,咱们的技能可以在不同的场景、姿态、视角和照明条件下组成参阅图画中没有呈现的主体。咱们将咱们的技能运用于几个曾经无法完成的使命,包含主体重构、文本辅导的视图组成、外观修改和艺术渲染(同时保存主体的要害特征)。项目页面:dreambooth.github.io/
咱们是 ShowMeAI,致力于传播AI优质内容,分享职业处理方案,用常识加速每一次技能生长!
◉ 点击 日报合辑,在公众号内订阅论题 #ShowMeAI资讯日报,可接纳每日最新推送。
◉ 点击 电子月刊,快速阅读月度合辑。