ShowMeAI日报系列全新晋级!覆盖AI人工智能 东西&结构 | 项目&代码 | 博文&共享 | 数据&资源 | 研讨&论文 等方向。点击查看 历史文章列表,在大众号内订阅话题 #ShowMeAI资讯日报,可接纳每日最新推送。点击 专题合辑&电子月刊 快速阅读各专题全集。
东西&结构
『StereoKit』HoloLens混合实际开发库
github.com/StereoKit/S…
StereoKit 是一个易于运用的开源混合实际库,统筹了趣味性、易用性和专业性。StereoKit 受 XNA 和 Processing 等库的启发,根据 C# 和 OpenXR 构建,可用于完成 HoloLens 和 VR 应用程序。从下方的演示图能够看出,StereoKit 的混合实际输入、简单强大的互动界面、灵敏的着色器/原料体系等特点都很突出。教程文档十分齐备,适合入手!
『doccano』根据网页的开源协同多言语文本标示东西
github.com/doccano/doc…
doccano 是一个开源人工文本标示东西,能够为 Named Entity Recognition 命名实体辨认、Sentiment Analysis 情感分析、Tanslation 文本翻译、Intent Detection and Slot Filling、Text to SQL、Image Classification 图画分类、Image captioning 图画说明、Object Detection 方针检测、Polygon Segmentation 多边形切割、Speech to Text 语音到文本等使命供给标示功能。只需创立一个项目,上传数据并开始标示,就能够在几个小时内树立一个数据集。
『Fast Poisson Image Editing』根据雅可比办法的快速泊松图画编辑算法
github.com/Trinkle2389…
泊松图画编辑(Fast Poisson Image Editing),利用多核CPU或GPU来处理高分辨率的图画输入,能够将两幅图画融合在一起而不发生人工痕迹。该项目根据雅可比办法,给定源图画及其相应掩码、方针图画上的对应方位,算法总是能发生惊人的成果。
『ExplainableAI.jl』运用 Julia 和 Flux.jl 的可解说人工智能
github.com/adrhill/Exp…
ExplainableAI.jl 完成了神经网络的可解说性办法和可视化,类似于 PyTorch 的 Captum、Zennit 以及Keras 模型的 iNNvestigate。Repo 供给了一个示例,用 LRP 解说为什么运用一个预先练习好的小型 LeNet5 模型将 MNIST 数字归类为9。
『yolov7-opencv-onnxrun-cpp-py』YOLOv7方针检测布置
github.com/hpc203/yolo…
Repo 分别运用 OpenCV、ONNXRuntime 布置 YOLOv7 方针检测,一共包括14个 onnx模型。依然是包括 C++ 和 Python 两个版别的程序。
博文&共享
一位博士生对『机器学习工程』的考虑
www.shreya-shankar.com/phd-year-on…
作者 Shreya Shankar 结业于斯坦福大学,曾供职于 Google Brain 和 Facebook,目前在加州大学伯克利分校攻读数据库博士学位。这篇文章是她读博一年后,从『数据工程 Data Engineering』的视点对『机器学习工程 Machine Learning Engineering』的一些考虑。
文章将 MLE(机器学习工程) 划分为两种类型:Task MLE(使命向机器学习工程) 和 Platform MLE(渠道向机器学习工程)。Task MLE 担任在生产中维持特定的机器学习流水线,Platform MLE 担任协助 Task MLE 自动化其繁琐的作业部分。文中包括很多作者的实践总结与反思,包括模型的约束、当前作业的不合理之处和改进方案等。
2022 『机器学习作业』商场:条条大路通罗马
evjang.com/2022/04/25/…
作者 Eric Jang 布朗大学结业后任职于 Google 机器人技能团队,2022年跳槽至 Halodi Robotics 任AI副总裁。本文是作者本次求职的总结,梳理『FAANG+similar』『自己创业』『OpenAI』『Large Language Model 草创公司』『Tesla』『Robotics 草创公司』『ML + Healthcare 草创公司』『Crypto + DeFi』各方向的利弊,论述了自己对创业的考虑、对行业开展的判别。Eric Jang 的调查视野很宏观!ML从业者能够一看~
数据&资源
『CelebV-HQ』大规模视频人脸属性数据集
github.com/CelebV-HQ/C…
CelebV-HQ(高质量名人视频数据集)是一个具有丰厚面部属性注释的大规模、高质量和多样化的视频数据集,包括分辨率不低于 512×512 的 35,666 个视频片段,来自 15,653 个人,并且所有片段都是用 83 个面部属性手动标示的,涵盖了外观、动作和情绪。
『Awesome Semiconductor Startups』半导体创业公司大列表
github.com/aolofsson/a…
研讨&论文
大众号回复关键字日报,免费获取整理好的论文合辑。
科研发展
- 2022.07.14 『自然言语处理』 Scene Text Recognition with Permuted Autoregressive Sequence Models
- 2022.07.12 『核算机视觉』 Collaborative Neural Rendering using Anime Character Sheets
- 2022.07.14 『核算机视觉』 Relighting4D: Neural Relightable Human from Videos
- 2022.07.13 『核算机视觉』 Learnability Enhancement for Low-light Raw Denoising: Where Paired Real Data Meets Noise Modeling
⚡ 论文:Scene Text Recognition with Permuted Autoregressive Sequence Models
论文时间:14 Jul 2022
所属范畴:自然言语处理
对应使命:Language Modelling,Scene Text Recognition,言语模型,场景文字辨认
论文地址:arxiv.org/abs/2207.06…
代码完成:github.com/baudm/parse…
论文作者:Darwin Bautista, Rowel Atienza
论文简介:Context-aware STR methods typically use internal autoregressive (AR) language models (LM)./语境感知的STR办法一般运用内部自回归(AR)言语模型(LM)。
论文摘要:上下文感知的STR办法一般运用内部自回归(AR)言语模型(LM)。AR模型的固有约束促进两阶段办法选用外部LM。外部LM对输入图画的条件独立性可能会导致它过错地纠正正确的预测,然后导致明显的低效率。咱们的办法,PARSeq,运用互换言语模型学习具有共享权重的内部AR LM的集合。它将无语境的非AR和语境感知的AR推理一致起来,并运用双向语境进行迭代完善。运用合成练习数据,PARSeq在STR基准(91.9%的准确性)和更具挑战性的数据集中取得了最先进的(SOTA)成果。当在实在数据上进行练习时,它树立了新的SOTA成果(96.0%的准确性)。PARSeq在准确率与参数数、FLOPS和延迟方面是最佳的,由于其简单、一致的结构和并行符号处理。由于其对注意力的广泛运用,它对实际国际图画中常见的恣意方向的文本是稳健的。代码、预练习权重和数据见:github.com/baudm/parse…
⚡ 论文:Collaborative Neural Rendering using Anime Character Sheets
论文时间:12 Jul 2022
所属范畴:核算机视觉
对应使命:Neural Rendering,神经烘托
论文地址:arxiv.org/abs/2207.05…
代码完成:github.com/megvii-rese…
论文作者:Zuzeng Lin, Ailin Huang, Zhewei Huang, Chen Hu, Shuchang Zhou
论文简介:Drawing images of characters at desired poses is an essential but laborious task in anime production./在动漫制造中,为人物制造所需姿态的图画是一项必不可少但却很吃力的作业。
论文摘要:在动漫制造中,以抱负的姿态制造人物图画是一项重要而又吃力的使命。在本文中,咱们提出了协作神经烘托(CoNR)办法,从角色表中的一些恣意姿态的参考图画中创立新的图画。一般来说,动漫人物身体形状的高度多样性使得实际国际人类的通用身体模型(如SMPL)无法被选用。为了克服这一困难,CoNR运用了一个紧凑的、容易获得的地标编码,以避免在管道中创立一个一致的UV映射。此外,经过在专门规划的神经网络结构中运用特征空间跨视点密布对应和翘曲,在具有多个参考图画时,CoNR的功能能够得到明显提高。此外,咱们收集了一个包括70多万张不同姿态的手绘和合成图画的字符表数据集,以促进该范畴的研讨。
⚡ 论文:Relighting4D: Neural Relightable Human from Videos
论文时间:14 Jul 2022
所属范畴:核算机视觉
论文地址:arxiv.org/abs/2207.07…
代码完成:github.com/frozenburni…
论文作者:Zhaoxi Chen, Ziwei Liu
论文简介:Our key insight is that the space-time varying geometry and reflectance of the human body can be decomposed as a set of neural fields of normal, occlusion, diffuse, and specular maps./咱们的首要主意是,人体的时空改动的几何学和反射率能够被分解为一组法线、阻塞、漫反射和镜面地图的神经场。
论文摘要:人体AI打光是一项十分抱负但具有挑战性的使命。现有的作业要么需求昂贵的运用灯火舞台的一次光照(OLAT)捕获的数据,要么不能自由地改动烘托身体的视角。在这项作业中,咱们提出了一个原则性的结构,即Relighting4D,它能够在不知道的光照下从人类视频中自由地从头打光。咱们的首要主意是,人体的时空改动的几何形状和反射率能够被分解为一组法线、阻塞、漫反射和镜面地图的神经场。这些神经场被进一步整合到根据反射率的物理烘托中,神经场中的每个极点都会吸收和反射环境中的光线。整个结构能够以自监督的方式从视频中学习,并为正则化规划了物理上的先验因素。在实在和合成数据集上进行的很多试验表明,咱们的结构能够为具有自由视角的动态人类演员从头打光。
⚡ 论文:Learnability Enhancement for Low-light Raw Denoising: Where Paired Real Data Meets Noise Modeling
论文时间:13 Jul 2022
所属范畴:核算机视觉
对应使命:Denoising,降噪
论文地址:arxiv.org/abs/2207.06…
代码完成:github.com/megvii-rese…
论文作者:Hansen Feng, Lizhi Wang, Yuzhi Wang, Hua Huang
论文简介:Low-light raw denoising is an important and valuable task in computational photography where learning-based methods trained with paired real data are mainstream./低光原始去噪是核算拍摄中一项重要而有价值的使命,在那里,以配对的实在数据练习的根据学习的办法成为干流。
论文摘要:弱光原始去噪是核算拍摄中的一项重要而有价值的使命,其中以配对实在数据练习的根据学习的办法是干流。但是,有限的数据量和杂乱的噪声散布构成了配对实在数据的可学习性瓶颈,这约束了根据学习的办法的去噪功能。为了处理这个问题,咱们提出了一个可学习性增强战略,根据噪声建模对成对的实在数据进行改造。咱们的战略由两种有效的技能组成:射击噪声增强(SNA)和暗影校对(DSC)。经过噪声模型的解耦,SNA经过增加数据量来提高数据映射的精度,DSC经过下降噪声的杂乱性来下降数据映射的杂乱性。在公共数据集和实在成像场景中的很多成果一起证明了咱们办法的先进作用功能。
咱们是 ShowMeAI,致力于传播AI优质内容,共享行业处理方案,用知识加快每一次技能生长!点击查看 历史文章列表,在大众号内订阅话题 #ShowMeAI资讯日报,可接纳每日最新推送。点击 专题合辑&电子月刊 快速阅读各专题全集。
- 作者:韩信子@ShowMeAI
- 历史文章列表
- 专题合辑&电子月刊
- 声明:版权所有,转载请联系渠道与作者并注明出处
- 欢迎回复,拜托点赞,留言推荐中有价值的文章、东西或建议,咱们都会赶快回复哒~