ShowMeAI日报系列全新晋级!覆盖AI人工智能 东西&框架 | 项目&代码 | 博文&共享 | 数据&资源 | 研讨&论文 等方向。点击查看 历史文章列表,在大众号内订阅论题 #ShowMeAI资讯日报,可接纳每日最新推送。点击 专题合辑&电子月刊 快速阅读各专题全集。
Autowise.ai 仙途智能完结两亿元 B2 轮融资,全球事务逆势猛
仙途智能 Autowise.ai 以『人工智能』和『自动驾驶』技能为中心,2017年在上海组建了我国最早的一批 robotaxi 车队,2019年获得自动驾驶货车测试牌照,并率先将自动驾驶技能运用到城市环卫范畴,发布了全球首支包含1-18吨不同车型、并能运用于杂乱作业场景的自动驾驶清扫车队,累计实在运营里程超百万公里。本轮2亿元融资由杉杉创投、欧普本钱、老股东天奇本钱与创始人黄超参加投资,融资将首要用于自动驾驶技能研发与商业化运营投入,以及海内外市场规模的扩张。
东西&框架
『Barfi』根据 Python 流程的编程环境,供给了一个图形化的编程环境
github.com/krish-adi/b…
运用 barfi.Blocks 创立一个 Schema,生成并连接各 Block,编辑器右上方的小地图显示了当时布局。点击编辑器 Execute 按钮,在 compute_engine=True 时,创立的 schema 将与 Block 一同被返回。一个程序就这样完结啦!界面简洁、操作简略,还能够快速集成到 Python 作业流!你真的不心动嘛~
『sematic』一个开源的 ML 流程开发东西箱
github.com/sematic-ai/…
sematic 能够将树立 ML Pipline 原型、部署生产的时刻,从几周压缩到几天之内(能够当作 Kubeflow Pipelines 的『替身』)。作为一款开源的开发东西包,sematic 在开发/运行 ML Pipeline时运用本地 Python 函数,并且能够监控 / 可视化 / 盯梢一切 Pipeline 进程的输入输出。
『Scalecast』时序数据猜测库
github.com/mikekeith52…
Scalecast 是一个轻量级的建模运用,能够快速地运用、调优和验证猜测问题的各类模型。假如你需要为几条事务线(成百上千的数据片)供给猜测成果,那试试 scalecast 吧!相比于简略的线性回归或许一些快速程序,scalecast 能够发生动态的猜测成果,而不是一步猜测的平均值,避免了『测试集上准确率很好,但不能推广到实在数据』的尴尬局势。
『stopes』为机器翻译研讨预备数据(单语预处理,双文本发掘等)的库
github.com/facebookres…
NLLB(No Language Left Behind,无言语障碍)是 Meta 首创的人工智能打破项目,旨在为 200 多种言语供给1对1的高质量翻译。stopes 作为 NLLB 项目的一部分,可用于创立干净的单语数据(monolingual data)、发掘双文本、经过模块化的 API 快速构建和复制数据发掘管道等。
『Giskard』面向 ML 团队的开源 CI/CD 平台
github.com/Giskard-AI/…
项目&代码
『2022 搜狐校园算法大赛』NLP 赛道第1名开源方案(试验代码)
github.com/jzm-chairma…
模型的全体架构就是一个普通的分类模型,在预练习的 BERT 或 XLNet 模型基础上增加了简略的MLP分类器。这个思路的要点在于改变数据输入的办法,运用 BERT 和 XLNet 作为 Masked Language Model 的性质,以 [SEP] 符号为界,第一段为文本输入,第二段按次序输入一切实体,实体之间以 [MASK] 进行分隔,这 个[MASK] 标签经过 BERT Encoder 得到的语义向量就代表对应实体的情感极性。将一切 [MASK] 方位的语义向量经过分类器即可并行对一切的实体进行分类。更多作者解读能够看 《这篇文章 https://zhuanlan.zhihu.com/p/533808475》 。
博文&共享
『Probabilistic Numerics』概率数值办法 免费书本
www.probabilistic-numerics.org/textbooks/
数值算法从『可核算的量』中近似地核算出『难以处理的量』,或许说,从数据中推断出一个潜在的量。因此核算程序可被视作 learning machine,运用贝叶斯推理来树立更灵敏有用的核算算法。概率数值核算正式确立了『机器学习』和『运用数学』之间的联系。本书供给了大量的背景资料(还有数据、作业实例、练习及解答),更适用于AI、CS、统计学、运用数学的研讨生。(大众号『ShowMeAI研讨中心』回复『日报』获取该书电子版)
『Object Detection State of the Art 2022』2022方针检测 前沿博文
medium.com/@pedroazeve…
深度学习技能蓬勃发展,物体检测也随之成为热门论题。本文介绍了最新的物体检测技能现状。本文是作者 Pedro Azevedo『Object Detection and YOLO』系列的 Part 1,别的两篇『Part 2: From YOLO to YOLOv4』、『Part 3: What is the Best YOLO?』 也很不错,推荐阅读!
数据&资源
『2023届互联网校招信息』提前批、秋招、春招 信息资源汇总
github.com/CARLOSGP202…
研讨&论文
大众号回复关键字 日报,免费获取整理好的论文合辑。
科研进展
- 2022.07.06『核算机视觉』YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors
- 2022.07.06『核算机视觉』Bridging the Gap between Object and Image-level Representations for Open-Vocabulary Detection
- 2022.07.06『核算机视觉』DCT-Net: Domain-Calibrated Translation for Portrait Stylization
- 2022.07.06『语音』Speech Denoising in the Waveform Domain with Self-Attention
⚡ 论文:YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors
论文标题:YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors
论文时刻:6 Jul 2022
所属范畴:核算机视觉
对应使命:Object Detection,Real-Time Object Detection,方针检测,实时方针检测
论文地址:arxiv.org/abs/2207.02…
代码完成:github.com/wongkinyiu/… , github.com/pjreddie/da… , github.com/AlexeyAB/da…
论文作者:Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao
论文简介:YOLOv7 surpasses all known object detectors in both speed and accuracy in the range from 5 FPS to 160 FPS and has the highest accuracy 56. 8% AP among all known real-time object detectors with 30 FPS or higher on GPU V100./YOLOv7在5 FPS到160 FPS的范围内,在速度和准确度上都超过了一切已知的物体检测器,并且在GPU V100上30 FPS或更高的一切已知实时物体检测器中具有最高的准确度56。在GPU V100上30 FPS或更高的一切已知的实时物体检测器中,YOLOv7具有最高的准确度56.8%AP。
论文摘要:YOLOv7在5FPS到160FPS范围内的速度和精度都超过了一切已知的物体检测器,在GPU V100上一切已知的30FPS或更高的实时物体检测器中具有最高精度56.8%AP。YOLOv7-E6物体检测器(56 FPS V100, 55.9% AP)比根据transformer的检测器SWIN-L Cascade-Mask R-CNN(9.2 FPS A100, 53. 9%)的速度和2%的准确率,以及根据卷积的检测器ConvNeXt-XL级联掩码R-CNN(8.6 FPS A100, 55.2% AP)的速度和0.7%的准确率,以及YOLOv7的体现。YOLOR、YOLOX、Scaled-YOLOv4、YOLOv5、DETR、Deformable DETR、DINO-5scale-R50、ViT-Adapter-B和其他许多物体检测器在速度和准确度方面的体现。此外,咱们只在MS COCO数据集上从头开始练习YOLOv7,不运用任何其他数据集或预练习的权重。源代码发布在github.com/WongKinYiu/… 。
⚡ 论文:Bridging the Gap between Object and Image-level Representations for Open-Vocabulary Detection
论文标题:Bridging the Gap between Object and Image-level Representations for Open-Vocabulary Detection
论文时刻:7 Jul 2022
所属范畴:核算机视觉
对应使命:Open Vocabulary Object Detection,Zero-Shot Object Detection,敞开词汇方针检测,零样本方针检测
论文地址:arxiv.org/abs/2207.03…
代码完成:github.com/hanoonaR/ob…
论文作者:Hanoona Rasheed, Muhammad Maaz, Muhammad Uzair Khattak, Salman Khan, Fahad Shahbaz Khan
论文简介:Two popular forms of weak-supervision used in open-vocabulary detection (OVD) include pretrained CLIP model and image-level supervision./在敞开词汇检测(OVD)中运用的两种盛行的弱监督方式包含预练习的CLIP模型和图画级监督。
论文摘要:现有的敞开词汇物体检测器通常经过运用不同方式的弱监督来扩展其词汇量。这有助于在推理时对新的物体进行归纳。在敞开词汇检测(OVD)中运用的两种盛行的弱监督方式包含预练习的CLIP模型和图画级监督。咱们注意到,这两种监督模式对于检测使命来说都不是最理想的摆放办法。CLIP是用图画-文本对进行练习的,缺乏对物体的准确定位,而图画层面的监督则是用启发式办法,不能准确地指定部分物体区域。在这项作业中,咱们主张经过对CLIP模型的言语嵌入进行以物体为中心的摆放来解决这个问题。此外,咱们经过运用一个伪标签进程,在视觉上将物体接地,供给高质量的物体主张,并在练习进程中帮助扩展词汇量。咱们经过一个新的权重转移函数在上述两种对象对齐战略之间树立了一座桥梁,该函数聚合了它们的互补性优势。从本质上讲,所提出的模型试图在OVD环境中最小化以物体和图画为中心的表明之间的距离。在COCO基准测试中,咱们提出的办法在新的类别上完成了40.3的AP50,比曾经的最佳性能绝对增加了11.9。对于LVIS,咱们超过了最先进的ViLD模型,在少样本的类别上有5.0的掩码AP,总体上有3.4。代码:bit.ly/3byZoQp 。
⚡ 论文:DCT-Net: Domain-Calibrated Translation for Portrait Stylization
论文标题:DCT-Net: Domain-Calibrated Translation for Portrait Stylization
论文时刻:6 Jul 2022
所属范畴:核算机视觉
对应使命:Few-Shot Learning,Style Transfer,Translation,少样本学习,神经风格转化
论文地址:arxiv.org/abs/2207.02…
代码完成:github.com/menyifang/d…
论文作者:Yifang Men, Yuan YAO, Miaomiao Cui, Zhouhui Lian, Xuansong Xie
论文简介:This paper introduces DCT-Net, a novel image translation architecture for few-shot portrait stylization./本文介绍了DCT-Net,一种用于少数相片肖像风格化的新式图画转化架构。
论文摘要:本文介绍了DCT-Net,一种用于少数相片的肖像风格化的新式图画翻译架构。考虑到有限的风格样本(100个),新架构能够发生高质量的风格转化成果,具有合成高保真内容的先进才能和处理杂乱场景(如遮挡和配件)的强壮通用性。此外,它还能经过一个由部分观察(即风格化的头部)练习的优雅的评估网络完成全身图画的转化。根据几张相片学习的风格转化是具有应战性的,因为学到的模型很简单在方针范畴变得过度拟合,这是因为只要少数练习例子构成的倾向散布。本文旨在经过选用 “先校准,后翻译 “的关键思维来处理这一应战,并经过以部分为重点的翻译来探索增强的全局结构。具体来说,拟议的DCT-Net由三个模块组成:一个内容适配器借用源相片的强壮先验来校准方针样本的内容散布;一个几许扩展模块运用仿生变换来开释空间语义约束;一个纹理翻译模块运用校准散布发生的样原本学习细粒度的转化。试验成果表明,所提出的办法在头部风格化方面优于目前的技能水平,并且在具有自适应变形的全图画翻译方面也很有用。
⚡ 论文:Speech Denoising in the Waveform Domain with Self-Attention
论文标题:Speech Denoising in the Waveform Domain with Self-Attention
论文时刻:15 Feb 2022
所属范畴:语音
对应使命:Denoising,Speech Denoising,降噪,语音降噪
论文地址:arxiv.org/abs/2202.07…
代码完成:github.com/nvidia/clea…
论文作者:Zhifeng Kong, Wei Ping, Ambrish Dantrey, Bryan Catanzaro
论文简介:In this work, we present CleanUNet, a causal speech denoising model on the raw waveform./在这项作业中,咱们提出了CleanUNet,一个原始波形基础上的因果语音去噪模型。
论文摘要:在这项作业中,咱们提出了CleanUNet,一个原始波形基础上的因果语音去噪模型。所提出的模型是根据一个编码器-解码器架构,结合几个自我关注块来完善其瓶颈表明,这对获得杰出的成果至关重要。该模型经过一组在波形和多分辨率谱图上界说的丢失进行优化。从各种客观和主观评价目标来看,所提出的办法在去噪后的语音质量方面优于最先进的模型。咱们将咱们的代码和模型发布在github.com/nvidia/clea… 。
咱们是 ShowMeAI,致力于传播AI优质内容,共享行业解决方案,用知识加速每一次技能成长!点击查看 历史文章列表,在大众号内订阅论题 #ShowMeAI资讯日报,可接纳每日最新推送。点击 专题合辑&电子月刊 快速阅读各专题全集。
- 作者:韩信子@ShowMeAI
- 历史文章列表
- 专题合辑&电子月刊
- 声明:版权一切,转载请联系平台与作者并注明出处
- 欢迎回复,托付点赞,留言推荐中有价值的文章、东西或主张,咱们都会赶快回复哒~