携手创作,一起生长!这是我参加「日新计划 8 月更文应战」的第33天,点击查看活动详情
日报合辑 | 电子月刊 | 大众号下载资料 | @韩信子
东西&结构
『Surge』快速的开源化学图生成器
github.com/StructureGe…
Surge 是一个根据 Nauty 软件包的化学结构生成器。给定分子式后,Surge 能够生成所有的异构体。Surge 作为命令行东西运用时,运转 surge -u XXX 将在0.1秒内生成几十万种异构体。
日报合辑 | 电子月刊 | 大众号下载资料 | @韩信子
『MARLlib』面向研讨和工作的通用 MARL 基准
github.com/Replicable-…
sites.google.com/view/marlli…
Multi-Agent RLlib(MARLlib)是一个根据 Ray 及其东西包之一 RLlib 的多 Agent 强化学习基准。它为MARL研讨界供给了一个一致的渠道,用于开发和评价各种多署理环境中的新主意。MARLlib有四个中心特色。
- 收集了大部分被社区广泛认可的现有MARL算法,并将它们一致在一个结构下。
- 供给了一个处理计划,使不同的多署理环境运用相同的接口与署理进行交互。
- 确保了训练和抽样过程的超卓效率。
- 供给了训练的结果,包括学习曲线和针对每个使命和算法组合的预训练模型,并有微调的超参数来确保可信度。
『PaddleLabel』飞桨高效图画数据标示东西
github.com/PaddleCV-SI…
PaddleLabel 是根据飞桨 PaddlePaddle 各个套件的特性供给的配套标示东西,涵盖分类、检测、切割三种常见的计算机视觉使命的标示才能,具有手动标示和交互式标示相结合的才能。用户能够运用 PaddleLabel 方便快捷的标示自定义数据集,并将导出数据用于飞桨供给的其他套件的训练猜测流程中。
整个 PaddleLabel 包括三部分:PaddleLabel-Frontend 是根据 React 和 Ant Design 构建的 PaddleLabel 前端,PaddleLabel-ML 是根据 PaddlePaddle 的自动和交互式标示的机器学习后端。以下分别是图画分类标示、方针检测标示、语义切割标示、实例切割标示的示例。
『Nucleus model server』与Cortex兼容的Python & TensorFlow模型服务器
github.com/cortexlabs/…
Nucleus 是一个用于 TensorFlow 和通用 Python 模型的模型服务器,与 Cortex 集群、Kubernetes 集群和任何其他根据容器的布置渠道兼容,也能够经过 docker compose 在本地运转。
『db2es』同步数据库到数据ES(ElasticSearch)
github.com/wangfan002/…
db2es是个同步数据库到数据ES的东西,具有下方所述的诸多长处。图片是接口展现 & 主要流程图。
- 对大数据量同步性能更超卓,根据id或自增列进行多线程分批同步
- 完全由java言语进行开发,数据清洗更为简单
- 根据Sqlserver日志的CDC增量同步
- 支撑同步结束的邮件和钉钉告诉
- 同步根据sql,支撑mysql,sqlserver等联系型数据库
- 支撑多ES集群
博文&共享
『The Kaggle Book』Kaggle 数据剖析与机器学习经历汇总(附超全代码) 1.4k Star
github.com/PacktPublis…
Kaggle 作为闻名的数据科学竞赛渠道,吸引了世界各地数百万数据爱好者参加其中。参加 Kaggle 竞赛,能够进步数据剖析技能、与社区其他成员树立联系、并取得宝贵经历与工作开展助力。
本书由两位 Kaggle 大佬合著,并采访了 31 位 Kaggle大牛。书中汇集了竞赛&数据科学项目所需的技能和技能,传授千锤百炼的建模策略和独家技巧,以及根据图画数据、表格数据、文本数据和强化学习来处理使命的通用技能,并掌握如何规划更好的验证计划并更轻松地运用不同的评价指标。
本书适合 Kaggle 用户和数据剖析师/科学家,需要对数据科学主题和 Python 有基本的了解,并希望在 Kaggle 竞赛中取得更好的成果,或者在大厂求职成功。书本所有代码都可在 Colab 或 Kaggle 查看和运转。
『Cpp Concurrency in Action 2ed』C++并发编程实践第2版笔记
github.com/downdemo/Cp…
downdemo.github.io/Cpp-Concurr…
Anthony Williams写了《C++并发编程实践第2版》一书,这本书在 2012 年出书了第1版 ,并在 2019 年 2 月出书了第二版,本篇为其对应的笔记,覆盖线程支撑库的基本用法和并发编程的规划思想与实践办法,原书作者介绍了C++17 规范库并行算法,笔记作者弥补了 C++20 相关特性。
数据&资源
『FSL-Mate』少样本学习(FSL)资源调集
github.com/tata1661/FS…
FSL-Mate 少样本学习 (FSL) 的资源调集,现在由两部分组成:
- FewShotPapers:盯梢 FSL 研讨进展的论文列表
- PaddleFSL : 根据 PaddlePaddle 的 FSL python 库
『Awesome Graph & SSL-based Recommendation』根据图/自监督学习的引荐相关资源大列表
github.com/juyongjiang…
研讨&论文
大众号回复关键字 日报,免费获取整理好的论文合辑。
科研进展
- 2022.08.16 『计算机视觉』 Style Your Hair: Latent Optimization for Pose-Invariant Hairstyle Transfer via Local-Style-Aware Hair Alignment
- 2022.08.12 『自然言语处理』Mining Legal Arguments in Court Decisions
- 2022.07.08 『个性化联邦学习』pFL-Bench: A Comprehensive Benchmark for Personalized Federated Learning
- 2022.08.17 『计算机视觉』Incremental 3D Scene Completion for Safe and Efficient Exploration Mapping and Planning
⚡ 论文:Style Your Hair: Latent Optimization for Pose-Invariant Hairstyle Transfer via Local-Style-Aware Hair Alignment
论文时刻:16 Aug 2022
范畴使命:计算机视觉
论文地址:arxiv.org/abs/2208.07…
代码完结:github.com/taeu/style-…
论文作者:Taewoo Kim, Chaeyeon Chung, Yoonseo Kim, Sunghyun Park, Kangyeol Kim, Jaegul Choo
论文简介:Editing hairstyle is unique and challenging due to the complexity and delicacy of hairstyle./因为发型的复杂性和奇妙性,编辑发型是独特而具有应战性的。
论文摘要:因为发型的复杂性和奇妙性,编辑发型是独特的和具有应战性的。尽管最近的办法大大改进了头发的细节,但当源图画的姿态与方针头发图画的姿态有很大不同时,这些模型往往会发生不抱负的输出,然后约束了它们在实践世界的运用。HairFIT,一个姿态不变的发型搬运模型,缓解了这一约束,但在保存精美的头发纹路方面仍然显示出不尽人意的质量。为了处理这些约束,咱们提出了一个高性能的姿态不变的发型搬运模型,该模型装备了潜在的优化和一个新提出的部分风格匹配损失。在StyleGAN2潜伏空间中,咱们首要探究方针头发的姿态对齐潜伏代码,并根据部分风格匹配保存了详细的纹路。然后,咱们的模型考虑到对齐的方针头发,对源头的遮挡进行涂改,并混合这两幅图画以发生最终输出。试验结果标明,咱们的模型在较大的姿态差异下搬运发型和保存部分发型纹路方面具有优势。
⚡ 论文:Mining Legal Arguments in Court Decisions
论文时刻:12 Aug 2022
范畴使命:Argument Mining, Natural Language Processing,自然言语处理
论文地址:arxiv.org/abs/2208.06…
代码完结:github.com/trusthlt/mi…
论文作者:Ivan Habernal, Daniel Faber, Nicola Recchia, Sebastian Bretthauer, Iryna Gurevych, Indra Spiecker genannt Dhmann, Christoph Burchard
论文简介:Identifying, classifying, and analyzing arguments in legal discourse has been a prominent area of research since the inception of the argument mining field./识别、分类和剖析法令言语中的观点,自证明发掘范畴成立以来一直是一个杰出的研讨范畴。
论文摘要:自证明发掘范畴成立以来,识别、分类和剖析法令言语中的论据一直是一个杰出的研讨范畴。然而,在自然言语处理(NLP)研讨者对法庭裁决中的观点进行建模和注释的办法与法令专家了解和剖析法令证明的办法之间存在着重大差异。计算办法一般将论据简化为一般的前提和主张,而法令研讨中的论据一般体现出丰厚的类型,这对于深入了解特定的案件和一般的法令运用非常重要。咱们处理了这个问题,并为推进该范畴的开展做出了一些实质性的贡献。首要,咱们为欧洲人权法院(ECHR)诉讼程序中的法令论据规划了一个新的注释计划,该计划深深植根于法令证明研讨的理论和实践。其次,咱们汇编并注释了373个法院判定的大型语料库(230万个符号和15000个注释的证明跨度)。最终,咱们训练了一个证明发掘模型,该模型在法令NLP范畴的体现超过了最先进的模型,并供给了一个全面的根据专家的评价。所有的数据集和源代码都能够在 github.com/trusthlt/mi… 获取,在开放的法令许可下运用。
⚡ 论文:pFL-Bench: A Comprehensive Benchmark for Personalized Federated Learning
论文时刻:8 Jun 2022
范畴使命:Fairness, Personalized Federated Learning,公正,个性化联邦学习
论文地址:arxiv.org/abs/2206.03…
代码完结:github.com/alibaba/fed…
论文作者:Daoyuan Chen, Dawei Gao, Weirui Kuang, Yaliang Li, Bolin Ding
论文简介:Personalized Federated Learning (pFL), which utilizes and deploys distinct local models, has gained increasing attention in recent years due to its success in handling the statistical heterogeneity of FL clients./个性化的联合学习(pFL),运用和布置不同的本地模型,因为其在处理FL客户的计算异质性方面的成功,近年来取得了越来越多的关注。
论文摘要:个性化联合学习(pFL),运用和布置不同的本地模型,因为其在处理FL客户的计算异质性方面的成功,近年来取得了越来越多的关注。然而,对不同的pFL办法进行规范化评价和体系剖析仍然是一个应战。首要,高度不同的数据集、FL模仿设置和pFL完结阻止了对pFL办法的快速和公正比较。其次,在各种实践情况下,如新客户的普及和资源有限的客户参加,pFL办法的有效性和稳健性都没有得到充分的探究。最终,现在的pFL文献在采用的评价和融化协议方面存在分歧。为了应对这些应战,咱们提出了第一个全面的pFL基准,pFL-Bench,以促进快速、可重复、规范化和完全的pFL评价。该基准包含10多个不同运用范畴的数据集,具有一致的数据分区和实践的异构设置;一个模块化和易于扩展的pFL代码库,具有20多个有竞争力的pFL基线完结;以及在容器化环境下对通用性、公正性、体系开支和收敛性的体系评价。咱们强调了最先进的pFL办法的长处和潜力,并希望pFL-Bench能够进一步促进pFL的研讨和广泛的运用,否则因为缺乏专门的基准而难以完结。该代码发布在 github.com/alibaba/Fed…
⚡ 论文:Incremental 3D Scene Completion for Safe and Efficient Exploration Mapping and Planning
论文时刻:17 Aug 2022
范畴使命:Efficient Exploration,计算机视觉
论文地址:arxiv.org/abs/2208.08…
代码完结:github.com/ethz-asl/ss…
论文作者:Lukas Schmid, Mansoor Nasir Cheema, Victor Reijgwart, Roland Siegwart, Federico Tombari, Cesar Cadena
论文简介:We further present an informative path planning method, leveraging the capabilities of our mapping approach and a novel scene-completion-aware information gain./咱们进一步提出了一种信息性的途径规划办法,运用咱们的映射办法的才能和一种新的场景完结认识的信息增益。
论文摘要:不知道环境的探究是机器人学的一个基本问题,也是自主体系众多运用中的一个重要组成部分。探究不知道环境的一个主要应战是,机器人有必要运用每个时刻过程的有限信息进行规划。尽管现在的大多数办法是依靠启发式办法和假设来规划根据这些部分观察的途径,但咱们提出了一种新的办法,经过运用三维场景的完结,将深度学习整合到探究中,以完结知情、安全和可解释的探究制图和规划。咱们的办法,SC-Explorer,运用一个新的增量交融机制和一个新提出的分层多层映射办法将场景完结结合起来,以确保机器人的安全和效率。咱们进一步提出了一种信息性的途径规划办法,运用咱们的映射办法的才能和一种新的场景完结认识的信息增益。尽管咱们的办法是普遍适用的,但咱们在微型飞行器(MAV)的运用案例中对其进行了评价。咱们在仅运用移动硬件的高保真模仿试验中完全研讨了每个组件,并标明咱们的办法与基线相比,能够将环境的覆盖率进步73%,而地图的精确度却下降得很少。即使场景完结度不包括在最终的地图中,咱们也标明它们能够被用来辅导机器人挑选更有信息量的途径,使机器人的传感器对场景的丈量速度加快了35%。咱们将咱们的办法作为开放源码供给。
咱们是 ShowMeAI,致力于传播AI优质内容,共享工作处理计划,用知识加速每一次技能生长!
◉ 点击 日报合辑,在大众号内订阅话题 #ShowMeAI资讯日报,可接收每日最新推送。
◉ 点击 电子月刊,快速浏览月度合辑。