携手创作,一起生长!这是我参与「日新计划 8 月更文挑战」的第27天,点击检查活动概况
ShowMeAI日报系列全新晋级!掩盖AI人工智能 东西&结构 | 项目&代码 | 博文&共享 | 数据&资源 | 研讨&论文 等方向。点击检查 历史文章列表,在大众号内订阅论题 #ShowMeAI资讯日报,可接纳每日最新推送。点击 专题合辑&电子月刊 快速浏览各专题全集。
近来Gartner发布了『2022年技能成熟度曲线』,本年又有哪些“新花样”?
www.gartner.com/en/articles…
2022 年的新兴技能趋势确认了 25 种需求了解的新兴技能,首要包含三个主题:沉溺式体验的演进、加快人工智能自动化和优化技能人才交给。
沉溺式体验技能,为个人供给了对其身份和数据的更多控制权,并将他们的体验范围扩展到与数字货币集成的虚拟场所和生态体系中,要害技能包含 Digital twin of the customer (DToC,客户数字孪生)、Decentralized identity(DCI,身份去中心化) 、Digital humans(数字人类)、Internal talent marketplaces(内部人才市场)、Metaverse(元宇宙)、Non-fungible token (NFT)、Superapp、Web3。
人工智能自动化,是指加快创建专门的人工智能模型,将人工智能应用于人工智能模型的开发和练习,并将其安置到产品、服务和解决计划交给中,要害技能包含 Causal artificial intelligence(因果人工智能)、Foundation models(基础模型)、Generative design AI(生成式规划AI)、Machine learning code generation(机器学习代码生成)。
技能人员交给相关技能专注于构建数字事务的要害要素:产品、服务或解决计划构建者社区及其运用的渠道,要害技能包含 Augmented FinOps(增强型FinOps)、Cloud sustainability(云可持续性)、Computational storage (CS, 核算存储) 、Cybersecurity mesh architecture(CSMA, 网络安全网格架构)、Data observability(数据可观察性)、Dynamic risk governance(DRG, 动态危险管理) 、Industry cloud platforms(职业云渠道)、Minimum viable architecture (MVA, 最小可行架构) 、Observability-driven development (ODD, 可观察性驱动开发) 、OpenTelemetry、Platform engineering(渠道工程)。
东西&结构
『Goodname』很帅的函数/软件命名辅助东西
github.com/kampersanda…
kampersanda.github.io/goodname/
Goodname 是一个帮忙对函数和软件命名的东西。咱们给出函数或软件的简略描绘,这个东西会列举出构建的候选称号。例如,给定软件描绘『Character-wise Double-array Dictionary』,这个东西主张的候选称号包含『crawdad』和『cheddar』『等。
『jupyter bbox widget』用于用边框标示图画的Jupyter widget
github.com/gereleth/ju…
jupyter_bbox_widget 是一个Jupyter小组件,用于标示图画鸿沟框,为目标检测等使命储备数据。它的运用十分简略,经过鼠标能够轻松划定鸿沟拖动边框等,并取得标示的目标框结果。
『RecTools』快速构建引荐体系的东西包
github.com/MobileTeleS…
rectools.readthedocs.io/en/latest/i…
RecTools 是一个易用的 Python 库,用于简略高效地构建引荐体系。它包含用于数据处理和目标核算的内置东西包、各种引荐模型、一些对盛行算法和模型选择结构的现有完成的封装。它希望搜集现成的解决计划和最佳实践并全部集成在1个东西包里,从而让大家关于引荐体系的开发与安置简略可行。
RecTools 支撑密布和稀少的特征,继承了相似 LightFM 等东西库,还包含各种各样的目标供选择,以更好地习惯引荐体系的需求。
『FrOoDo』散布外(OOD)检测结构
github.com/MECLabTUDA/…
FrOoDo是为了解决数字病理学中的离群数据问题而构建的东西结构。在数据采集过程中,可能会出现不同类型的离群数据,如脂肪滴或整个幻灯片图画中未定位的部分等人工制品。这些反常数据会严重下降医疗形象切割目标,如dice,因而有必要辨认和去除反常数据,以便用神经网络进行精准学习与切割。
博文&共享
『Tutorial on PhD Application』读博请求攻略
github.com/zhanglj37/T…
这是一份附近的博士请求攻略,作者结合自己请求海外博士的亲身经历组织了整个过程中的各个环节的核心要点与留意事项,也给到很多主张,内容包含:
- 请求需求的每个资料的重要性及怎么预备
- 时刻线怎么安排
- 择校、套磁和面试技巧
- 录取后怎么回复/谈判奖学金
- 获取信息的渠道
『Reinforcement Learning: An Introduction』《强化学习导论(第二版)》免费书本
www.incompleteideas.net/book/the-bo…
www.incompleteideas.net/book/RLbook…
数据&资源
『UrbanNav』开源城市定位算法基准测验多感官数据集
github.com/IPNL-POLYU/…
UrbanNav 是 PolyU Intelligent Positioning 和 Navigation Lab 为城市地区规划的定位算法供给基准的开源多感官数据集。
『Learn Awesome Gamedev』游戏开发资源大列表
github.com/notpresiden…
研讨&论文
大众号回复要害字日报,免费获取整理好的论文合辑。
科研发展
- 2022.08.04 『动作辨认』 Expanding Language-Image Pretrained Models for General Video Recognition
- 2022.08.08 『核算机视觉』 Label-Free Synthetic Pretraining of Object Detectors
- 2022.08.05 『图画生成』 Keys to Better Image Inpainting: Structure and Texture Go Hand in Hand
- journal 2022 『图画分类』Semi-Supervised Hyperspectral Image Classification Using a Probabilistic Pseudo-Label Generation Framework
⚡ 论文:Expanding Language-Image Pretrained Models for General Video Recognition
论文时刻:4 Aug 2022
范畴使命:Action Classification, Action Recognition, 动作辨认
论文地址:arxiv.org/abs/2208.02…
代码完成:github.com/microsoft/v…
论文作者:Bolin Ni, Houwen Peng, Minghao Chen, Songyang Zhang, Gaofeng Meng, Jianlong Fu, Shiming Xiang, Haibin Ling
论文简介:Extensive experiments demonstrate that our approach is effective and can be generalized to different video recognition scenarios./很多的试验标明,咱们的办法是有用的,并且能够推行到不同的视频辨认场景。
论文摘要:对比性言语-图画预练习在从网络规模的数据中学习视觉-文本联合表征方面显现了巨大的成功,对各种图画使命显现了明显的 “零样本 “泛化才能。但是,怎么将这种新的言语-图画预练习办法有用地扩展到视频范畴仍然是一个敞开的问题。在这项工作中,咱们提出了一个简略而有用的办法,将预练习的言语-图画模型直接用于视频辨认,而不是从头开始预练习一个新模型。更具体地说,为了捕捉帧在时刻维度上的长距离依靠性,咱们提出了一个跨帧留意机制,明确地交换跨帧信息。这样的模块是轻量级的,能够无缝地刺进到预练习的言语-图画模型中。此外,咱们还提出了一个针对视频的提示计划,该计划利用视频内容信息来生成具有鉴别力的文本提示。广泛的试验标明,咱们的办法是有用的,能够推行到不同的视频辨认场景中。特别是,在完全监督的情况下,咱们的办法在Kinectics-400上达到了87.1%的最高准确率,而与Swin-L和ViViT-H比较,运用的FLOPs少了12倍。在零样本试验中,咱们的办法在两种盛行协议下的最高1级准确率别离超过了现在最先进的办法+7.6%和+14.9%。在少许拍照的情况下,咱们的办法在标示的数据极其有限的情况下,超过了曾经的最佳办法+32.1%和+23.1%。代码和模型可在 aka.ms/X-CLIP 获取。
⚡ 论文:Label-Free Synthetic Pretraining of Object Detectors
论文标题:Label-Free Synthetic Pretraining of Object Detectors
论文时刻:8 Aug 2022
范畴使命:核算机视觉
论文地址:arxiv.org/abs/2208.04…
代码完成:github.com/princeton-v…
论文作者:Hei Law, Jia Deng
论文简介:Our “SOLID” approach consists of two main components: (1) generating synthetic images using a collection of unlabelled 3D models with optimized scene arrangement; (2) pretraining an object detector on “instance detection” task – given a query image depicting an object, detecting all instances of the exact same object in a target image./咱们的 “SOLID “办法包含两个首要部分。(1)运用具有优化场景安置的无标签三维模型集合生成组成图画;(2)在 “实例检测 “使命上预练习物体检测器–给定描绘物体的查询图画,检测目标图画中完全相同的物体的一切实例。
论文摘要:咱们提出了一种新的办法,即组成优化布局与实例检测(SOLID),用组成图画预练习物体检测器。咱们的 “SOLID “办法包含两个首要部分。(1) 运用具有优化场景布局的无标签三维模型集合生成组成图画;(2) 在 “实例检测 “使命上预练习物体检测器–给定描绘物体的查询图画,检测目标图画中完全相同的物体的一切实例。咱们的办法不需求任何语义标签进行预练习,并答应运用恣意的、不同的三维模型。在COCO上的试验标明,经过优化数据生成和适当的预练习使命,组成数据能够成为预练习物体检测器的十分有用的数据。特别是,在烘托的图画上进行预练习,能够达到与实在图画上的预练习相媲美的功能,同时运用的核算资源也大大削减。代码可在 github.com/princeton-v… 获取。
⚡ 论文:Keys to Better Image Inpainting: Structure and Texture Go Hand in Hand
论文时刻:5 Aug 2022
范畴使命:Image Inpainting, Texture Synthesis,核算机视觉,图画生成
论文地址:arxiv.org/abs/2208.03…
代码完成:github.com/SHI-Labs/Fc…
论文作者:Jitesh Jain, Yuqian Zhou, Ning Yu, Humphrey Shi
论文简介:We claim that the performance of inpainting algorithms can be better judged by the generated structures and textures./咱们提出,经过生成的结构和纹路能够更好地判断画中画算法的功能。
论文摘要:随着近年来图画生成和处理算法的进步,深度图画修补已经取得了令人瞩目的发展。咱们提出,经过生成的结构和纹路能够更好地判断图画修补算法的功能。结构指的是生成的物体鸿沟或孔内的新颖几何结构,而纹路指的是高频细节,特别是填充在结构区域内的人工重复图案。咱们以为,更好的结构通常是由基于粗到细的GAN生成器网络取得的,而现在的重复图案能够运用最先进的高频快速傅里叶卷积层进行更好的建模。在本文中,咱们提出了一个结合两种规划优势的新式图画修补网络。因而,咱们的模型完成了明显的视觉质量,在运用单一网络的结构生成和重复纹路组成方面都达到了最先进的功能。广泛的试验证明了该办法的有用性,咱们的定论进一步强调了图画喷绘质量的两个要害因素,即结构和纹路,作为喷绘网络的未来规划方向。
⚡ 论文:Semi-Supervised Hyperspectral Image Classification Using a Probabilistic Pseudo-Label Generation Framework
论文时刻:journal 2022
范畴使命:Hyperspectral Image Classification, pseudo label, 图画分类
论文地址:ieeexplore.ieee.org/abstract/do…
代码完成:github.com/majidseydga…
论文作者:Majid Seydgar, Shahryar Rahnamayan, Pedram Ghamisi, Azam Asilian Bidgoli
论文简介:The generated pseudo labels of our proposed framework can be fed to various DNNs to improve their generalization capacity./咱们提出的结构所产生的伪标签能够反馈给各种DNNs,以进步其泛化才能。
论文摘要:当有丰富的符号样本时,深度神经网络(DNNs)在高光谱图画(HSI)分类中体现出令人形象深入的功能。问题是,HSI样本注释的本钱十分高,并且这项使命的预算通常是有限的。为了削减对标示样本的依靠,文献中引入了深度半监督学习(SSL),它从标示和未标示的样本中一起学习。但是,由于各种噪声影响和无标签样本的模糊性,从无标签数据中学习鲁棒性和判别性的特征是一项具有挑战性的使命。因而,最近的发展受到了约束,首要是在预练习或热身阶段。在本文中,咱们提出了一个深度概率结构来生成牢靠的伪标签,以明确地从未符号的样本中学习鉴别性的特征。咱们提出的结构所生成的伪标签能够反馈给各种DNN,以进步其泛化才能。咱们提出的结构每类只需求10个标签样本,将标签集表示为潜在空间中的不确认性感知散布。然后为那些特征值与散布高概率匹配的未符号样本生成伪标签。经过在四个公开可用的数据集上进行广泛的试验,咱们标明咱们的结构能够生成牢靠的伪标签,以明显进步几个最先进的DNN的概括才能。此外,咱们还介绍了一个新的用于HSI分类的DNN,与竞争对手比较,它体现出了出色的准确性。
咱们是 ShowMeAI,致力于传达AI优质内容,共享职业解决计划,用知识加快每一次技能生长!点击检查 历史文章列表,在大众号内订阅论题 #ShowMeAI资讯日报,可接纳每日最新推送。点击 专题合辑&电子月刊 快速浏览各专题全集。
- 作者:韩信子@ShowMeAI
- 历史文章列表
- 专题合辑&电子月刊
- 声明:版权一切,转载请联系渠道与作者并注明出处
- 欢迎回复,托付点赞,留言引荐中有价值的文章、东西或主张,咱们都会尽快回复哒~