我报名参与金石方案1期挑战——瓜分10万奖池,这是我的第7篇文章,点击检查活动概况
日报合辑 | 电子月刊 | 公众号下载资料 | @韩信子
星巴克推出 Web3 渠道 Starbucks Odyssey
stories.starbucks.com/press/2022/…
9 月 12 日星巴克宣告推出 Web3 渠道 Starbucks Odyssey,将星巴克的忠诚度方案 Starbucks Rewards 与 NFT 渠道相结合,允许客户赚取和购买数字资产,然后解锁独家体验和奖赏。Starbucks Odyssey 的一切 NFT 都由星巴克与艺术家一起创造,能够登录参与设定的互动游戏等获取,也能够运用信用卡直接购买。NTF 的积分可用于体验星巴克的酒类制作课程、参与星巴克的烘焙活动等。
此外,值得注意的是,Starbucks Odyssey 渠道将由以太坊扩容方案 Polygon 供给技能支撑,以下降或许的贵重的链上交易成本。Polygon 官方也于同一时刻发推表示协作愉快。
东西&结构
『AI Art Generator』AI艺术作品主动生成器
github.com/rbbrdckybk/…
AI Art Generator 用于在本地主动批量根据 AI 创立艺术作品(绘画)。它将充分运用你的GPU进行 7X24 小时创造艺术画,能够主动生成 prompt 行列,结合用户选择的主题、风格/ 艺术家等进行作业。
『van-blog』简练有用优雅的高功能个人博客体系
github.com/Mereithhh/v…
vanblog.mereith.com/
VanBlog 是一款简练有用优雅的高功能个人博客体系。支撑 HTTPS 证书全主动按需请求、漆黑形式、移动端自适应和谈论,内置流量统计与图床,内嵌谈论体系,配有完备的、支撑漆黑形式、支撑移动端、支撑一键上传剪切板图片到图床、带有强壮的编辑器的后台办理面板。
『PaddleScience』根据 PaddlePaddle 开发 AI 驱动科学核算运用的 SDK和库
github.com/PaddlePaddl…
paddlescience.paddlepaddle.org.cn/
PaddleScience 根据 PaddlePaddle 结构构建,充分运用了其生态下的软件组件,用于开发新的科学核算运用。掩盖的范畴包括物理信息机器学习、根据神经网络的PDE求解器、用于 CFD 的机器学习等等。PaddleScience 仍在不断开发和更新中。
『CvComposer』OpenCV的高级图形界面,可便利构建作业流、便利检查成果
github.com/wawanbreton…
CvComposer 是一个 OpenCV 的图形界面东西。它让你轻松运用和组合多种处理功用,并实时看到作用。典型的运用包括:
- 经过调查单个函数的作用来学习 OpenCV
- 经过组合函数来规划复杂的图画视觉算法
- 微调参数(阈值、核巨细…)
『Dolt』面向数据的版本控制,数据的 Git,13K Star
github.com/dolthub/dol…
Dolt 是一个 SQL 数据库,你能够像 Git 库房一样克隆、分支控制、兼并、推送和拉取操作。将MySQL 数据库连接到 Dolt,运转查询或运用 SQL 指令更新数据都很便利。它支撑运用指令行界面导入 CSV 文件,提交你的修正,推送到长途,或兼并团队其他同学的修正。一切 Git 的指令在 Dolt 上都保持了一致性,能够放心运用。
博文&共享
『Algorithms for Decision Making』决议计划算法免费书
algorithmsbook.com/
PDF 下载:algorithmsbook.com/files/dm.pd…
本书对不确定条件下的决议计划算法作了广泛的介绍,内容涵盖了与决议计划有关的各种主题,介绍了基本的数学问题公式和解决这些问题的算法。包括以下主题:
榜首部分:概率推理
- 表征
- 推理
- 参数学习
- 结构学习
- 简略决议计划
第二部分:顺序问题
- 精确解法
- 近似值函数
- 在线规划
- 方针查找
- 方针梯度估计
- 方针梯度优化
- 角色批评办法
- 方针验证
第三部分:模型的不确定性
- 探究和运用
- 根据模型的办法
- 无模型的办法
- 模仿学习
第四部分:状况的不确定性
- 信仰
- 精确的信仰状况规划
- 离线信仰状况规划
- 在线信仰状况规划
- 控制器笼统
第五部分:多Agent体系
- 多Agent推理
- 序列问题
- 状况的不确定性
- 协作署理
『A Short Chronology Of Deep Learning For Tabular Data』表格数据深度学习简明清单
sebastianraschka.com/blog/2022/d…
咱们知道深度学习十分适合非结构化数据,深度学习有时被称为『表征学习』,由于它的优势在于学习特征提取的能力。大多数结构化(表格)数据集已经表示了(通常是手动)提取的特征,但许多研讨人员最近试图为结构化数据集开发特殊用途的深度学习办法。这篇内容收拾和更新了结构化数据上的深度学习研讨和运用资源列表。
数据&资源
『Synthetic Faces High Quality (SFHQ) Dataset』合成人脸高质量数据集
github.com/SelfishGene…
这个数据集由 3 个部分组成,每个部分包括大约 9 万张精心收集的高质量 1024×1024 的合成脸部图画。它是经过运用『将图画编码到 StyleGAN2 潜在空间,并操作将每个图画变成一个照片般的实在图画』得到。该数据集还包括面部要害点和解析语义分割图。
『Collaborative Perception』协同感知相关文献列表
github.com/Little-Podi…
该项目是 V2I / V2V / V2X 主动驾驶场景下的协作 / 协作 / 多署理感知的最新进展的论文摘要。论文按榜首个字符的字母顺序列出。一切论文和代码的链接都能够免费拜访。
研讨&论文
公众号后台回复要害字 日报,免费获取收拾好的论文合辑。
科研进展
- 2022.08.26 『视频检索』 Partially Relevant Video Retrieval
- 2022.02.12 『方针检测』 Depth-Cooperated Trimodal Network for Video Salient Object Detection
- 2022.01.01 『比照学习』 Cross-View Language Modeling: Towards Unified Cross-Lingual Cross-Modal Pre-training
⚡ 论文:Partially Relevant Video Retrieval
论文时刻:26 Aug 2022
范畴使命:Moment Retrieval, Multiple Instance Learning, 视频检索,核算机视觉
论文地址:arxiv.org/abs/2208.12…
代码完成:github.com/HuiGuanLab/…
论文作者:Jianfeng Dong, Xianke Chen, Minsong Zhang, Xun Yang, ShuJie Chen, Xirong Li, Xun Wang
论文简介:To fill the gap, we propose in this paper a novel T2VR subtask termed Partially Relevant Video Retrieval (PRVR)./为了添补这一空白,咱们在本文中提出了一个新的T2VR子使命,即部分相关视频检索(PRVR)。
论文摘要:目前的文本-视频检索(T2VR)办法是在面向视频字幕的数据集(如MSVD、MSR-VTT和VATEX)上进行练习和测试。这些数据集的一个要害特点是,视频被假定为时刻上的预剪短,而供给的标题很好地描述了视频内容的关键。因此,关于一个给定的成对的视频和标题,视频应该是与标题彻底相关的。但是,在实际中,由于查询并不是预先知道的,预先修剪的视频片段或许不包括足够的内容来彻底满足查询。这表明文献和实际国际之间存在差距。为了添补这一空白,咱们在本文中提出了一个新的T2VR子使命,即部分相关视频检索(PRVR)。假如一个未经修剪的视频包括了与查询相关的时刻,那么它就被认为与给定的文本查询部分相关。PRVR旨在从一大批未修剪的视频中检索出这些部分相关的视频。PRVR不同于单一视频时刻检索和视频语料库时刻检索,由于后两者要检索的是时刻而不是未修剪的视频。咱们将PRVR表述为一个多实例学习(MIL)问题,即一个视频一起被视为一袋视频片段和一袋视频帧。片段和帧代表不一起间标准的视频内容。咱们提出了一个多标准相似性学习(MS-SL)网络,为PRVR一起学习片段标准和帧标准的相似性。在三个数据集(TVR、ActivityNet Captions和Charades-STA)上的广泛试验证明了所提办法的可行性。咱们还表明,咱们的办法可用于改善视频语料库的时刻检索。
⚡ 论文:Depth-Cooperated Trimodal Network for Video Salient Object Detection
论文时刻:12 Feb 2022
范畴使命:object-detection, Optical Flow Estimation, 方针检测,光流预估
论文地址:arxiv.org/abs/2202.06…
代码完成:github.com/luyukang/DC…
论文作者:Yukang Lu, Dingyao Min, Keren Fu, Qijun Zhao
论文简介:However, existing video salient object detection (VSOD) methods only utilize spatiotemporal information and seldom exploit depth information for detection./但是,现有的视频突出目标检测(VSOD)办法只运用时空信息,很少运用深度信息进行检测。
论文摘要:深度能够为突出物体检测(SOD)供给有用的地理头绪,并且在最近的RGB-D SOD办法中被证明是有用的。但是,现有的视频突出目标检测(VSOD)办法只运用时空信息,很少运用深度信息进行检测。在本文中,咱们提出了一个深度协作的三模网络,称为用于VSOD的DCTNet,这是一项结合深度信息来辅佐VSOD的开创性作业。为此,咱们首先从RGB帧中生成深度,然后提出一种不平等地处理三种形式的办法。具体来说,咱们规划了一个多模态注意力模块(MAM)来模拟主模态(RGB)和两个辅佐模态(深度、光流)之间的多模态长程依靠联系。咱们还引入了一个细化交融模块(RFM)来按捺每个模态中的噪音,并动态地选择有用的信息来进一步细化特征。最后,在细化特征后采用渐进式交融战略,完成最终的跨模态交融。在五个基准数据集上的试验证明了咱们的深度协作模型相关于12种最先进的办法的优越性,深度的必要性也得到了验证。
⚡ 论文:Cross-View Language Modeling: Towards Unified Cross-Lingual Cross-Modal Pre-training
论文时刻:1 Jun 2022
范畴使命:Contrastive Learning, Language Modelling, 比照学习,言语模型
论文地址:arxiv.org/abs/2206.00…
代码完成:github.com/zengyan-97/…
论文作者:Yan Zeng, Wangchunshu Zhou, Ao Luo, Xinsong Zhang
论文简介:To this end, the cross-view language modeling framework considers both multi-modal data (i. e., image-caption pairs) and multi-lingual data (i. e., parallel sentence pairs) as two different views of the same object, and trains the model to align the two views by maximizing the mutual information between them with conditional masked language modeling and contrastive learning./为此,跨视图言语建模结构将多模态数据(即图画-标题对)和多言语数据(即平行语句对)视为同一目标的两个不同视图,并经过条件掩码言语建模和比照学习,使两个视图之间的相互信息最大化来练习模型,使其协调一致。
论文摘要:在本文中,咱们介绍了跨视图言语建模,这是一个简略而有效的言语模型预练习结构,它将跨言语跨形式预练习与共享架构和方针一致起来。咱们的办法源于一个要害的调查,即跨言语和跨模态的预练习有着相同的方针,即把同一目标的两个不同的观念一致到一个一起的语义空间。为此,跨视图言语建模结构将多模态数据(即图画-标题对)和多言语数据(即平行句对)视为同一目标的两个不同视图,并经过条件掩蔽言语建模和比照学习使两个视图之间的相互信息最大化来练习模型。咱们用跨视图言语建模结构预先练习CCLM,一个跨言语的跨模态言语模型。在IGLUE(一个多言语多模态基准)和两个多言语图画-文本检索数据集上的实证成果表明,尽管概念上比较简略,但CCLM明显优于之前的最先进水平,均匀绝对改善逾越10%。值得注意的是,CCLM是榜首个多言语多模态模型,经过零点跨言语转移,逾越了有代表性的英语视觉言语模型的翻译测试功能。
咱们是 ShowMeAI,致力于传播AI优质内容,共享职业解决方案,用常识加快每一次技能成长!
◉ 点击 日报合辑,在公众号内订阅话题 #ShowMeAI资讯日报,可接收每日最新推送。
◉ 点击 电子月刊,快速阅读月度合辑。