CNN 与 ViT 的完美结合 | TransXNet: 结合局部和全局注意力提供强大的归纳偏差和高效感受野 导读本文依旧从经典的 ViTs 说起,即基于 MHSA 构建远距离建模实现全局感... 1 年前 0 0 225