atc:别再用平均池化层了！Meta AI把注意力塞到池化层，性能提升0.3

编辑：LRS

注意力机制这么好用，怎么不把它塞到卷积网络里？最近MetaAI的研究人员提出了一个基于注意力的池化层，仅仅把平均池化层替换掉，就能获得+0.3%的性能提升！

VisualTransformer作为计算机视觉领域的新兴霸主，已经在各个研究任务中逐渐替换掉了卷积神经网络CNN。

ViT与CNN之间存在着许多不同点，例如ViT的输入是imagepatch，而非像素；分类任务中，ViT是通过对类标记进行决策等等。

classtoken实际上是ViT论文原作者提出，用于整合模型输入信息的token。classtoken与每个patch进行信息交互后，模型就能了解到具体的分类信息。

并且在自注意力机制中，最后一层中的softmax可以作为注意力图，根据classtoken和不同patch之间的交互程度，就能够了解哪些patch对最终分类结果有影响及具体程度，也增加了模型可解释性。

但这种可解释性目前仍然是很弱的，因为patch和最后一层的softmax之间还隔着很多层和很多个header，信息之间的不断融合后，很难搞清楚最后一层softmax是否真的可以解释分类。

超过5亿美元BTC和2亿美元ETH期权合约将于今日到期交割:金色财经报道，8月11日，大约17,000份比特币期权合约将到期，名义价值为5.1亿美元。除比特币外，还有121,000个以太坊合约即将到期，名义价值为2.2亿美元。其中BTC的最大痛点价格为29,500万美元；ETH的最大痛点价格为1,850美元。[2023/8/11 16:20:33]

所以如果ViT和CNN一样有视觉属性就好了！

最近MetaAI就提出了一个新模型，用attentionmap来增强卷积神经网络，说简单点，其实就是用了一个基于注意力的层来取代常用的平均池化层。

仔细一想，池化层和attention好像确实很配啊，都是对输入信息的加权平均进行整合。加入了注意力机制以后的池化层，可以明确地显示出不同patch所占的权重。

并且与经典ViT相比，每个patch都会获得一个单一的权重，无需考虑多层和多头的影响，这样就可以用一个简单的方法达到对注意力可视化的目的了。

CFTC：比特币、以太坊和莱特币等数字资产被认定为商品，并非证券:金色财经报道，根据美国商品期货交易委员会(CFTC)发布的诉讼文件，文件中提到比特币、以太坊和莱特币等数字资产被认定为商品，并非证券，但亦提到某些数字资产被定义为虚拟货币，可以作为价值的数字表现，并可以作为交易媒介、计价单位或储值工具，但这些资产也可以是商品或其他法定货币或金融工具的衍生品。因此，具体情况可能需要进一步的调查和解释。[2023/3/28 13:29:49]

在分类任务中更神奇，如果对每个类别使用不同颜色进行单独标记的话，就会发现分类任务也能识别出图片中的不同物体。

基于Attention的池化层

文章中新提出的模型叫做PatchConvNet，核心组件就是可学习的、基于attention的池化层。

Band Protocol将作为预言机提供商部署至Sei网络:金色财经报道，Sei Network发推称，去中心化预言机协议Band Protocol将作为预言机提供商部署至Sei网络。[2022/11/26 20:47:42]

模型架构的主干是一个卷积网络，相当于是一个轻量级的预处理操作，它的作用就是把图像像素进行分割，并映射为一组向量，和ViT中patchextraction操作对应。

最近也有研究表明，采用卷积的预处理能让模型的性能更加稳定。

模型的第二部分column，包含了整个模型中的大部分层、参数和计算量，它由N个堆叠的残差卷积块组成。每个块由一个归一化、1*1卷积，3*3卷积用来做空间处理，一个squeeze-and-excitation层用于混合通道特征，最后在残差连接前加入一个1*1的卷积。

BitMEX因计算平台平台问题进行临时维护:9月21日消息，BitMEX宣布，由于计算平台相关的问题导致系统出现连接问题，于今天21:05进入维护模式。所有资金都保持安全，BitMEX正在尽快修复。[2022/9/21 7:11:48]

研究人员对模型块的选择也提出了一些建议，例如在batchsize够大的情况下，BatchNorm往往效果比LayerNorm更好。但训练大模型或者高分辨率的图像输入时，由于batchsize更小，所以BatchNorm在这种情况下就不太实用了。

下一个模块就是基于注意力的池化层了。

在主干模型的输出端，预处理后的向量通过类似Transformer的交叉注意力层的方式进行融合。

荷兰印刷公司Royal Joh.Enschedé与PROxID和Concordium达成合作:金色财经报道，荷兰印刷公司Royal Joh.Enschedé与PROxID和Concordium链合作，将安全印刷产品、NFTs和元宇宙连接起来。

荷兰软件开发商PROxID正在使用瑞士协和基金会(Concordium)的集成ID框架，在第1层区块链上构建一个NFT平台。Concordium公司基于区块链的ID框架保证了最大程度的隐私，同时允许交易被监控，并确保每一笔交易都能立即、高效、低成本地发生，并在节能软件中进行。（prnewswire）[2022/9/8 13:17:07]

注意力层中的每个权重值取决于预测patch与可训练向量之间的相似度，结果和经典ViT中的classtoken类似。

然后将产生的d维向量添加到CLS向量中，并经过一个前馈网络处理。

与之前提出的class-attentiondecoder不同之处在于，研究人员仅仅只用一个block和一个head，大幅度简化了计算量，也能够避免多个block和head之间互相影响，从而导致注意力权重失真。

因此，classtoken和预处理patch之间的通信只发生在一个softmax中，直接反映了池化操作者如何对每个patch进行加权。

也可以通过将CLS向量替换为k×d矩阵来对每个类别的attentionmap进行归一化处理，这样就可以看出每个块和每个类别之间的关联程度。

但这种设计也会增加内存的峰值使用量，并且会使网络的优化更加复杂。通常只在微调优化的阶段以一个小的学习率和小batchsize来规避这类问题。

实验结果

在图像分类任务上，研究人员首先将模型与ImageNet1k和ImageNet-v2上的其他模型从参数量，FLOPS，峰值内存用量和256张图像batchsize下的模型推理吞吐量上进行对比。

实验结果肯定是好的，可以看到PatchConvNet的简单柱状结构相比其他模型更加简便和易于扩展。对于高分辨率图像来说，不同模型可能会针对FLOPs和准确率进行不同的平衡，更大的模型肯定会取得更高的准确率，相应的吞吐量就会低一些。

在语义分割任务上，研究人员通过ADE20k数据集上的语义分割实验来评估模型，数据集中包括2万张训练图像和5千张验证图像，标签超过150个类别。由于PatchConvNet模型不是金字塔式的，所以模型只是用模型的最后一层输出和UpperNet的多层次网络输出，能够简化模型参数。研究结果显示，虽然PatchConvNet的结构更简单，但与最先进的Swin架构性能仍处于同一水平，并且在FLOPs-MIoU权衡方面优于XCiT。

在检测和实例分割上，研究人员在COCO数据集上对模型进行评估，实验结果显示PatchConvNet相比其他sota架构来说，能够在FLOPs和AP之间进行很好的权衡。

在消融实验中，为了验证架构问题，研究人员使用不同的架构对比了Transformer中的classattention和卷积神经网络的平均池化操作，还对比了卷积主干和线性投影之间的性能差别等等。实验结果可以看到卷积主干是模型取得最佳性能的关键，class-attention几乎没有带来额外的性能提升。

另一个重要的消融实验时attention-basedpooling和ConvNets之间的对比，研究人员惊奇地发现可学习的聚合函数甚至可以提高一个ResNet魔改后模型的性能。

通过把attention添加到ResNet50中，直接在Imagenet1k上获得了80.1%的最高准确率，比使用平均池化层的baseline模型提高了+0.3%的性能，并且attention-based只稍微增加了模型的FLOPs数量，从4.1B提升到4.6B。

参考资料：

https://arxiv.org/abs/2112.13692

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时间联系我们修改或删除，多谢。

PEPEANC:社论丨全球通胀冲击下，中国应继续加强能源与粮食安全保障

1900/1/1 0:00:00

近日,哈萨克斯坦因液化天然气价格大幅上涨,引发多地民众集会抗议和骚乱,当地时间1月5日,该国总统托卡耶夫主持召开社会经济形势会议,取消天然气价格改革,通过多项稳定物价的措施.

波场元宇宙:智慧出行行业动态（1.4-1.9）｜翊弼智行特刊

1900/1/1 0:00:00

行业新闻&融资行业新闻北京2022年发展目标明确支持小米/理想汽车第三代半导体、元宇宙写入上海电子信息产业发展十四五规划2022年上海重大项目集中开工.

比特币交易所胡萝卜:青未了｜元夜灯如昼

1900/1/1 0:00:00

文/蒙山樵夫去年元夜时,花市灯如昼。月上柳梢头,人约黄昏后。今年元夜时,月与灯依旧。不见去年人,泪湿春衫袖.

币安交易所app下载比特币:“额是中国人”，他把一沓百元人民币塞到我手上转身就跑

1900/1/1 0:00:00

来源：中国青年报客户端 2021年12月21日,西安市开始了封控、管控。62岁的湖北人梁炎平在西安搞装修,就这样被滞留在了正在装修的新房中.

地球链

atc:别再用平均池化层了！Meta AI把注意力塞到池化层，性能提升0.3

地球链