影像方向 第3页
VAN:基于卷积实现的注意力-点头深度学习网站

VAN:基于卷积实现的注意力

0.引言 虽然Transformer最初是为自然语言处理任务而设计的,但最近已经在各种计算机视觉领域掀起了风暴。然而,图像是有空间信息的二维数据,这给计算机视觉中应用Transformer带来了三个挑战: ...
点点的头像-点头深度学习网站点点6个月前
0696
DenseNet:特征复用真香-点头深度学习网站

DenseNet:特征复用真香

0.引言 作为CVPR2017年的最佳论文,DenseNet模型脱离了通过加深网络层数(如VGGNet、ResNet)和加宽网络结构(如GoogLeNet)来提升网络性能的定式思维。转而从特征的角度考虑,通过特征重用和旁...
点点的头像-点头深度学习网站点点7个月前
06714
 VGGNet: 探索深度的力量-点头深度学习网站

 VGGNet: 探索深度的力量

1.VGGNet模型总览 2014年,牛津大学计算机视觉组(Visual Geometry Group)和Google DeepMind公司的研究员Karen Simonyan和Andrew Zisserman研发出了新的深度卷积神经网络:VGGNet,并在ILSVRC2...
点点的头像-点头深度学习网站点点7个月前
06611
Swin Transformer:窗口化的Transformer-点头深度学习网站

Swin Transformer:窗口化的Transformer

0.引言 Swin Transformer是2021年微软研究院发表在ICCV(International Conference on Computer Vision)上的一篇文章,并且已经获得ICCV 2021最佳论文(Best Paper)的荣誉称号。Swin Transfor...
点点的头像-点头深度学习网站点点7个月前
0667
ConvNeXt:卷积与设计策略的新篇章-点头深度学习网站

ConvNeXt:卷积与设计策略的新篇章

0.引言 自从ViT模型被提出以后,在过去的几年里,Transformer在深度学习领域大杀四方。回顾近几年,在计算机视觉领域发表的文章绝大多数都是基于Transformer模型的,比如2021年ICCV的Best Paper...
点点的头像-点头深度学习网站点点6个月前
06515
AS-MLP:注意力驱动下的多层感知机升级-点头深度学习网站

AS-MLP:注意力驱动下的多层感知机升级

0.引言 AS-MLP模型出自上海科技大学和腾讯优图实验室共同合作发表的文章,题为AS-MLP: AN AXIAL SHIFTED MLP ARCHITECTURE FOR VISION。纯MLP网络架构专注于全局的信息交流,却忽略了局部信息的...
点点的头像-点头深度学习网站点点6个月前
06510
生成对抗网络(GAN)-点头深度学习网站

生成对抗网络(GAN)

引言 生成对抗网络(GAN)是深度学习领域的一个革命性概念,为数据生成提供了一种全新的方式。其名称中的“对抗”体现了核心思想:通过两个神经网络之间的相互竞争来生成数据。这两个网络分别是...
点点的头像-点头深度学习网站点点5个月前
0608
Improved GANs-点头深度学习网站

Improved GANs

“Improved Techniques for Training GANs”是一篇由Ian J. Goodfellow 和他的同事在 2016 年发表的论文,这篇论文对生成对抗网络(GANs)的训练过程做出了重要的改进和提议。这些改进主要集中...
点点的头像-点头深度学习网站点点5个月前
05612
编码器-解码器模型(Encoder-Decoder)-点头深度学习网站

编码器-解码器模型(Encoder-Decoder)

编码器-解码器模型简介 Encoder-Decoder算法是一种深度学习模型结构,广泛应用于自然语言处理(NLP)、图像处理、语音识别等领域。它主要由两部分组成:编码器(Encoder)和解码器(Decoder)。...
点点的头像-点头深度学习网站点点6个月前
05612
f-GAN-点头深度学习网站

f-GAN

引言 2016年的论文《f-GAN: Training Generative Neural Samplers using Variational Divergence Minimization》引入了一种新的生成对抗网络(GAN)框架,名为f-GAN。这篇论文通过将传统的GAN训...
点点的头像-点头深度学习网站点点5个月前
0539