排序
f-GAN
引言 2016年的论文《f-GAN: Training Generative Neural Samplers using Variational Divergence Minimization》引入了一种新的生成对抗网络(GAN)框架,名为f-GAN。这篇论文通过将传统的GAN训...
ConvMixer: 创新之路,卷积与多层感知机的相互借鉴
0.引言 近年来,卷积神经网络一直是计算机视觉任务中的主要架构。然而,最近出现了基于Transformer模型的架构,例如ViT、Swin Transformer等,在许多任务中表现出引人注目的性能。相比于传统的...
长短期记忆网络(LSTM)和门控循环单元(GRU)算法详解
引言 传统循环神经网络在处理长序列时面临梯度消失或爆炸问题。梯度消失是指在训练过程中,误差反向传播时,梯度随着时间步数的增加而指数级衰减。梯度爆炸则正好相反,这会导致模型难以学习到...
支持向量机(SVM)
什么是SVM? SVM 是一类强大的用于分类和回归问题的监督学习算法。 在分类方面,SVM 可以被视为最大间隔线性分类器。 SVM 使用的目标明确鼓励低样本外误差(良好的泛化性能)。 通过最大化类的超...
生成对抗网络(GAN)
引言 生成对抗网络(GAN)是深度学习领域的一个革命性概念,为数据生成提供了一种全新的方式。其名称中的“对抗”体现了核心思想:通过两个神经网络之间的相互竞争来生成数据。这两个网络分别是...
麻雀优化算法(Sparrow Search Algorithm)
算法背景 麻雀算法(Sparrow Search Algorithm, SSA)是一种受自然界麻雀群体行为启发的优化算法。想象一下,一群麻雀在寻找食物的过程中,它们需要在广阔的区域内快速而有效地搜索到食物资源。...
演员-评论家模型
1 算法介绍:演员-评论家(Actor-Critic)模型 演员-评论家(Actor-Critic)模型是一种结合了基于值的方法和基于策略的方法的强化学习框架。这个模型的核心思想是将策略决策(演员)和值函数估...
岭回归与LASSO回归
引言 岭回归: 通过向线性回归中引入L2正则化项防止过拟合。 LASSO回归: 通过向线性回归中引入L1正则化项实现特征选择。 L1正则化与LASSO回归 L1正则化通过在损失函数中添加参数权重的绝对值和的...
Swin Transformer:窗口化的Transformer
0.引言 Swin Transformer是2021年微软研究院发表在ICCV(International Conference on Computer Vision)上的一篇文章,并且已经获得ICCV 2021最佳论文(Best Paper)的荣誉称号。Swin Transfor...
ShuffleNet:轻量化网络
1. ShuffleNet V1 ShuffleNet V1是由旷视科技在2017年底为移动设备打造的轻量级卷积神经网络。其创新之处在于采用了组卷积(Group Convolution)和通道打散(Channel Shuffle)的方法,保证网络...