影像方向-点头深度学习网站

深度学习模型九大经典初始化方案

1. 正态分布初始化正态分布初始化将权重初始化为来自正态（或高斯）分布的随机数。该分布通常以0为均值，其标准差（或方差）可以根据网络的特定需求进行调整。这种方法在保证权重不会开始时过...

点点11个月前

07814

扩散模型的基本原理 Denoising Diffusion Probabilistic Models (DDPM) 是一种利用扩散过程来生成样本的深度学习模型。其主要的灵感来源于扩散过程，通过逐渐增加噪音来模糊一个初始的图像，并...

点点9个月前

023310

0.引言 ZFNet模型是由Matthew D. Zeiler和Rob Fergus在AlexNet的基础上提出的大型卷积网络，获得了2013年ILSVRC图像分类竞赛的冠军。其错误率为11.19%，较去年的AlexNet下降了5%。ZFNet解...

点点11个月前

020612

VAE模型简明指导 VAE最想解决的问题是如何构造编码器和解码器，使得图片能够编码成易于表示的形态，并且这一形态能够尽可能无损地解码回原真实图像。这似乎听起来与PCA（主成分分析）有些相似...

点点9个月前

01436

1.EfficientNetV1 EfficientNet源自Google Brain的论文EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks。从标题中可以看出，这篇论文最主要的创新点是模型缩放。论...

点点11个月前

022810

引言 2016年的论文《f-GAN: Training Generative Neural Samplers using Variational Divergence Minimization》引入了一种新的生成对抗网络（GAN）框架，名为f-GAN。这篇论文通过将传统的GAN训...

点点9个月前

0789

1.AlexNet理论 AlexNet模型与LeNet模型有很多相似之处，它可以被看作是LeNet的改进版本，都由卷积层和全连接层构成。然而，AlexNet之所以能够在ImageNet比赛中大获成功，还要归功于其独特...

点点11个月前

018511

编码器-解码器模型简介 Encoder-Decoder算法是一种深度学习模型结构，广泛应用于自然语言处理（NLP）、图像处理、语音识别等领域。它主要由两部分组成：编码器（Encoder）和解码器（Decoder）。...

点点10个月前

09312

项目背景本实践任务旨在利用深度学习技术对人脑中的脑瘤进行分类。我们的数据集包含四个主要类别：无肿瘤（no_tumor）、胶质瘤（glioma_tumor）、脑膜瘤（meningioma_tumor）和垂体瘤（pituita...

点点9个月前

01358

0.引言经过前几个MLP模型的介绍，相信很多读者都会思考一个问题：在计算机视觉任务中，哪种算法更适合呢？事实上，MetaFormer模型给出了答案：算法并不是最重要的，框架结构才是关键。MetaForm...

点点10个月前

012211