深度学习 第2页
f-GAN-点头深度学习网站

f-GAN

引言 2016年的论文《f-GAN: Training Generative Neural Samplers using Variational Divergence Minimization》引入了一种新的生成对抗网络(GAN)框架,名为f-GAN。这篇论文通过将传统的GAN训...
点点的头像-点头深度学习网站点点5个月前
0539
循环神经网络(RNN)算法详解-点头深度学习网站

循环神经网络(RNN)算法详解

引言 在第三章中,我们探讨了全连接神经网络(FCNN)和卷积神经网络(CNN)的结构,以及它们的训练方法和使用场景。值得注意的是,这两种网络结构都是处理独立的输入数据,即它们无法记忆或理解...
点点的头像-点头深度学习网站点点6个月前
0475
GPT-2:迈向先进语言模型的大步-点头深度学习网站

GPT-2:迈向先进语言模型的大步

2023年,我们见证了机器学习的一个耀眼应用——OpenAI的Chat GPT。这个模型不仅仅展现了写作连贯、充满激情的文章的能力,更超出了我们对当前语言模型能力的预期。Chat GPT虽然并非一个特别新颖...
点点的头像-点头深度学习网站点点6个月前
04210
自注意力机制(Self-Attention)-点头深度学习网站

自注意力机制(Self-Attention)

Transformer模型中最关键部分就是自注意力(Self-Attention)机制,正如 Transformer 的论文的标题是“Attention Is All You Need”!以文本问题为例来讲解这个机制。在处理文本问题时,自注意...
点点的头像-点头深度学习网站点点6个月前
05913
ConvNeXt:卷积与设计策略的新篇章-点头深度学习网站

ConvNeXt:卷积与设计策略的新篇章

0.引言 自从ViT模型被提出以后,在过去的几年里,Transformer在深度学习领域大杀四方。回顾近几年,在计算机视觉领域发表的文章绝大多数都是基于Transformer模型的,比如2021年ICCV的Best Paper...
点点的头像-点头深度学习网站点点6个月前
06515
MetaFormer: 万法归一,构建未来的Transformer模板-点头深度学习网站

MetaFormer: 万法归一,构建未来的Transformer模板

0.引言 经过前几个MLP模型的介绍,相信很多读者都会思考一个问题:在计算机视觉任务中,哪种算法更适合呢?事实上,MetaFormer模型给出了答案:算法并不是最重要的,框架结构才是关键。MetaForm...
点点的头像-点头深度学习网站点点6个月前
07311
MobileNet:轻量化模型-点头深度学习网站

MobileNet:轻量化模型

1.MobileNet V1 MobileNet系列是由谷歌公司的Andrew G. Howard等人于2016年提出的轻量级网络结构,并于2017年发布在arXiv上。MobileNet系列的特点是模型小、计算速度快,适合部署到移动端或者嵌...
点点的头像-点头深度学习网站点点7个月前
07912
演员-评论家模型-点头深度学习网站

演员-评论家模型

1 算法介绍:演员-评论家(Actor-Critic)模型 演员-评论家(Actor-Critic)模型是一种结合了基于值的方法和基于策略的方法的强化学习框架。这个模型的核心思想是将策略决策(演员)和值函数估...
点点的头像-点头深度学习网站点点5个月前
0788
 VGGNet: 探索深度的力量-点头深度学习网站

 VGGNet: 探索深度的力量

1.VGGNet模型总览 2014年,牛津大学计算机视觉组(Visual Geometry Group)和Google DeepMind公司的研究员Karen Simonyan和Andrew Zisserman研发出了新的深度卷积神经网络:VGGNet,并在ILSVRC2...
点点的头像-点头深度学习网站点点7个月前
06611
卷积神经网络(CNN)算法详解-点头深度学习网站

卷积神经网络(CNN)算法详解

引言 卷积神经网络(Convolutional Neural Networks, CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks, FNN),是深度学习的代表算法之一 。 对卷积神...
点点的头像-点头深度学习网站点点7个月前
0519