深度学习 第4页
扩散模型(Diffusion Model)-点头深度学习网站

扩散模型(Diffusion Model)

扩散模型的基本原理 Denoising Diffusion Probabilistic Models (DDPM) 是一种利用扩散过程来生成样本的深度学习模型。其主要的灵感来源于扩散过程,通过逐渐增加噪音来模糊一个初始的图像,并...
点点的头像-点头深度学习网站点点5个月前
015810
ShuffleNet:轻量化网络-点头深度学习网站

ShuffleNet:轻量化网络

1. ShuffleNet V1 ShuffleNet V1是由旷视科技在2017年底为移动设备打造的轻量级卷积神经网络。其创新之处在于采用了组卷积(Group Convolution)和通道打散(Channel Shuffle)的方法,保证网络...
点点的头像-点头深度学习网站点点7个月前
0747
MLP-Mixer: 并肩卷积与自注意,多层感知机的神奇魔法-点头深度学习网站

MLP-Mixer: 并肩卷积与自注意,多层感知机的神奇魔法

0.引言 MLP-Mixer模型是谷歌AI团队于2021年初发表的文章,题为MLP-Mixer: An all-MLP Architecture for Vision。在计算机视觉领域的历史上,卷积神经网络一直是首选的模型。然而最近,注意力机...
点点的头像-点头深度学习网站点点6个月前
05214
过拟合与欠拟合-点头深度学习网站

过拟合与欠拟合

过拟合与欠拟合 过拟合和欠拟合现象的定义 过拟合和欠拟合模型是深度学习模型在训练过程中比较容易出现的不好的现象。 当模型的表现能力弱于事件的真实表现时,会出现欠拟合现象。某个非线性模...
点点的头像-点头深度学习网站点点7个月前
013713
 BERT, ELMo大语言模型详解-点头深度学习网站

 BERT, ELMo大语言模型详解

引言 2018年,对于处理文本的机器学习模型来说,可谓是一个转折点(更准确地说,是自然语言处理或简称NLP领域)。我们对于如何最佳地表示词语和句子,以捕捉其潜在的含义和关系的理解正在迅速发...
点点的头像-点头深度学习网站点点6个月前
08111
f-GAN-点头深度学习网站

f-GAN

引言 2016年的论文《f-GAN: Training Generative Neural Samplers using Variational Divergence Minimization》引入了一种新的生成对抗网络(GAN)框架,名为f-GAN。这篇论文通过将传统的GAN训...
点点的头像-点头深度学习网站点点5个月前
0539
循环神经网络(RNN)算法详解-点头深度学习网站

循环神经网络(RNN)算法详解

引言 在第三章中,我们探讨了全连接神经网络(FCNN)和卷积神经网络(CNN)的结构,以及它们的训练方法和使用场景。值得注意的是,这两种网络结构都是处理独立的输入数据,即它们无法记忆或理解...
点点的头像-点头深度学习网站点点6个月前
0475
GPT-2:迈向先进语言模型的大步-点头深度学习网站

GPT-2:迈向先进语言模型的大步

2023年,我们见证了机器学习的一个耀眼应用——OpenAI的Chat GPT。这个模型不仅仅展现了写作连贯、充满激情的文章的能力,更超出了我们对当前语言模型能力的预期。Chat GPT虽然并非一个特别新颖...
点点的头像-点头深度学习网站点点6个月前
04210
自注意力机制(Self-Attention)-点头深度学习网站

自注意力机制(Self-Attention)

Transformer模型中最关键部分就是自注意力(Self-Attention)机制,正如 Transformer 的论文的标题是“Attention Is All You Need”!以文本问题为例来讲解这个机制。在处理文本问题时,自注意...
点点的头像-点头深度学习网站点点6个月前
05913
ConvNeXt:卷积与设计策略的新篇章-点头深度学习网站

ConvNeXt:卷积与设计策略的新篇章

0.引言 自从ViT模型被提出以后,在过去的几年里,Transformer在深度学习领域大杀四方。回顾近几年,在计算机视觉领域发表的文章绝大多数都是基于Transformer模型的,比如2021年ICCV的Best Paper...
点点的头像-点头深度学习网站点点6个月前
06515