深度学习 第3页
Improved GANs-点头深度学习网站

Improved GANs

“Improved Techniques for Training GANs”是一篇由Ian J. Goodfellow 和他的同事在 2016 年发表的论文,这篇论文对生成对抗网络(GANs)的训练过程做出了重要的改进和提议。这些改进主要集中...
点点的头像-点头深度学习网站点点9个月前
09112
 BERT, ELMo大语言模型详解-点头深度学习网站

 BERT, ELMo大语言模型详解

引言 2018年,对于处理文本的机器学习模型来说,可谓是一个转折点(更准确地说,是自然语言处理或简称NLP领域)。我们对于如何最佳地表示词语和句子,以捕捉其潜在的含义和关系的理解正在迅速发...
点点的头像-点头深度学习网站点点10个月前
010611
MetaFormer: 万法归一,构建未来的Transformer模板-点头深度学习网站

MetaFormer: 万法归一,构建未来的Transformer模板

0.引言 经过前几个MLP模型的介绍,相信很多读者都会思考一个问题:在计算机视觉任务中,哪种算法更适合呢?事实上,MetaFormer模型给出了答案:算法并不是最重要的,框架结构才是关键。MetaForm...
点点的头像-点头深度学习网站点点10个月前
012211
 VGGNet: 探索深度的力量-点头深度学习网站

 VGGNet: 探索深度的力量

1.VGGNet模型总览 2014年,牛津大学计算机视觉组(Visual Geometry Group)和Google DeepMind公司的研究员Karen Simonyan和Andrew Zisserman研发出了新的深度卷积神经网络:VGGNet,并在ILSVRC2...
点点的头像-点头深度学习网站点点11个月前
010811
Wasserstein GAN-点头深度学习网站

Wasserstein GAN

引言 WGAN,即Wasserstein GAN,旨在解决传统GAN训练中的一些问题,尤其是训练不稳定和梯度消失。WGAN通过使用Wasserstein距离(Earth-Mover距离或EM距离)来衡量真实数据分布和生成数据分布之...
点点的头像-点头深度学习网站点点9个月前
06711
AlexNet:深度学习崛起的标志-点头深度学习网站

AlexNet:深度学习崛起的标志

 1.AlexNet理论 AlexNet模型与LeNet模型有很多相似之处,它可以被看作是LeNet的改进版本,都由卷积层和全连接层构成。然而,AlexNet之所以能够在ImageNet比赛中大获成功,还要归功于其独特...
点点的头像-点头深度学习网站点点11个月前
018511
Graph Sample and Aggregate Network(GraphSAGE)-点头深度学习网站

Graph Sample and Aggregate Network(GraphSAGE)

不管是GraphSAGE,还是GCN,它们的核心思想其实与朴素的GNN思想一致,都是每个节点根据图的连接结构,通过聚合邻居信息来更新自身节点的信息,再把更新后的节点向量送入神经网络层做进一步的学...
点点的头像-点头深度学习网站点点9个月前
014511
ResNet:神来之“路”-点头深度学习网站

ResNet:神来之“路”

0.引言 深度残差网络(Deep Residual Network, ResNet)的提出是基于卷积算法处理图像问题领域的一件里程碑事件。ResNet在2015年发表当年取得了图像分类、检测等5项大赛第一,并再次刷新了CNN模...
点点的头像-点头深度学习网站点点11个月前
014111
扩散模型(Diffusion Model)-点头深度学习网站

扩散模型(Diffusion Model)

扩散模型的基本原理 Denoising Diffusion Probabilistic Models (DDPM) 是一种利用扩散过程来生成样本的深度学习模型。其主要的灵感来源于扩散过程,通过逐渐增加噪音来模糊一个初始的图像,并...
点点的头像-点头深度学习网站点点9个月前
023310
GPT-2:迈向先进语言模型的大步-点头深度学习网站

GPT-2:迈向先进语言模型的大步

2023年,我们见证了机器学习的一个耀眼应用——OpenAI的Chat GPT。这个模型不仅仅展现了写作连贯、充满激情的文章的能力,更超出了我们对当前语言模型能力的预期。Chat GPT虽然并非一个特别新颖...
点点的头像-点头深度学习网站点点10个月前
07110