排序
蜂群优化算法(bee colony optimization algorithm)
算法引言 自然界的启发:BSO算法的灵感来自于蜜蜂在自然界中的觅食行为。在自然界中,蜜蜂需要找到花蜜来生存。当一只蜜蜂找到一片花丛时,它会返回蜂巢,通过特殊的“摆动舞”将花丛的位置信息...
降维算法之奇异值分解 (Singular Value Decomposition, SVD)
引言 在机器学习和数据分析领域,当数据的维度特别高时,处理和分析数据就会变得尤为困难。这是因为随着维度的增加,数据的稀疏性也会增加,这种现象被称为“维度的诅咒”。为了克服这个挑战,...
MetaFormer: 万法归一,构建未来的Transformer模板
0.引言 经过前几个MLP模型的介绍,相信很多读者都会思考一个问题:在计算机视觉任务中,哪种算法更适合呢?事实上,MetaFormer模型给出了答案:算法并不是最重要的,框架结构才是关键。MetaForm...
VGGNet: 探索深度的力量
1.VGGNet模型总览 2014年,牛津大学计算机视觉组(Visual Geometry Group)和Google DeepMind公司的研究员Karen Simonyan和Andrew Zisserman研发出了新的深度卷积神经网络:VGGNet,并在ILSVRC2...
ResNet:神来之“路”
0.引言 深度残差网络(Deep Residual Network, ResNet)的提出是基于卷积算法处理图像问题领域的一件里程碑事件。ResNet在2015年发表当年取得了图像分类、检测等5项大赛第一,并再次刷新了CNN模...
Wasserstein GAN
引言 WGAN,即Wasserstein GAN,旨在解决传统GAN训练中的一些问题,尤其是训练不稳定和梯度消失。WGAN通过使用Wasserstein距离(Earth-Mover距离或EM距离)来衡量真实数据分布和生成数据分布之...
Graph Sample and Aggregate Network(GraphSAGE)
不管是GraphSAGE,还是GCN,它们的核心思想其实与朴素的GNN思想一致,都是每个节点根据图的连接结构,通过聚合邻居信息来更新自身节点的信息,再把更新后的节点向量送入神经网络层做进一步的学...
BERT, ELMo大语言模型详解
引言 2018年,对于处理文本的机器学习模型来说,可谓是一个转折点(更准确地说,是自然语言处理或简称NLP领域)。我们对于如何最佳地表示词语和句子,以捕捉其潜在的含义和关系的理解正在迅速发...
深度学习梯度弥散与爆炸
问题描述 梯度弥散:在深层神经网络中,梯度弥散是指在反向传播过程中梯度逐渐变小,以至于在网络的较浅层梯度接近于零。这导致网络的这些层的权重几乎不更新,使得模型难以学习到输入数据的复...
GPT-2:迈向先进语言模型的大步
2023年,我们见证了机器学习的一个耀眼应用——OpenAI的Chat GPT。这个模型不仅仅展现了写作连贯、充满激情的文章的能力,更超出了我们对当前语言模型能力的预期。Chat GPT虽然并非一个特别新颖...