SwinTransformer模型与Transformer模型的位置编码有相似之处，都是用位置编码来为序列中的每个位置提

作者：人工智能研究所 2023-05-30 12:25:00

Swin Transformer 模型与 Transformer 模型的位置编码有相似之处，都是用位置编码来为序列中的每个位置提供一个独特的标识。但是，Swin Transformer 模型使用了一种新的位置编码方式，称为“局部位置编码”，与传统的“绝对位置编码”不同。

传统的 Transformer 模型使用绝对位置编码，它为每个位置分配一个固定的向量表示，该向量表示与位置的绝对位置有关。因此，当序列长度增加时，绝对位置编码的向量表示也会增加，导致模型的计算成本和内存占用增加。

相比之下，Swin Transformer 模型使用局部位置编码，它将序列分成多个块，并为每个块分配一个不同的向量表示。这些向量表示与序列中的相对位置有关，而不是与绝对位置有关。这种方法可以减少模型的计算成本和内存占用，并且能够处理更长的序列。

Swin Transformer 模型的位置编码被放置在注意力机制之中，而不是与嵌入向量直接相加的原因是因为，在注意力机制中，模型需要对输入序列中各个位置的相对位置进行建模。如果将位置编码直接与嵌入向量相加，则模型无法区分不同位置之间的相对距离，这可能会影响模型的性能和泛化能力。

通过将位置编码放置在注意力机制中，Swin Transformer 能够更好地捕捉输入序列中不同位置之间的相对位置关系，从而提高模型的性能和泛化能力。因此，这种设计选择是为了更好地适应 Transformer 模型在处理序列数据时的需求。

继续阅读