在Transformer的decoder中的 multi-head attention,Q , K , V 来自哪里?()
Q、K、V 均来自encoder
Q、K 来自encoder,V来自decoder
Q 来自decoder,K、V来自encoder
Q 来自encoder,K、V来自decoder