AI-Papers
本当に重要な情報に注意を向けてパラメータ数を35%削減した「Differential Transformer」 | AI-Papers