AI-Papers
GRP-Obliterationとは?ファインチューニングで15種類のLLMの安全訓練を無効化する攻撃手法をMicrosoftが公開 | AI-Papers