대형 언어 모델의 정렬 위장(Alignment Faking) | AIwitness