언어 모델 레드 티밍으로 유해성 줄이기: 방법론, 스케일링 특성, 그리고 교훈 | AIwitness