[태그:] Angular Steering
-

*** Angular Steering: Behavior Control via Rotation in Activation Space (NeurIPS 2025)
논문 개요 Angular Steering: Behavior Control via Rotation in Activation Space (NeurIPS 2025) 핵심 문제 기존 방법: 문제: 핵심 아이디어 (한 줄) Activation steering = “벡터 이동”이 아니라 “각도 회전”이다 1. Angular Steering 핵심 개념 ✔️ 기본 설정 –> 이 두 개로 2D subspace P 구성 ✔️ 핵심 연산: Rotation 논문은 steering을 다음처럼 정의: hsteered=RθP(h)h_{\text{steered}}…