* Correlation-Aware Example Selection for In-Context Learning with Nonsymmetric Determinantal Point Processes (EMNLP 2025)

이 논문은 ICL(In-Context Learning) 예제 선택(example selection) 문제를 다루며, 기존 DPP 기반 방법의 한계를 극복하기 위해 NDPP (Nonsymmetric Determinantal Point Process) 를 도입한 연구이다.  

Compositional Exemplars (CEIL, ICML 2023) 의 후속 발전으로 볼 수 있다.


1. 문제의식

ICL에서는 어떤 demonstration(example)을 넣느냐에 따라 성능 차이가 매우 크다.

기존 방법들은 크게:

(1) Query Similarity 기반

  • BM25
  • SBERT retrieval
  • EPR

즉,

sim(q,e)\text{sim}(q,e)

만 보고 예제를 선택한다.


(2) DPP 기반

CEIL 등이 대표적.

DPP는

P(E)det(LE)P(E)\propto \det(L_E)

로 정의되며,

서로 비슷한 예제를 억제한다.

즉,

“다양한(diverse) 예제 집합” 선택에 특화되어 있다.


논문의 핵심 주장:

좋은 ICL example set은 단순히 diverse 하기만 해서는 안 된다.

예를 들어 감정 분석에서

  • 예제1: 긍정
  • 예제2: 긍정
  • 예제3: 긍정

처럼 일관성(consistency) 이 있는 경우도 중요하다.

즉,

ICL에는

  • Negative correlation (다양성)
  • Positive correlation (일관성)

둘 다 필요하다.  


2. DPP의 한계

DPP kernel:

L은 PSD symmetric matrix이다.

Lij=LjiL_{ij}=L_{ji}


DPP에서 두 item의 correlation은

LijLji-L_{ij}L_{ji}

이다.

대칭행렬이면

LijLji=Lij2L_{ij}L_{ji}=L_{ij}^2

이므로

항상

Lij20-L_{ij}^2 \le 0

이다.

즉, DPP는 음의 상관관계만 표현 가능하다.  


3. NDPP

Gartrell et al. (NeurIPS 2019)의 NDPP를 사용한다.

NDPP는 kernel이 비대칭이다.

LLTL \neq L^T

따라서

LijLji-L_{ij}L_{ji} 가 양수도 가능하고 음수도 가능하다.


결과적으로

NDPP는

  • Positive correlation
  • Negative correlation

을 모두 모델링할 수 있다.

관계의미
Positive일관성
Negative다양성

동시 고려 가능하다.  


4. 전체 프레임워크

논문 전체 구조는 4단계이다. (Figure 1)  

논문 그림1.

Training

Step 1

Pseudo-labeled subset 생성

Step 2

NDPP 학습

Inference

Step 3

Query-aware kernel adaptation

Step 4

MAP inference


5. Step 1: Pseudo-labeled Dataset 생성

이 부분이 상당히 중요하다.

NDPP를 학습하려면 좋은 example subset이 필요하다.

하지만 GT가 없다.


5.1 Candidate Retrieval

학습 샘플 (xi,yi)(x_i,y_i)에 대해

KNN retrieval 수행

DiD_i 획득.  


5.2 Subset Sampling

retrieved examples에서

N개의 subset

EijE_{ij}

생성.


5.3 LLM Scoring

각 subset 품질 측정

Prompt:

Eij+xiE_{ij}+x_i

LLM 입력


정답

yiy_i 의 생성 확률을 계산

sij=PLLM(yi|Eij,xi)s_{ij}=P_{LLM}(y_i|E_{ij},x_i)


즉, “이 subset을 사용했을 때 정답이 얼마나 잘 나오는가?”를 측정한다.


5.4 Top-10% 선택

score가 높은 subset만 선택

Dtrain={Ei}D_{train}=\{E_i\}

구성.  


6. Step 2: NDPP 학습

논문의 핵심.


목표

고품질 subset이 높은 확률을 갖도록 NDPP 학습


NDPP:

PL(E)=det(LE)det(L+I)P_L(E)=\frac{\det(L_E)}{\det(L+I)}


MLE 수행:

f^n(L)=1ni=1nlogPL(Ei)\hat f_n(L)=\frac{1}{n}\sum_{i=1}^{n}\log P_L(E_i)

즉, pseudo-labeled subset들이 NDPP에서 높은 확률을 갖도록 학습한다.


7. Kernel Decomposition

이 논문의 가장 중요한 수식.

저자들은

L=S+A

로 분해한다.

L=S+A,S=VVT,A=BCBTL=S+A,\quad S=VV^T,\quad A=BCB^T


7.1 Symmetric Part

S=VVTS=VV^T

대칭행렬


논문 해석:

S는

negative correlation

을 담당한다.

즉 diversity.


7.2 Skew-Symmetric Part

A=BCBTA=BCB^T

AT=AA^T=-A


A는 positive correlation을 담당.

즉 consistency.


결과적으로

L=S+A

  • 다양성
  • 일관성

동시 모델링 가능.


8. Low-rank NDPP

원래 kernel 크기:

M×MM\times M

(M = example pool size)


저자들은

V,BRM×KV,B \in R^{M\times K}

로 low-rank 표현.


복잡도 감소:

원래

O(M3)O(M^3)

O(MK2+nK3)O(MK^2+nK^3)

대규모 example pool에서도 학습 가능.


9. Regularized Likelihood

과적합 방지:

R(V,B)=αi||vi||2βi||bi||2R(V,B)=-\alpha \sum_i ||v_i||^2-\beta \sum_i ||b_i||^2


최종 objective:

Likelihood+Regularization\text{Likelihood}+\text{Regularization}

최적화.


10. Query-Aware Kernel Adaptation

지금까지 학습된 NDPP는

query-independent.


그러나 실제 ICL은

query별 다른 example 필요.


Similarity 계산

ri=EQ(x)TEP(ei)r_i=E_Q(x)^T E_P(e_i)


Diagonal Matrix

R=Diag(r)R=\text{Diag}(r)


Kernel Adaptation

핵심:

L=RL^RL’ = R\hat{L}R


즉, query와 비슷한 example은 kernel에서 중요도가 커진다.


11. MAP Inference

최종 example set 선택.


목표:

SMAP=argmax|S|=kdet(LS)S_{MAP}=\arg\max_{|S|=k}\det(L’_S)


의미:

  • query relevance
  • diversity
  • consistency

모두 고려한 subset 선택.


하지만 NP-hard.

그래서

Fast Greedy MAP
(Chen et al., NeurIPS 2018 계열)

사용.


반복적으로

Δi=logdet(LS{i})logdet(LS)\Delta_i=\log\det(L’_{S\cup\{i\}})-\log\det(L’_S)

가 가장 큰 example 추가.


12. CEIL과의 차이

CEIL(ICML 2023)과 비교하면:

항목CEILNDPP
Query relevanceOO
DiversityOO
Example consistencyXO
Positive correlationXO
Negative correlationOO
모델DPPNDPP

CEIL:

query relevance+diversity\text{query relevance} + \text{diversity}


NDPP:

query relevance+diversity+consistency\text{query relevance}+\text{diversity}+\text{consistency}


13. 실험 결과

GPT-Neo(2.7B), GPT-4, Gemini-2.0-flash에서 평가.  

주요 결과:

  • 모든 데이터셋에서 CEIL보다 우수
  • GPT-4에서도 개선
  • Ablation에서
    • LLM scoring 제거 → 성능 감소
    • Regularization 제거 → 감소
    • Query adaptation 제거 → 감소

연구 관점에서의 평가

이 논문의 핵심 아이디어는 매우 명확합니다.

기존 DPP 계열(ICL-DPP, CEIL)의 가정은

“좋은 demonstration set = diverse set”

이었는데,

이 논문은

“좋은 demonstration set = diverse + consistent”

라고 주장합니다.

이를 위해 DPP를 NDPP로 확장하여 positive correlation을 직접 모델링했다는 점이 가장 큰 기여입니다. DPP 기반 example selection 연구 흐름에서 보면,

  • CEIL (ICML 2023)
  • Effective Demonstration Annotation via LM-based DPP (EMNLP 2024)
  • NDPP (EMNLP 2025)

로 이어지는 자연스러운 발전 방향으로 볼 수 있습니다.


게시됨

카테고리

,

작성자

댓글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다