[태그:] In-context Autoencoder

  • * In-Context Autoencoder for Context Compression in a Large Language Model (ICLR 2024)

    * In-Context Autoencoder for Context Compression in a Large Language Model (ICLR 2024)

    이 논문은 LLM의 긴 context를 매우 짧은 “memory slot”으로 압축하는 방법인 ICAE (In-context Autoencoder) 를 제안한다. 핵심 아이디어는: “원래 512-token context를, 예를 들어 128개의 latent memory slot으로 압축한 뒤, LLM이 이 compressed representation만 보고도 원래 context를 거의 복원하거나 질문에 답할 수 있게 하자.” 즉, 기존 long-context transformer처럼 attention 구조를 바꾸는 대신: 를 목표로 한다.  …