Token compression Writing | Nauman Mustafa

August 11, 2023

An experiment on compressing multiple LLM tokens into one representation for faster decoding and longer effective context.