Transformers

2 essays on this theme.

August 11, 2023

An experiment on compressing multiple LLM tokens into one representation for faster decoding and longer effective context.

April 30, 2023

Experiments on extending transformer context length, including training observations, tradeoffs, and lessons from long-context tuning.