animehacker/llama-turboquant - GitHub Explorer | GitHub Explorer | Trending

Stars

33

Forks

8

Watchers

33

Open Issues

1

Repository Health Score

💛

70/100

Good

Overall repository health assessment

Score Breakdown

Activity

Active development - updated this week

30/30

100%

Recent Commits

fix: accurately describe as PolarQuant 3-bit, not full TurboQuant with QJL

Oliver Church•1 week ago

4381bddView on GitHub

Update README.md

Oliver•1 week ago

f09aa0dView on GitHub

Update README.md

Oliver•1 week ago

96f7d66View on GitHub

readme: credit unixsysdev's foundational work in intro, list our extensions

Oliver Church•1 week ago

78d2629View on GitHub

credits: add unixsysdev and his llama-turboquant repo

Oliver Church•1 week ago

29dcb1eView on GitHub

add paper: TurboQuant for GGML

Oliver Church•1 week ago

7c8eb4fView on GitHub

tq3_0 v2+v3: K+V compression with flash attention for 72K+ context

Oliver Church•1 week ago

0794f00View on GitHub

tq3_0 v1: fix normalization (1/32 -> 1/sqrt(32))

Oliver Church•1 week ago

cbeed32View on GitHub

docs: add TQ3_0 KV cache compression documentation

Marcel•1 week ago

03fa8abView on GitHub

ggml: add TQ3_0 (TurboQuant 3-bit) KV cache quantization type

Marcel•1 week ago

16e93d5View on GitHub

jinja: fix macro with kwargs (#20960)

Xuan-Son Nguyen•1 week ago

914eb5fView on GitHub

gguf-split : clarify operation of gguf-split (#19749)

Francisco Herrera•1 week ago

8fc1749View on GitHub

llama: fix llama-model-saver (#20503)

Johannes Gäßler•1 week ago

36dafbaView on GitHub

webui: Fix editing assistant message without branching (#20944)

Aleksander Grygier•1 week ago

69e0eceView on GitHub

Add SLEEPING status to the WebUI model selector (#20949)

Pascal•1 week ago

062cca5View on GitHub

View all commits

GitHub Explorer

llama-turboquant

Score Breakdown

Issues Activity: Last 6 months

Hottest Issues