Search Results

Found 9 repositories(showing 9)

FlexLLMGen

FMInference

💛85

Running large language models on a single GPU for throughput-oriented scenarios.

9.4k

594

Apache-2.0

Python

Updated 21 hours ago

deep-learninggpt-3high-throughput+4

FlexLLMGen

Sacusa

❤️30

No description available

Apache-2.0

Python

Updated 7 months ago

FlexLLMGen_for_Llama2

jjL357

❤️35

FlexLLMGen_for_Llama2

Apache-2.0

Python

Updated 8 months ago

FlexLLMGenMPS

virtualramblas

❤️40

Running large language models on a single M1/M2 GPU for throughput-oriented scenarios.

Apache-2.0

Python

Updated 9 months ago

deep-learninghigh-throughputhuggingface+7

FlexLLMGen

winfred-L

🧡50

No description available

Apache-2.0

Python

Updated 3 weeks ago

workflow-fminference-flexllmgen-single-gpu-offloaded-inference

leeroopedia

❤️45

Run large OPT models (up to 175B) on a single GPU via three-tier memory offloading across GPU, CPU, and disk using FlexLLMGen

Python

Updated 1 month ago

workflow-fminference-flexllmgen-data-wrangling-batch-inference

leeroopedia

❤️35

No description available

Python

Updated 1 month ago

workflow-fminference-flexllmgen-helm-benchmark-evaluation

leeroopedia

❤️35

No description available

Python

Updated 1 month ago

workflow-fminference-flexllmgen-text-completion-api

leeroopedia

❤️35

No description available

Python

Updated 1 month ago

All 9 repositories loaded

GitHub Explorer

Search Results

FlexLLMGen

FlexLLMGen

FlexLLMGen_for_Llama2

FlexLLMGenMPS

FlexLLMGen

workflow-fminference-flexllmgen-single-gpu-offloaded-inference

workflow-fminference-flexllmgen-data-wrangling-batch-inference

workflow-fminference-flexllmgen-helm-benchmark-evaluation

workflow-fminference-flexllmgen-text-completion-api

FlexLLMGen

FlexLLMGen

FlexLLMGen_for_Llama2

FlexLLMGenMPS

FlexLLMGen

workflow-fminference-flexllmgen-single-gpu-offloaded-inference

workflow-fminference-flexllmgen-data-wrangling-batch-inference

workflow-fminference-flexllmgen-helm-benchmark-evaluation

workflow-fminference-flexllmgen-text-completion-api