Search Results

Found 14 repositories(showing 14)

ComfyUI_Simple_Qwen3-VL-gguf

KLL535

🧡65

Simple Qwen3-VL gguf model loader for Comfy-UI.

MIT

Python

Updated 2 hours ago

gguf-loader

GGUFloader

🧡50

GGUF Loader with its Agentic Mode, and floating button, ai Models | Open Source & Offline. Mistral, Deepseek, llama, gemma, qwen

MIT

Python

Updated 2 weeks ago

ai-assistantchatgpt-osscode+8

ml-library-cpp

AidenTran900

🧡55

A C++/Python machine learning library built from scratch. Features classic ML algorithms and a GGUF-compatible inference loader for transformers.

MIT

C++

Updated 3 days ago

turboquant-llama

CarapaceUDE

💛70

llama.cpp fork: Qwen 3.5 hybrid GGUF + loader fixes; syncs with ggml-org/llama.cpp

MIT

C++

Updated 23 hours ago

gguf_loader

zihaomu

❤️30

No description available

MIT

Updated 1 year ago

ollama-gguf-loader

winternewt

❤️25

No description available

Updated 1 year ago

tiny-gguf-loader-for-chat

k-min9

❤️35

tiny LLM loader

Python

Updated 2 years ago

DanilkaAI-Loader

Lolik612

❤️45

The Loader for gguf models

Java

Updated 2 months ago

Universal-Loader

Zenthrose

❤️35

Universal vulkan gguf loader. Will load v1, v2, and v3 gguf files, all quantized formats

C++

Updated 3 months ago

LaQuisha_complete-chat-browser_model-loader_and-backend_for-running-GGUF-models_with-Llama.cpp

Fortnumsound

❤️20

A fast API booty-licious back-end for running GGUF models with Llama.cpp

Python

Updated 6 months ago

50805090api+8

gguf-landing

GGUFloader

❤️35

Official blog and knowledge hub for GGUF Loader — guides, model reviews, and local AI tips.

Updated 9 months ago

RawrXD-IDE-Final

ItsMehRAWRXD

❤️35

RawrXD IDE — Pure C++20/MASM64 Win32 IDE with three-layer hotpatching, agentic framework, GGUF model loader

MIT

C++

Updated 1 month ago

Smart Language Model Loader for ComfyUI — unified vision-language AI with QwenVL, Mistral, Mistral3 / Ministral3, Florence-2 via Transformers, Docker (vLLM/SGLang/Ollama/llama.cpp), and GGUF backends. nVidia+AMD/ROCm support.

Apache-2.0

Python

Updated 21 hours ago

Inference-Engine

james04nesbitt

🧡55

A standalone C++20 inference engine for Gemma-3 1B built from scratch, featuring a complete transformer forward pass and GGUF loader. It maximizes throughput and minimizes memory using SIMD-accelerated GEMM kernels (Google Highway), PagedAttention, FlashAttention, and outlier-aware INT8 KV cache quantization.

C++

Updated 3 weeks ago

All 14 repositories loaded

GitHub Explorer

Search Results

ComfyUI_Simple_Qwen3-VL-gguf

gguf-loader

ml-library-cpp

turboquant-llama

gguf_loader

ollama-gguf-loader

tiny-gguf-loader-for-chat

DanilkaAI-Loader

Universal-Loader

LaQuisha_complete-chat-browser_model-loader_and-backend_for-running-GGUF-models_with-Llama.cpp

gguf-landing

RawrXD-IDE-Final

ComfyUI_SmartLML

Inference-Engine

ComfyUI_Simple_Qwen3-VL-gguf

gguf-loader

ml-library-cpp

turboquant-llama

gguf_loader

ollama-gguf-loader

tiny-gguf-loader-for-chat

DanilkaAI-Loader

Universal-Loader

LaQuisha_complete-chat-browser_model-loader_and-backend_for-running-GGUF-models_with-Llama.cpp

gguf-landing

RawrXD-IDE-Final

ComfyUI_SmartLML

Inference-Engine