Search Results

Found 2 repositories(showing 2)

Language-Model-Quality-Auditor

mohdibrahimaiml

❤️40

A comprehensive human-in-the-loop evaluation platform for Large Language Models, built for AI alignment and safety research. This Flask-based application enables human evaluators to provide structured feedback on LLM outputs across multiple quality dimensions.

MIT

HTML

Updated 7 months ago

llm_triangle_eval_skill

lzn87591

🧡65

A triangular multi-agent evaluation skill for Large Language Models, where a Worker, Leader, and Auditor collaboratively assess reasoning quality, factual correctness, and execution reliability through adversarial verification.

Updated 3 days ago

All 2 repositories loaded

GitHub Explorer

Search Results

Language-Model-Quality-Auditor

llm_triangle_eval_skill

Language-Model-Quality-Auditor

llm_triangle_eval_skill