GitHub Explorer

by Alexey Ratnikov

GitHub Explorer

GitHub Explorer|TRENDING COMPARE|FEEDBACK

Back to search

open-compass/VLMEvalKit - GitHub Explorer | GitHub Explorer | Trending | Compare

Back to search

VLMEvalKit

open-compass•PUBLIC

View on GitHub

Open-source evaluation toolkit of large multi-modality models (LMMs), support 220+ LMMs, 80+ benchmarks

chatgptclaudeclipcomputer-visionevaluationgemini

Apache License 2.0

Created on Dec 1, 2023

Updated on Apr 4, 2026

Stars

4.0k

Forks

667

Watchers

4.0k

Open Issues

231

Repository Health Score

💛

71/100

Good

Overall repository health assessment

Score Breakdown

Activity

Active development - updated this week

30/30

100%

Issues Analytics

Total Issues

All time

Open

52% of total

Closed

Recent Commits

[Benchmark] Add support for MMOral-OPG-Closed benchmark (#1483)

Jing HAO•1 week ago

a3656d4View on GitHub

[Benchmark] Add support for MMOral-OPG-Open benchmark (#1484)

Jing HAO•1 week ago

589fe36View on GitHub

[Lint] Standardize code style and logger usage. (#1493)

Ma Zerun•1 week ago

401916cView on GitHub

[Fix] Fix ChartX Evaluation Robustness. (#1489)

Jinsong Li•1 week ago

f67e576View on GitHub

[Benchmark] Add support for MMSafetyBench, XSTest, MMSBench, Flames, SIUO and M3oralBench. (#1488)

Gu tian•1 week ago

6e7e372View on GitHub

[Feature] add MiniMax as text LLM API provider (#1491)

Octopus•1 week ago

f91760eView on GitHub

[Benchmark] Support SArena Benchmark (#1371)

Yifei Li•1 week ago

7d6d81fView on GitHub

[Update] Update model settings for 2026.2 live leaderboard. (#1492)

Ma Zerun•1 week ago

655e65fView on GitHub

[Benchmark] Support ChartBench. (#1490)

Jinsong Li•1 week ago

f765748View on GitHub

[Feature] Support sequential inference accorss all datasets and parallel evaluation. (#1487)

TianhaoLiang2000•1 week ago

4baeeeeView on GitHub

[Benchmark] Add SGI-Bench 1.0 dataset (#1464)

TianhaoLiang2000•2 weeks ago

161d400View on GitHub

[Fix] physics: deduplicate preds to handle repeat output, add signal timeout handler (#1470)

TianhaoLiang2000•2 weeks ago

1e2b2f9View on GitHub

[Benchmark] Add OCRBench_v2_MINI dataset (#1454)

TianhaoLiang2000•2 weeks ago

2e2b959View on GitHub

[Benchmark] XLRSBench: rewrite evaluate() with track_progress_rich and GPT-assisted scoring (#1472)

TianhaoLiang2000•2 weeks ago

f8e2bc1View on GitHub

[Fix] olympiadbench: add isinstance(line, int) guard in build_prompt to handle integer row index (#1469)

TianhaoLiang2000•2 weeks ago

9049740View on GitHub

View all commits

GitHub Explorer

VLMEvalKit

Score Breakdown

Issues Activity: Last 6 months

Hottest Issues