Run MMLU on any LLM

Choose LLM

API Endpoint

Model Name

Access Token

Use MMLU-Light (faster evaluation)

Benchmark Results

Public Model Results

Copied to clipboard!

Need a better benchmark? Try our Arena.