Leaderboard

This page tracks benchmark results for HybridRAG-Bench.

Summary

Metric columns can be adapted to your final evaluation protocol.
Higher is better unless a column explicitly states lower-is-better.
Update tables by editing: docs/source/_static/leaderboard_arxiv_ai.csv, docs/source/_static/leaderboard_arxiv_cy.csv, docs/source/_static/leaderboard_arxiv_bio.csv.

Rank	Date	Model	Method	Notes
1	2026-02-12	Llama-3.3-70B	HybridRAG	placeholder
2	2026-02-12	Llama-3.3-70B	KG-RAG	placeholder
3	2026-02-12	Llama-3.3-70B	RAG	placeholder
4	2026-02-12	Llama-3.3-70B	IO	placeholder

Rank	Date	Model	Method	Notes
1	2026-02-12	Llama-3.3-70B	HybridRAG	placeholder
2	2026-02-12	Llama-3.3-70B	KG-RAG	placeholder
3	2026-02-12	Llama-3.3-70B	RAG	placeholder
4	2026-02-12	Llama-3.3-70B	IO	placeholder

Rank	Date	Model	Method	Notes
1	2026-02-12	Llama-3.3-70B	HybridRAG	placeholder
2	2026-02-12	Llama-3.3-70B	KG-RAG	placeholder
3	2026-02-12	Llama-3.3-70B	RAG	placeholder
4	2026-02-12	Llama-3.3-70B	IO	placeholder

Use this schema when adding new results: