kernelbench.com: Agentic GPU Kernel Benchmark Results and Run Artifacts

Arledge, Elliot

all runs

53 runs · 50 scored · 0 no perf · 3 fail · 0 err · sorted by peak_fraction desc

One row per (model, problem) cell. Click any row to open the full transcript viewer — every tool call, every reasoning step, the model's solution.py, the check.log, the result.json. The viewer is the same one we use locally to audit runs, just themed for the site.

peak	problem	model	harness	elapsed	run id
0.677	03_paged_attention	glm-5.2	Claude Code	234m	20260613_055815_zai-claude_glm-5.2_03_paged_attention
0.671	03_paged_attention	claude-opus-4-8	Claude Code	112m	20260613_042305_claude_claude-opus-4-8_03_paged_attention
0.630	03_paged_attention	claude-fable-5 [max]	Claude Code	61m	20260611_050147_claude_claude-fable-5_03_paged_attention
0.556	03_paged_attention	gpt-5.5 [xhigh]	codex	27m	20260613_044538_codex_gpt-5.5_03_paged_attention
0.513	03_paged_attention	MiniMax-M3	Claude Code	355m	20260613_081306_minimax-claude_MiniMax-M3_03_paged_attention
0.406	01_fp8_gemm	glm-5.2	Claude Code	96m	20260614_145529_zai-claude_glm-5.2_01_fp8_gemm
0.393	03_paged_attention	deepseek-v4-pro	deepseek-claude	25m	20260615_125721_deepseek-claude_deepseek-v4-pro_03_paged_attention
0.386	01_fp8_gemm	claude-opus-4-8	Claude Code	50m	20260614_144216_claude_claude-opus-4-8_01_fp8_gemm
0.377	01_fp8_gemm	composer-2.5-fast	cursor	18m	20260615_114532_cursor_composer-2.5-fast_01_fp8_gemm
0.366	01_fp8_gemm	MiniMax-M3	Claude Code	169m	20260614_153222_minimax-claude_MiniMax-M3_01_fp8_gemm
0.364	01_fp8_gemm	gpt-5.5 [xhigh]	codex	13m	20260614_144224_codex_gpt-5.5_01_fp8_gemm
0.348	07_w4a16_gemm	claude-fable-5 [max]	Claude Code	48m	20260610_224447_claude_claude-fable-5_07_w4a16_gemm
0.347	01_fp8_gemm	kimi-k2.7-code	kimi-claude	69m	20260614_171808_kimi-claude_kimi-k2.7-code_01_fp8_gemm
0.340	01_fp8_gemm	deepseek-v4-pro	deepseek-claude	36m	20260614_163128_deepseek-claude_deepseek-v4-pro_01_fp8_gemm
0.321	07_w4a16_gemm	glm-5.2	Claude Code	280m	20260613_061443_zai-claude_glm-5.2_07_w4a16_gemm
0.256	03_paged_attention	composer-2.5-fast	cursor	4m	20260615_120402_cursor_composer-2.5-fast_03_paged_attention
0.244	03_paged_attention	gemini-3.5-flash	Gemini CLI	48m	20260613_105439_gemini_gemini-3.5-flash_03_paged_attention
0.241	03_paged_attention	kimi-k2.7-code	kimi-claude	41m	20260613_163906_kimi-claude_kimi-k2.7-code_03_paged_attention
0.235	07_w4a16_gemm	claude-opus-4-8	Claude Code	218m	20260613_115410_claude_claude-opus-4-8_07_w4a16_gemm
0.203	07_w4a16_gemm	gpt-5.5 [xhigh]	codex	20m	20260613_053815_codex_gpt-5.5_07_w4a16_gemm
0.196	01_fp8_gemm	gemini-3.5-flash	Gemini CLI	11m	20260614_170713_gemini_gemini-3.5-flash_01_fp8_gemm
0.172	07_w4a16_gemm	gemini-3.5-flash	Gemini CLI	101m	20260613_114239_gemini_gemini-3.5-flash_07_w4a16_gemm
0.154	07_w4a16_gemm	deepseek-v4-pro	deepseek-claude	53m	20260615_143020_deepseek-claude_deepseek-v4-pro_07_w4a16_gemm
0.153	07_w4a16_gemm	kimi-k2.7-code	kimi-claude	95m	20260613_181541_kimi-claude_kimi-k2.7-code_07_w4a16_gemm
0.151	07_w4a16_gemm	composer-2.5-fast	cursor	24m	20260615_123336_cursor_composer-2.5-fast_07_w4a16_gemm
0.145	07_w4a16_gemm	MiniMax-M3	Claude Code	280m	20260613_095207_minimax-claude_MiniMax-M3_07_w4a16_gemm
0.108	06_sonic_moe_swiglu	claude-fable-5 [max]	Claude Code	55m	20260611_050205_claude_claude-fable-5_06_sonic_moe_swiglu
0.103	06_sonic_moe_swiglu	kimi-k2.7-code	kimi-claude	166m	20260613_171946_kimi-claude_kimi-k2.7-code_06_sonic_moe_swiglu
0.101	06_sonic_moe_swiglu	composer-2.5-fast	cursor	39m	20260615_121705_cursor_composer-2.5-fast_06_sonic_moe_swiglu
0.099	06_sonic_moe_swiglu	gpt-5.5 [xhigh]	codex	27m	20260613_051216_codex_gpt-5.5_06_sonic_moe_swiglu
0.098	06_sonic_moe_swiglu	glm-5.2	Claude Code	241m	20260613_061433_zai-claude_glm-5.2_06_sonic_moe_swiglu
0.092	06_sonic_moe_swiglu	MiniMax-M3	Claude Code	364m	20260613_094226_minimax-claude_MiniMax-M3_06_sonic_moe_swiglu
0.087	06_sonic_moe_swiglu	gemini-3.5-flash	Gemini CLI	106m	20260613_114210_gemini_gemini-3.5-flash_06_sonic_moe_swiglu
0.086	06_sonic_moe_swiglu	claude-opus-4-8	Claude Code	105m	20260613_042321_claude_claude-opus-4-8_06_sonic_moe_swiglu
0.055	02_kda_cutlass	claude-opus-4-8	Claude Code	114m	20260613_042257_claude_claude-opus-4-8_02_kda_cutlass
0.053	06_sonic_moe_swiglu	deepseek-v4-pro	deepseek-claude	97m	20260615_140149_deepseek-claude_deepseek-v4-pro_06_sonic_moe_swiglu
0.049	05_topk_bitonic	claude-fable-5 [max]	Claude Code	48m	20260610_174700_claude_claude-fable-5_05_topk_bitonic
0.046	05_topk_bitonic	gpt-5.5 [xhigh]	codex	35m	20260613_050335_codex_gpt-5.5_05_topk_bitonic
0.037	02_kda_cutlass	gpt-5.5 [xhigh]	codex	77m	20260613_042345_codex_gpt-5.5_02_kda_cutlass
0.036	02_kda_cutlass	claude-fable-5 [max]	Claude Code	32m	20260610_220314_claude_claude-fable-5_02_kda_cutlass
0.034	05_topk_bitonic	glm-5.2	Claude Code	236m	20260613_060814_zai-claude_glm-5.2_05_topk_bitonic
0.034	02_kda_cutlass	composer-2.5-fast	cursor	31m	20260615_114540_cursor_composer-2.5-fast_02_kda_cutlass
0.034	05_topk_bitonic	claude-opus-4-8	Claude Code	137m	20260613_042313_claude_claude-opus-4-8_05_topk_bitonic
0.032	02_kda_cutlass	glm-5.2	Claude Code	241m	20260613_054111_zai-claude_glm-5.2_02_kda_cutlass
0.029	05_topk_bitonic	gemini-3.5-flash	Gemini CLI	85m	20260613_112732_gemini_gemini-3.5-flash_05_topk_bitonic
0.017	02_kda_cutlass	kimi-k2.7-code	kimi-claude	128m	20260613_163858_kimi-claude_kimi-k2.7-code_02_kda_cutlass
0.014	05_topk_bitonic	deepseek-v4-pro	deepseek-claude	68m	20260615_132230_deepseek-claude_deepseek-v4-pro_05_topk_bitonic
0.006	02_kda_cutlass	gemini-3.5-flash	Gemini CLI	87m	20260613_101539_gemini_gemini-3.5-flash_02_kda_cutlass
0.006	05_topk_bitonic	MiniMax-M3	Claude Code	362m	20260613_081745_minimax-claude_MiniMax-M3_05_topk_bitonic
0.004	05_topk_bitonic	composer-2.5-fast	cursor	26m	20260615_120752_cursor_composer-2.5-fast_05_topk_bitonic
FAIL	02_kda_cutlass	deepseek-v4-pro	deepseek-claude	66m	20260615_125550_deepseek-claude_deepseek-v4-pro_02_kda_cutlass
FAIL	05_topk_bitonic	kimi-k2.7-code	kimi-claude	183m	20260613_163914_kimi-claude_kimi-k2.7-code_05_topk_bitonic
FAIL	02_kda_cutlass	MiniMax-M3	Claude Code	364m	20260613_064019_minimax-claude_MiniMax-M3_02_kda_cutlass