blog | Tokens per watt

Adaptive SM clocking for energy-efficient LLM serving

LLM serving is moving from occasional jobs to persistent service infrastructure. At that scale, GPU power is no longer a background detail. It sets thermal limi …

Read Story

by Jean-Maxime Larouche

9 min read

Jun 1, 2026

Adaptive SM clocking for energy-efficient LLM serving

Tokens per watt LLM inference

GPU power

Adaptive SM clocking for energy-efficient LLM serving

Subscribe to updates