Quantize¶

Quantize the sub-modules of a module according to a predicate.

Abstract Signature:

Quantize(model: Module, group_size: int = 64, bits: int = 4)

API: torch.ao.quantization.quantize_dynamic

Strategy: Direct Mapping

API: —

Strategy: Plugin (quantization)

API: keras.layers.ZeroPadding3D.quantize

Strategy: Plugin (quantization)

API: —

Strategy: Plugin (quantization)

API: mlx.nn.quantize

Strategy: Direct Mapping

API: —

Strategy: Plugin (quantization)

API: —

Strategy: Plugin (quantization)