MultiHeadAttention¶

Computes Multi-Head Attention.

Abstract Signature:

MultiHeadAttention(embed_dim: int, num_heads: int)

API: torch.nn.MultiheadAttention

Strategy: Direct Mapping

API: keras.layers.MultiHeadAttention

Strategy: Direct Mapping

API: tf.keras.layers.MultiHeadAttention

Strategy: Direct Mapping

API: mlx.nn.MultiHeadAttention

Strategy: Direct Mapping

API: flax.nnx.MultiHeadAttention

Strategy: Direct Mapping

API: praxis.layers.MultiHeadAttention

Strategy: Direct Mapping