TransformerFeedForwardMoe¶

A sharded MoE Layer.

Abstract Signature:

TransformerFeedForwardMoe(input_dims: int, hidden_dims: int, num_experts: int, num_groups: int)

API: —

Strategy: Custom / Partial

API: praxis.layers.TransformerFeedForwardMoe

Strategy: Direct Mapping