Motif-Technologies
/

Motif-2.6B

Text Generation

text-generation-inference

Model card Files Files and versions

leejunhyeok commited on Jun 9, 2025

Commit

6d0fba5

·

verified ·

1 Parent(s): 9be8a4a

Update modeling_motif.py

Files changed (1) hide show

modeling_motif.py +4 -4

modeling_motif.py CHANGED Viewed

@@ -1032,9 +1032,9 @@ class MotifFlashAttention2(MotifAttention):
                                         causal=causal)
             return attn_out
         else:
-            attn_out = _flash_attention_forward(query_states,
-                                            key_states,
-                                            value_states,
                                             attention_mask,
                                             q_len,
                                             position_ids=position_ids,
@@ -1044,7 +1044,7 @@ class MotifFlashAttention2(MotifAttention):
                                             softmax_scale=scale_factor,
                                             use_top_left_mask=self._flash_attn_uses_top_left_mask)
             #logger.info(attn_out)
-            return attn_out
     def forward(
             self,

                                         causal=causal)
             return attn_out
         else:
+            attn_out = _flash_attention_forward(query_states.bfloat16(),
+                                            key_states.bfloat16(),
+                                            value_states.bfloat16(),
                                             attention_mask,
                                             q_len,
                                             position_ids=position_ids,
                                             softmax_scale=scale_factor,
                                             use_top_left_mask=self._flash_attn_uses_top_left_mask)
             #logger.info(attn_out)
+            return attn_out.float()
     def forward(
             self,