Fix fused qkv sizing for bloom (#4161)

Co-authored-by: N Logan Adams <114770087+loadams@users.noreply.github.com>

Fix fused qkv sizing for bloom (#4161)
Co-authored-by: N Logan Adams <114770087+loadams@users.noreply.github.com>
042115c8 · Molly Smith · GitHub · 60d7b0a3 · 042115c8
隐藏空白更改
内联并排

Showing with 4 addition and 2 deletion

deepspeed/module_inject/fusedqkv_utils.py deepspeed/module_inject/fusedqkv_utils.py +4 -2

未找到文件。
--- a/deepspeed/module_inject/fusedqkv_utils.py
+++ b/deepspeed/module_inject/fusedqkv_utils.py
@@ -68,7 +68,9 @@ def prepare_tp_fused_qkvw(module_str, src, mp_size, gpu_index):
        return tp_fuseqkv_weight[gpu_index * dst_shape:(gpu_index + 1) * dst_shape]

    def _bloom_type_transpose(input, mp_size):
-        return input
+        shape = input.shape
+        dst_shape = shape[0] // mp_size
+        return input[gpu_index * dst_shape:(gpu_index + 1) * dst_shape]

    def _transpose_fused_qkvw(src, mp_size, fused_qkv_type=None):

@@ -91,4 +93,4 @@ def prepare_tp_fused_qkvw(module_str, src, mp_size, gpu_index):
            return _transpose_fused_qkvw(src, mp_size, fused_type)
    warning_once(f"Unrecognized fusedkqv weight type, default to using bloom type,"
                 f"please check in prepare_tp_fused_qkvw() to avoid potential calculation errors")
-    return src
+    return _bloom_type_transpose(src, mp_size)