regisss
/

llama2-70b-fused-qkv-mlperf

Text Generation

Model card Files Files and versions

regisss HF Staff commited on Feb 14, 2024

Commit

d811de4

·

verified ·

1 Parent(s): eb48137

Define CustomLlamaConfig

Files changed (1) hide show

modeling_llama.py +5 -1

modeling_llama.py CHANGED Viewed

@@ -58,6 +58,10 @@ logger = logging.get_logger(__name__)
 _CONFIG_FOR_DOC = "LlamaConfig"
 def _get_unpad_data(attention_mask):
     seqlens_in_batch = attention_mask.sum(dim=-1, dtype=torch.int32)
     indices = torch.nonzero(attention_mask.flatten(), as_tuple=False).flatten()
@@ -929,7 +933,7 @@ LLAMA_START_DOCSTRING = r"""
     LLAMA_START_DOCSTRING,
 )
 class LlamaPreTrainedModel(PreTrainedModel):
-    config_class = LlamaConfig
     base_model_prefix = "model"
     supports_gradient_checkpointing = True
     _no_split_modules = ["LlamaDecoderLayer"]

 _CONFIG_FOR_DOC = "LlamaConfig"
+CustomLlamaConfig(LlamaConfig):
+    model_type = "custom_llama"
 def _get_unpad_data(attention_mask):
     seqlens_in_batch = attention_mask.sum(dim=-1, dtype=torch.int32)
     indices = torch.nonzero(attention_mask.flatten(), as_tuple=False).flatten()
     LLAMA_START_DOCSTRING,
 )
 class LlamaPreTrainedModel(PreTrainedModel):
+    config_class = CustomLlamaConfig
     base_model_prefix = "model"
     supports_gradient_checkpointing = True
     _no_split_modules = ["LlamaDecoderLayer"]