keras-team · mattdangerw · Aug 6, 2024 · Aug 5, 2024 · Aug 6, 2024 · mattdangerw
diff --git a/keras_nlp/src/models/llama/llama_presets.py b/keras_nlp/src/models/llama/llama_presets.py
@@ -25,6 +25,16 @@
         },
         "kaggle_handle": "kaggle://keras/llama2/keras/llama2_7b_en/1",
     },
+    "llama2_7b_en_int8": {
+        "metadata": {
+            "description": "LLaMA 2 7B Quantized Base model",
+            "params": 6739839488,
+            "official_name": "LLaMA 2",
+            "path": "llama2",
+            "model_card": "https://github.com/meta-llama/llama",
+        },
+        "kaggle_handle": "kaggle://keras/llama2/keras/llama2_7b_en_int8/1",
+    },
     "llama2_instruct_7b_en": {
         "metadata": {
             "description": "LLaMA 2 7B Chat model",
@@ -35,6 +45,16 @@
         },
         "kaggle_handle": "kaggle://keras/llama2/keras/llama2_instruct_7b_en/1",
     },
+    "llama2_instruct_7b_en_int8": {
+        "metadata": {
+            "description": "LLaMA 2 7B Quantized Chat model",
+            "params": 6739839488,
+            "official_name": "LLaMA 2",
+            "path": "llama2",
+            "model_card": "https://github.com/meta-llama/llama",
+        },
+        "kaggle_handle": "kaggle://keras/llama2/keras/llama2_instruct_7b_en_int8/1",
+    },
     "vicuna_1.5_7b_en": {
         "metadata": {
             "description": "Vicuna v1.5 7B Chat model",

diff --git a/keras_nlp/src/models/llama3/llama3_presets.py b/keras_nlp/src/models/llama3/llama3_presets.py
@@ -25,6 +25,16 @@
         },
         "kaggle_handle": "kaggle://keras/llama3/keras/llama3_8b_en/3",
     },
+    "llama3_8b_en_int8": {
+        "metadata": {
+            "description": "LLaMA 3 8B Quantized Base model",
+            "params": 8031894016,
+            "official_name": "LLaMA 3",
+            "path": "llama3",
+            "model_card": "https://github.com/meta-llama/llama3",
+        },
+        "kaggle_handle": "kaggle://keras/llama3/keras/llama3_8b_en_int8/1",
+    },
     "llama3_instruct_8b_en": {
         "metadata": {
             "description": "LLaMA 3 8B Instruct model",
@@ -35,4 +45,14 @@
         },
         "kaggle_handle": "kaggle://keras/llama3/keras/llama3_instruct_8b_en/3",
     },
+    "llama3_instruct_8b_en_int8": {
+        "metadata": {
+            "description": "LLaMA 3 8B Quantized Instruct model",
+            "params": 8031894016,
+            "official_name": "LLaMA 3",
+            "path": "llama3",
+            "model_card": "https://github.com/meta-llama/llama3",
+        },
+        "kaggle_handle": "kaggle://keras/llama3/keras/llama3_instruct_8b_en_int8/1",
+    },
 }