Upload FP8 quantized model

Files changed (1) hide show

config.json CHANGED Viewed

@@ -60,11 +60,9 @@
           "num_bits": 8,
           "observer": "minmax",
           "observer_kwargs": {},
-          "scale_dtype": null,
           "strategy": "tensor",
           "symmetric": true,
-          "type": "float",
-          "zp_dtype": null
         },
         "output_activations": null,
         "targets": [
@@ -78,11 +76,9 @@
           "num_bits": 8,
           "observer": "minmax",
           "observer_kwargs": {},
-          "scale_dtype": null,
           "strategy": "tensor",
           "symmetric": true,
-          "type": "float",
-          "zp_dtype": null
         }
       }
     },

           "num_bits": 8,
           "observer": "minmax",
           "observer_kwargs": {},
           "strategy": "tensor",
           "symmetric": true,
+          "type": "float"
         },
         "output_activations": null,
         "targets": [
           "num_bits": 8,
           "observer": "minmax",
           "observer_kwargs": {},
           "strategy": "tensor",
           "symmetric": true,
+          "type": "float"
         }
       }
     },