Update README.md

Files changed (1) hide show

README.md CHANGED Viewed

@@ -24,6 +24,7 @@ The model utilizes **fp8 dynamic (w8a8)** for optimal performance and deployment
 ## Just Run It (vLLM serve)
 You can serve the model using vLLM's OpenAI-compatible API server.
 *Warning: this model uses Gpt-oss as the base language model, and seems to have some issues running in vllm. Still digging in*
 ```bash
 vllm serve brandonbeiler/InternVL3_5-GPT-OSS-20B-A4B-Preview-FP8-Dynamic \

 ## Just Run It (vLLM serve)
 You can serve the model using vLLM's OpenAI-compatible API server.
 *Warning: this model uses Gpt-oss as the base language model, and seems to have some issues running in vllm. Still digging in*
 ```bash
 vllm serve brandonbeiler/InternVL3_5-GPT-OSS-20B-A4B-Preview-FP8-Dynamic \