Spaces:

Alovestocode
/

ZeroGPU-LLM-Inference

Sleeping

App Files Files Community

ZeroGPU-LLM-Inference / quantize_to_awq_colab.ipynb

Alikestocode's picture

Lower Gemma AWQ group size to 16

f8c20fd about 1 month ago

history blame contribute delete

32.9 kB