Fine-Tuning de LLMs Locales con QLoRA: Del Experimento al GGUF en Producción
El pipeline completo: curación de dataset, entrenamiento QLoRA en una A100, evaluación, cuantización a GGUF y serving con vLLM. Lo que los tutoriales no cuentan.
Leer más →El pipeline completo: curación de dataset, entrenamiento QLoRA en una A100, evaluación, cuantización a GGUF y serving con vLLM. Lo que los tutoriales no cuentan.
Leer más →