𝗙𝗶𝗻𝗲-𝘁𝘂𝗻𝗶𝗻𝗴 𝘃𝘀 𝗥𝗔𝗚: 𝗗𝗼𝘀 𝗳𝗼𝗿𝗺𝗮𝘀 𝗱𝗲 𝗲𝗻𝘀𝗲ñ𝗮𝗿 𝗮 𝘂𝗻 𝗟𝗟𝗠
Quieres que un LLM conozca tus documentos privados o noticias recientes. Tienes dos opciones: RAG o fine-tuning. La gente suele elegir la incorrecta.
La regla es sencilla. Usa RAG para hechos. Usa fine-tuning para el comportamiento.
RAG (Retrieval-Augmented Generation) Esto actúa como un examen a libro abierto. Mantienes los datos fuera del modelo. Recuperas la información relevante y la pegas en el prompt.
- Úsalo para conocimiento.
- Úsalo para hechos que cambian con frecuencia.
- Es económico.
- Se actualiza al instante.
- Cita las fuentes.
Fine-tuning Esto actúa como la internalización de un nuevo hábito. Entrenas al modelo con ejemplos específicos.
- Úsalo para el comportamiento.
- Úsalo para el tono y el formato.
- Úsalo para habilidades específicas.
- Requiere una ejecución de entrenamiento.
- Requiere ejemplos seleccionados cuidadosamente.
- Queda desactualizado a medida que los hechos cambian.
Cómo elegir: Pregúntate si necesitas un hecho o una forma de comportarse.
Usa RAG si necesitas actualizar:
- Catálogos de productos.
- Políticas de la empresa.
- Noticias diarias.
Usa fine-tuning si necesitas:
- Una voz de marca específica.
- Un formato de salida JSON estricto.
El mejor enfoque suele combinar ambos. Haz fine-tuning para la forma en que el modelo responde. Usa RAG para los hechos que utiliza. Un bot de soporte utiliza fine-tuning para sonar profesional y RAG para acceder a los artículos de ayuda más recientes.
Empieza con el prompting y RAG. Pasa al fine-tuning solo cuando sea estrictamente necesario.
Prueba estos escenarios aquí: https://dev48v.infy.uk/ai/days/day10-finetune-vs-rag.html
Fuente: https://dev.to/dev48v/fine-tuning-vs-rag-two-ways-to-teach-an-llm-3d04
Comunidad de aprendizaje opcional: https://t.me/GyaanSetuAi