Fine-tuning vs RAG: Duas maneiras de ensinar um LLM
Você quer que um LLM conheça seus documentos privados ou notícias recentes. Você tem duas opções: RAG ou fine-tuning. As pessoas costumam escolher a errada.
A regra é simples. Use RAG para fatos. Use fine-tuning para comportamento.
RAG (Retrieval-Augmented Generation) Isso funciona como um exame com consulta. Você mantém os dados fora do modelo. Você busca informações relevantes e as cola no prompt.
- Use para conhecimento.
- Use para fatos que mudam com frequência.
- É barato.
- Atualiza-se instantaneamente.
- Cita fontes.
Fine-tuning Isso funciona como a internalização de um novo hábito. Você treina o modelo com exemplos específicos.
- Use para comportamento.
- Use para tom e formato.
- Use para habilidades específicas.
- Requer um ciclo de treinamento.
- Requer exemplos curados.
- Torna-se desatualizado conforme os fatos mudam.
Como escolher: Pergunte a si mesmo se você precisa de um fato ou de uma forma de se comportar.
Use RAG se precisar atualizar:
- Catálogos de produtos.
- Políticas da empresa.
- Notícias diárias.
Use fine-tuning se precisar de:
- Uma voz de marca específica.
- Um formato de saída JSON estrito.
A melhor abordagem geralmente combina ambos. Faça o fine-tuning para a forma como o modelo responde. Use RAG para quais fatos ele utiliza. Um bot de suporte usa fine-tuning para soar profissional e RAG para acessar os artigos de ajuda mais recentes.
Comece com prompting e RAG. Passe para o fine-tuning apenas quando for necessário.
Teste estes cenários aqui: https://dev48v.infy.uk/ai/days/day10-finetune-vs-rag.html
Fonte: https://dev.to/dev48v/fine-tuning-vs-rag-two-ways-to-teach-an-llm-3d04
Comunidade de aprendizado opcional: https://t.me/GyaanSetuAi