Fine-tuning ਬਨਾਮ RAG: ਇੱਕ LLM ਨੂੰ ਸਿਖਾਉਣ ਦੇ ਦੋ ਤਰੀਕੇ

ਤੁਸੀਂ ਚਾਹੁੰਦੇ ਹੋ ਕਿ ਇੱਕ LLM ਤੁਹਾਡੇ ਨਿੱਜੀ ਦਸਤਾਵੇਜ਼ਾਂ ਜਾਂ ਤਾਜ਼ਾ ਖ਼ਬਰਾਂ ਬਾਰੇ ਜਾਣਦਾ ਹੋਵੇ। ਤੁਹਾਡੇ ਕੋਲ ਦੋ ਵਿਕਲਪ ਹਨ: RAG ਜਾਂ fine-tuning। ਲੋਕ ਅਕਸਰ ਗਲਤ ਚੋਣ ਕਰ ਲੈਂਦੇ ਹਨ।

ਨਿਯਮ ਸਰਲ ਹੈ। ਤੱਥਾਂ (facts) ਲਈ RAG ਦੀ ਵਰਤੋਂ ਕਰੋ। ਵਿਵਹਾਰ (behavior) ਲਈ fine-tuning ਦੀ ਵਰਤੋਂ ਕਰੋ।

RAG (Retrieval-Augmented Generation) ਇਹ ਇੱਕ 'ਓਪਨ-ਬੁੱਕ' ਪ੍ਰੀਖਿਆ ਵਾਂਗ ਕੰਮ ਕਰਦਾ ਹੈ। ਤੁਸੀਂ ਡੇਟਾ ਨੂੰ ਮਾਡਲ ਤੋਂ ਬਾਹਰ ਰੱਖਦੇ ਹੋ। ਤੁਸੀਂ ਸਬੰਧਤ ਜਾਣਕਾਰੀ ਲੱਭਦੇ ਹੋ ਅਤੇ ਇਸਨੂੰ ਪ੍ਰੋਂਪਟ (prompt) ਵਿੱਚ ਪੇਸਟ ਕਰਦੇ ਹੋ।

  • ਇਸਦੀ ਵਰਤੋਂ ਗਿਆਨ ਲਈ ਕਰੋ।
  • ਇਸਦੀ ਵਰਤੋਂ ਅਜਿਹੇ ਤੱਥਾਂ ਲਈ ਕਰੋ ਜੋ ਅਕਸਰ ਬਦਲਦੇ ਰਹਿੰਦੇ ਹਨ।
  • ਇਹ ਸਸਤਾ ਹੈ।
  • ਇਹ ਤੁਰੰਤ ਅਪਡੇਟ ਹੁੰਦਾ ਹੈ।
  • ਇਹ ਸਰੋਤਾਂ (sources) ਦਾ ਹਵਾਲਾ ਦਿੰਦਾ ਹੈ।

Fine-tuning ਇਹ ਇੱਕ ਨਵੀਂ ਆਦਤ ਨੂੰ ਅੰਦਰੂਨੀ ਰੂਪ ਦੇਣ ਵਾਂਗ ਹੈ। ਤੁਸੀਂ ਮਾਡਲ ਨੂੰ ਖਾਸ ਉਦਾਹਰਣਾਂ 'ਤੇ ਟ੍ਰੇਨ ਕਰਦੇ ਹੋ।

  • ਇਸਦੀ ਵਰਤੋਂ ਵਿਵਹਾਰ ਲਈ ਕਰੋ।
  • ਇਸਦੀ ਵਰਤੋਂ ਲਹਿਜੇ (tone) ਅਤੇ ਫਾਰਮੈਟ ਲਈ ਕਰੋ।
  • ਇਸਦੀ ਵਰਤੋਂ ਸੀਮਤ ਹੁਨਰਾਂ ਲਈ ਕਰੋ।
  • ਇਸ ਲਈ ਇੱਕ ਟ੍ਰੇਨਿੰਗ ਰਨ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।
  • ਇਸ ਲਈ ਚੁਣਵੇਂ ਉਦਾਹਰਣਾਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।
  • ਤੱਥ ਬਦਲਣ ਨਾਲ ਇਹ ਪੁਰਾਣਾ ਹੋ ਜਾਂਦਾ ਹੈ।

ਕਿਵੇਂ ਚੁਣਨਾ ਹੈ: ਆਪਣੇ ਆਪ ਨੂੰ ਪੁੱਛੋ ਕਿ ਕੀ ਤੁਹਾਨੂੰ ਕਿਸੇ ਤੱਥ ਦੀ ਲੋੜ ਹੈ ਜਾਂ ਵਿਵਹਾਰ ਦੇ ਤਰੀਕੇ ਦੀ।

RAG ਦੀ ਵਰਤੋਂ ਕਰੋ ਜੇਕਰ ਤੁਹਾਨੂੰ ਅਪਡੇਟ ਕਰਨ ਦੀ ਲੋੜ ਹੈ:

  • ਉਤਪਾਦ ਕੈਟਾਲਾਗ (Product catalogs)।
  • ਕੰਪਨੀ ਦੀਆਂ ਨੀਤੀਆਂ।
  • ਰੋਜ਼ਾਨਾ ਦੀਆਂ ਖ਼ਬਰਾਂ।

Fine-tuning ਦੀ ਵਰਤੋਂ ਕਰੋ ਜੇਕਰ ਤੁਹਾਨੂੰ ਲੋੜ ਹੈ:

  • ਇੱਕ ਖਾਸ ਬ੍ਰਾਂਡ ਵੌਇਸ (brand voice)।
  • ਇੱਕ ਸਖ਼ਤ JSON ਆਊਟਪੁੱਟ ਫਾਰਮੈਟ।

ਸਭ ਤੋਂ ਵਧੀਆ ਪਹੁੰਚ ਅਕਸਰ ਦੋਵਾਂ ਦਾ ਸੁਮੇਲ ਹੁੰਦੀ ਹੈ। ਮਾਡਲ ਕਿਵੇਂ ਜਵਾਬ ਦਿੰਦਾ ਹੈ, ਉਸ ਲਈ fine-tune ਕਰੋ। ਇਹ ਕਿਹੜੇ ਤੱਥਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ, ਉਸ ਲਈ RAG ਦੀ ਵਰਤੋਂ ਕਰੋ। ਇੱਕ ਸਪੋਰਟ ਬੋਟ ਪੇਸ਼ੇਵਰ ਲੱਗਣ ਲਈ fine-tuning ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ ਅਤੇ ਤਾਜ਼ਾ ਮਦਦ ਲੇਖਾਂ (help articles) ਤੱਕ ਪਹੁੰਚਣ ਲਈ RAG ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ।

ਪ੍ਰੋਂਪਟਿੰਗ ਅਤੇ RAG ਨਾਲ ਸ਼ੁਰੂਆਤ ਕਰੋ। Fine-tuning ਵੱਲ ਉਦੋਂ ਹੀ ਵਧੋ ਜਦੋਂ ਬਹੁਤ ਜ਼ਰੂਰੀ ਹੋਵੇ।

ਇਹਨਾਂ ਸਥਿਤੀਆਂ (scenarios) ਦਾ ਇੱਥੇ ਟੈਸਟ ਕਰੋ: https://dev48v.infy.uk/ai/days/day10-finetune-vs-rag.html

ਸਰੋਤ: https://dev.to/dev48v/fine-tuning-vs-rag-two-ways-to-teach-an-llm-3d04

ਵਿਕਲਪਿਕ ਲਰਨਿੰਗ ਕਮਿਊਨਿਟੀ: https://t.me/GyaanSetuAi