ਮਾਡਲ ਉਤਪਾਦ ਨਹੀਂ ਹੈ। ਅਸਲ ਵਿੱਚ ਉਤਪਾਦ ਕੀ ਹੈ, ਇੱਥੇ ਜਾਣੋ।

ਮੈਂ ਆਪਣਾ ਸਮਾਂ AI ਲਾਂਚ ਕਰਨ ਵਾਲੇ ਇੰਜੀਨੀਅਰਾਂ ਨਾਲ ਗੱਲਬਾਤ ਕਰਨ ਅਤੇ ਉਹਨਾਂ ਦੇ ਕੰਮ ਵਿੱਚ ਮਦਦ ਕਰਨ ਵਿੱਚ ਬਿਤਾਉਂਦਾ ਹਾਂ। ਡੈਮੋ (demos) ਅਤੇ ਅਸਲ ਪ੍ਰੋਡਕਸ਼ਨ ਸਿਸਟਮਾਂ ਵਿਚਕਾਰ ਇੱਕ ਵੱਡਾ ਫਰਕ ਹੈ। ਬਹੁਤ ਸਾਰੇ ਲੋਕ ਇਸ ਫਰਕ ਬਾਰੇ ਇਮਾਨਦਾਰ ਨਹੀਂ ਹਨ।

ਹਰ ਕੋਈ ਹਰ ਚੀਜ਼ ਨੂੰ 'ਏਜੰਟ' (agent) ਕਹਿੰਦਾ ਹੈ। ਇੱਕ ਲੂਪ (loop) ਵਾਲੀ ਸਕ੍ਰਿਪਟ ਇੱਕ ਏਜੰਟ ਹੈ। ਮੈਮੋਰੀ ਵਾਲਾ ਇੱਕ ਚੈਟਬੋਟ ਇੱਕ ਏਜੰਟ ਹੈ। ਇਸ ਨਾਲ ਇੰਜੀਨੀਅਰਿੰਗ ਵਿੱਚ ਗਲਤੀਆਂ ਹੁੰਦੀਆਂ ਹਨ। ਤੁਸੀਂ ਸਧਾਰਨ ਕੰਮਾਂ ਲਈ ਬਹੁਤ ਜ਼ਿਆਦਾ ਇੰਜੀਨੀਅਰਿੰਗ ਕਰਦੇ ਹੋ ਅਤੇ ਗੁੰਝਲਦਾਰ ਕੰਮਾਂ ਲਈ ਬਹੁਤ ਘੱਟ।

ਇੱਕ ਏਜੰਟ ਲਈ ਇੱਕ ਉਦੇਸ਼ (objective) ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਇਹ ਸਿਰਫ਼ ਇੱਕ ਨਿਰਦੇਸ਼ ਦੀ ਪਾਲਣਾ ਨਹੀਂ ਕਰਦਾ। ਇੱਕ ਏਜੰਟ ਫੈਸਲਾ ਕਰਦਾ ਹੈ ਕਿ ਅੱਗੇ ਕੀ ਕਰਨਾ ਹੈ। ਇਹ ਅਸਫਲਤਾਵਾਂ (failures) ਨੂੰ ਸੰਭਾਲਦਾ ਹੈ। ਇਸਨੂੰ ਪਤਾ ਹੁੰਦਾ ਹੈ ਕਿ ਕੰਮ ਕਦੋਂ ਖਤਮ ਹੋ ਗਿਆ ਹੈ।

ਅਸਲੀ ਏਜੰਟ ਡਿਪਲੋਇਮੈਂਟਸ (deployments) ਸੀਮਤ ਹੁੰਦੇ ਹਨ। ਉਹ ਇੱਕ ਚੀਜ਼ ਨੂੰ ਚੰਗੀ ਤਰ੍ਹਾਂ ਕਰਦੇ ਹਨ, ਜਿਵੇਂ ਕਿ ਡੌਕੂਮੈਂਟ ਐਕਸਟਰੈਕਸ਼ਨ (document extraction) ਜਾਂ ਕੋਡ ਰਿਵਿਊ (code review)। ਸਫਲ ਟੀਮਾਂ ਨਵੇਂ ਮਾਡਲਾਂ ਦੇ ਪਿੱਛੇ ਨਹੀਂ ਭੱਜਦੀਆਂ। ਉਹ ਇਹਨਾਂ ਤਿੰਨ ਖੇਤਰਾਂ 'ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰਦੀਆਂ ਹਨ:

LangChain ਜਾਂ CrewAI ਵਰਗੇ ਫਰੇਮਵਰਕਸ (frameworks) ਪੈਟਰਨਾਂ ਨਾਲੋਂ ਘੱਟ ਮਹੱਤਵਪੂਰਨ ਹਨ। ਫਰੇਮਵਰਕ ਸਿਰਫ਼ ਇੱਕ ਢਾਂਚਾ (scaffolding) ਹੈ। ਆਰਕੀਟੈਕਚਰ (architecture) ਅਸਲ ਇਮਾਰਤ ਹੈ।

ਇਹਨਾਂ ਪੈਟਰਨਾਂ ਦੀ ਵਰਤੋਂ ਕਰੋ:

RAG ਇੱਕ ਸਟੈਂਡਰਡ ਹੈ, ਪਰ ਚੰਕਿੰਗ (chunking) ਅਕਸਰ ਗਲਤ ਹੁੰਦੀ ਹੈ। ਜੇਕਰ ਤੁਸੀਂ ਡੌਕੂਮੈਂਟਸ ਨੂੰ ਗਲਤ ਤਰੀਕੇ ਨਾਲ ਵੰਡਦੇ ਹੋ, ਤਾਂ ਮਾਡਲ ਕੰਟੈਕਸਟ ਗੁਆ ਲੈਂਦਾ ਹੈ ਅਤੇ ਹੈਲੂਸੀਨੇਟ (hallucinates) ਕਰਦਾ ਹੈ। ਜੇਕਰ ਤੁਹਾਡੇ RAG ਨਤੀਜੇ ਬੇਕਾਰ ਹਨ, ਤਾਂ ਆਪਣੀ ਚੰਕਿੰਗ ਅਤੇ ਮੈਟਾਡਾਟਾ (metadata) ਨੂੰ ਠੀਕ ਕਰੋ। ਐਮਬੈਡਿੰਗ ਮਾਡਲ (embedding model) ਨੂੰ ਦੋਸ਼ ਨਾ ਦਿਓ।

ਮਾਡਲ ਬਿਹਤਰ ਹੁੰਦੇ ਜਾਣਗੇ। ਕੰਟੈਕਸਟ ਵਿੰਡੋਜ਼ (context windows) ਵਧਣਗੀਆਂ। ਲਾਗਤਾਂ ਘਟਣਗੀਆਂ। ਇਹ ਇੰਜੀਨੀਅਰਿੰਗ ਦੀ ਚੁਣੌਤੀ ਨੂੰ ਨਹੀਂ ਬਦਲਦਾ। ਤੁਹਾਨੂੰ ਅਜਿਹੇ ਸਿਸਟਮ ਬਣਾਉਣੇ ਚਾਹੀਦੇ ਹਨ ਜਿਨ੍ਹਾਂ 'ਤੇ ਤੁਸੀਂ ਉਦੋਂ ਵੀ ਭਰੋਸਾ ਕਰ ਸਕੋ ਜਦੋਂ ਤੁਸੀਂ ਉਹਨਾਂ ਦੀ ਨਿਗਰਾਨੀ ਨਹੀਂ ਕਰ ਰਹੇ ਹੁੰਦੇ।

ਗਵਰਨੈਂਸ (governance), ਅਬਜ਼ਰਵੇਬਿਲਟੀ (observability), ਅਤੇ ਟੂਲ ਦੀ ਵਰਤੋਂ 'ਤੇ ਧਿਆਨ ਦਿਓ। ਉਹ ਇੰਜੀਨੀਅਰ ਮਹੱਤਵਪੂਰਨ ਹੋਣਗੇ ਜੋ ਸਿਰਫ਼ ਪ੍ਰੋਂਪਟ ਇੰਜੀਨੀਅਰਿੰਗ (prompt engineering) ਹੀ ਨਹੀਂ, ਸਗੋਂ ਸਿਸਟਮ ਡਿਜ਼ਾਈਨ (systems design) ਵਿੱਚ ਮਾਹਰ ਹੋਣਗੇ।

ਸਰੋਤ: https://dev.to/aibughunter/the-model-is-not-the-product-heres-what-actually-is-52b5