੨੦੨੬ ਵਿੱਚ ਸਮਾਲ ਲੈਂਗੂਏਜ ਮਾਡਲ (Small Language Models): ਵੱਡੇ API ਨੂੰ ਕਦੋਂ ਛੱਡਣਾ ਹੈ
AI ਉਦਯੋਗ ਨੇ ਸਾਲਾਂ ਤੱਕ ਵੱਡੇ ਮਾਡਲਾਂ ਅਤੇ ਮਹਿੰਗੇ APIs ਦੇ ਪਿੱਛੇ ਸਮਾਂ ਬਿਤਾਇਆ। 2026 ਵਿੱਚ, ਰੁਝਾਨ ਬਦਲ ਗਿਆ ਹੈ। ਪ੍ਰੋਡਕਸ਼ਨ ਸਿਸਟਮ ਹੁਣ ਛੋਟੇ, ਵਿਸ਼ੇਸ਼ ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ। ਇਹ ਮਾਡਲ ਤੇਜ਼ੀ ਨਾਲ ਚੱਲਦੇ ਹਨ ਅਤੇ ਇਹਨਾਂ ਦੀ ਲਾਗਤ ਵੀ ਘੱਟ ਹੁੰਦੀ ਹੈ।
ਇੰਜੀਨੀਅਰ ਹੁਣ ਇਹ ਨਹੀਂ ਪੁੱਛਦੇ ਕਿ ਸਭ ਤੋਂ ਸ਼ਕਤੀਸ਼ਾਲੀ ਮਾਡਲ ਤੱਕ ਪਹੁੰਚ ਕਿਵੇਂ ਪ੍ਰਾਪਤ ਕੀਤੀ ਜਾਵੇ। ਉਹ ਇਹ ਪੁੱਛਦੇ ਹਨ ਕਿ ਕੀ ਉਹਨਾਂ ਨੂੰ ਅਸਲ ਵਿੱਚ ਇਸਦੀ ਲੋੜ ਹੈ।
ਜ਼ਿਆਦਾਤਰ ਪ੍ਰੋਡਕਸ਼ਨ ਕੰਮ ਦੁਹਰਾਉਣਯੋਗ ਹੁੰਦੇ ਹਨ। ਤੁਹਾਨੂੰ ਇਹਨਾਂ ਲਈ ਅਤਿ-ਆਧੁਨਿਕ (frontier) ਬੁੱਧੀ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ:
- ਵਰਗੀਕਰਨ (Classification)
- ਜਾਣਕਾਰੀ ਕੱਢਣਾ (Information extraction)
- ਸਾਰ (Summarization)
- ਸਮੱਗਰੀ ਮੋਡਰੇਸ਼ਨ (Content moderation)
- ਰੂਟਿੰਗ ਫੈਸਲੇ (Routing decisions)
- FAQ ਤਿਆਰ ਕਰਨਾ (FAQ generation)
- ਸੰਰਚਿਤ ਆਉਟਪੁੱਟ (Structured outputs)
ਇਹਨਾਂ ਕੰਮਾਂ ਲਈ ਰਫ਼ਤਾਰ, ਘੱਟ ਲਾਗਤ ਅਤੇ ਪ੍ਰਾਈਵੇਸੀ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਸਮਾਲ ਲੈਂਗੂਏਜ ਮਾਡਲ ਇੱਥੇ ਬਿਹਤਰ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦੇ ਹਨ।
ਦੋਵਾਂ ਤਰੀਕਿਆਂ ਦੀ ਤੁਲਨਾ ਕਰੋ:
ਇਨਫਰੈਂਸ ਲਾਗਤ (Inference Cost):
- ਛੋਟੇ ਮਾਡਲ: ਬਹੁਤ ਘੱਟ
- ਵੱਡੇ ਮਾਡਲ: ਉੱਚੀ
ਲੇਟੈਂਸੀ (Latency):
- ਛੋਟੇ ਮਾਡਲ: ਘੱਟ
- ਵੱਡੇ ਮਾਡਲ: ਦਰਮਿਆਨੀ ਤੋਂ ਉੱਚੀ
ਹਾਰਡਵੇਅਰ (Hardware):
- ਛੋਟੇ ਮਾਡਲ: ਕੰਜ਼ਿਊਮਰ GPUs ਜਾਂ ਐਜ ਡਿਵਾਈਸਾਂ
- ਵੱਡੇ ਮਾਡਲ: ਹਾਈ-ਐਂਡ ਕਲਾਉਡ ਇਨਫਰਾਸਟ੍ਰਕਚਰ
ਪ੍ਰਾਈਵੇਸੀ (Privacy):
- ਛੋਟੇ ਮਾਡਲ: ਆਸਾਨ ਸਥਾਨਕ ਤੈਨਾਤੀ (local deployment)
- ਵੱਡੇ ਮਾਡਲ: ਆਮ ਤੌਰ 'ਤੇ ਕਲਾਉਡ APIs ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ
ਜ਼ਿਆਦਾਤਰ ਐਪਲੀਕੇਸ਼ਨਾਂ ਨੂੰ ਇੱਕ ਟਿਕਾਊ ਲਾਗਤ 'ਤੇ ਲੋੜੀਂਦੀ ਬੁੱਧੀ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਛੋਟੇ ਮਾਡਲ ਇਹਨਾਂ ਲਈ ਸਭ ਤੋਂ ਵਧੀਆ ਕੰਮ ਕਰਦੇ ਹਨ:
- ਅੰਦਰੂਨੀ ਐਂਟਰਪ੍ਰਾਈਜ਼ ਸਹਾਇਕ (Internal enterprise assistants)
- ਦਸਤਾਵੇਜ਼ ਪ੍ਰੋਸੈਸਿੰਗ ਪਾਈਪਲਾਈਨਾਂ (Document processing pipelines)
- ਮੋਬਾਈਲ ਅਤੇ ਐਂਬੈਡਡ ਐਪਲੀਕੇਸ਼ਨਾਂ (Mobile and embedded applications)
ਸਥਾਨਕ ਤੌਰ 'ਤੇ ਇਨਫਰੈਂਸ ਚਲਾਉਣ ਨਾਲ ਲਗਭਗ ਜ਼ੀਰੋ ਲੇਟੈਂਸੀ ਅਤੇ ਆਫਲਾਈਨ ਕੰਮ ਕਰਨ ਦੀ ਸਹੂਲਤ ਮਿਲਦੀ ਹੈ। ਇਹ ਡੇਟਾ ਨੂੰ ਵੀ ਨਿੱਜੀ ਰੱਖਦਾ ਹੈ।
ਸਮਾਰਟ ਟੀਮਾਂ ਰੂਟਿੰਗ ਰਣਨੀਤੀ (routing strategy) ਦੀ ਵਰਤੋਂ ਕਰਦੀਆਂ ਹਨ। ਉਹ ਮੁਸ਼ਕਲ ਬੇਨਤੀਆਂ ਨੂੰ ਮਹਿੰਗੇ ਮਾਡਲਾਂ ਕੋਲ ਭੇਜਦੇ ਹਨ। ਉਹ ਸਧਾਰਨ ਕੰਮਾਂ ਨੂੰ ਸਥਾਨਕ ਰੱਖਦੇ ਹਨ। ਇਹ ਲਾਗਤ ਨੂੰ ਘਟਾਉਂਦਾ ਹੈ ਅਤੇ ਤੁਹਾਨੂੰ ਆਪਣੇ ਡੇਟਾ 'ਤੇ ਕੰਟਰੋਲ ਦਿੰਦਾ ਹੈ।
ਵਿਸ਼ੇਸ਼ ਮਾਡਲ ਵੀ ਬਿਹਤਰ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦੇ ਹਨ। ਇੱਕ ਗਾਹਕ ਸਹਾਇਤਾ ਸਹਾਇਕ ਨੂੰ ਕੁਆਂਟਮ ਮਕੈਨਿਕਸ ਜਾਣਨ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ। ਇਸਨੂੰ ਤੁਹਾਡੀਆਂ ਰਿਫੰਡ ਨੀਤੀਆਂ ਅਤੇ ਸ਼ਿਪਿੰਗ ਪ੍ਰਕਿਰਿਆਵਾਂ ਜਾਣਨ ਦੀ ਲੋੜ ਹੈ। ਇਹਨਾਂ ਸੀਮਤ ਖੇਤਰਾਂ ਵਿੱਚ ਇੱਕ ਫਾਈਨ-ਟਿਊਨਡ (fine-tuned) ਛੋਟਾ ਮਾਡਲ ਅਕਸਰ ਇੱਕ ਆਮ ਵੱਡੇ ਮਾਡਲ ਨਾਲੋਂ ਬਿਹਤਰ ਹੁੰਦਾ ਹੈ।
ਤੁਹਾਨੂੰ ਅਜੇ ਵੀ ਵੱਡੇ APIs ਦੀ ਵਰਤੋਂ ਕਦੋਂ ਕਰਨੀ ਚਾਹੀਦੀ ਹੈ?
- ਉੱਨਤ ਮਲਟੀ-ਸਟੈਪ ਤਰਕ (Advanced multi-step reasoning)
- ਬਹੁਤ ਜ਼ਿਆਦਾ ਅਸਪਸ਼ਟ ਕੰਮ (Highly ambiguous tasks)
- ਵਿਸ਼ਾਲ ਵਿਸ਼ਵ ਗਿਆਨ (Broad world knowledge)
- ਤੇਜ਼ ਪ੍ਰਯੋਗ (Rapid experimentation)
ਟੀਚਾ ਹਰ LLM ਨੂੰ ਬਦਲਣਾ ਨਹੀਂ ਹੈ। ਟੀਚਾ ਉਹਨਾਂ ਕੰਮਾਂ ਲਈ ਫਰੰਟੀਅਰ ਮਾਡਲ ਦੀ ਵਰਤੋਂ ਕਰਨ ਤੋਂ ਬਚਣਾ ਹੈ ਜੋ ਲਾਗਤ ਨੂੰ ਜਾਇਜ਼ ਨਹੀਂ ਠਹਿਰਾਉਂਦੇ।
ਉਸ ਬੁੱਧੀ ਲਈ ਭੁਗਤਾਨ ਕਰਨਾ ਬੰਦ ਕਰੋ ਜਿਸਦੀ ਤੁਸੀਂ ਵਰਤੋਂ ਨਹੀਂ ਕਰਦੇ। ਛੋਟੇ ਮਾਡਲਾਂ ਵੱਲ ਜਾਣਾ ਕੋਈ ਸਮਝੌਤਾ ਨਹੀਂ ਹੈ। ਇਹ ਵਧੀਆ ਇੰਜੀਨੀਅਰਿੰਗ ਹੈ।
ਸਰੋਤ: https://dev.to
