Reliable JSON From Any LLM

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial-4 h1min read

ਕਿਸੇ ਵੀ LLM ਤੋਂ ਭਰੋਸੇਮੰਦ JSON

ਜ਼ਿਆਦਾਤਰ ਡਿਵੈਲਪਰ ਉਮੀਦ ਕਰਦੇ ਹਨ ਕਿ ਉਹਨਾਂ ਦਾ LLM ਵੈਲਿਡ JSON ਆਊਟਪੁੱਟ ਦੇਵੇਗਾ। ਉਮੀਦ ਕਰਨਾ ਕੋਈ ਰਣਨੀਤੀ ਨਹੀਂ ਹੈ।

ਤੁਹਾਨੂੰ ਪ੍ਰੋਡਕਸ਼ਨ ਐਪਸ ਲਈ ਭਰੋਸੇਮੰਦ ਡੇਟਾ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਇਸ ਨੂੰ ਪ੍ਰਾਪਤ ਕਰਨ ਦੇ ਚਾਰ ਤਰੀਕੇ ਹਨ।

ਪਾਰਸਰ (parser) ਦੇ ਨਾਲ ਸਾਧਾਰਨ ਟੈਕਸਟ। ਇਹ ਅਕਸਰ ਫੇਲ ਹੋ ਜਾਂਦਾ ਹੈ।
JSON ਮੋਡ। ਇਹ ਮਦਦ ਕਰਦਾ ਹੈ ਪਰ ਫਿਰ ਵੀ ਖਰਾਬ ਹੋ ਸਕਦਾ ਹੈ।
ਫੰਕਸ਼ਨ ਜਾਂ ਟੂਲ ਕਾਲਿੰਗ (Function or tool calling)। ਇਹ ਬਿਹਤਰ ਹੈ।
ਕੰਸਟ੍ਰੇਂਡ ਡੀਕੋਡਿੰਗ (constrained decoding) ਦੇ ਨਾਲ ਨੇਟਿਵ ਸਟ੍ਰਕਚਰਡ ਆਊਟਪੁੱਟ। ਇਹ ਸਭ ਤੋਂ ਉੱਤਮ ਤਰੀਕਾ (gold standard) ਹੈ।

ਕੰਸਟ੍ਰੇਂਡ ਡੀਕੋਡਿੰਗ ਤੁਹਾਡੇ ਸਟ੍ਰਕਚਰ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਂਦੀ ਹੈ। ਇਹ ਕਿਸਮਤ 'ਤੇ ਨਿਰਭਰ ਨਹੀਂ ਕਰਦੀ।

ਇਹ ਕਿਵੇਂ ਕੰਮ ਕਰਦਾ ਹੈ: ਸਿਸਟਮ ਤੁਹਾਡੇ schema ਨੂੰ ਇੱਕ grammar ਵਿੱਚ ਕੰਪਾਈਲ ਕਰਦਾ ਹੈ। ਇਹ ਇੱਕ finite-state machine ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। ਹਰ ਕਦਮ 'ਤੇ, ਸਿਸਟਮ ਉਹਨਾਂ tokens ਨੂੰ ਮਾਸਕ (mask) ਕਰ ਦਿੰਦਾ ਹੈ ਜੋ ਤੁਹਾਡੇ ਨਿਯਮਾਂ ਨੂੰ ਤੋੜਦੇ ਹਨ। ਮਾਡਲ ਅਜਿਹਾ token ਨਹੀਂ ਚੁਣ ਸਕਦਾ ਜੋ ਸਟ੍ਰਕਚਰ ਨੂੰ ਖਰਾਬ ਕਰੇ। ਆਊਟਪੁੱਟ ਵੈਲਿਡ ਰਹਿੰਦਾ ਹੈ।

ਮੁੱਖ ਪ੍ਰਦਾਤਾ ਹੁਣ ਇਸਦਾ ਸਮਰਥਨ ਕਰਦੇ ਹਨ:

OpenAI: Structured Outputs
Google Gemini: responseSchema
Anthropic: Structured Outputs beta
Open source: vLLM, Hugging Face TGI, llama.cpp, Outlines, and Instructor

ਆਪਣੇ ਕੋਡ ਵਿੱਚ JSON ਗਲਤੀਆਂ ਨੂੰ ਸੁਧਾਰਨਾ ਬੰਦ ਕਰੋ। ਉਹਨਾਂ ਨੂੰ ਰੋਕਣ ਲਈ ਕੰਸਟ੍ਰੇਂਡ ਡੀਕੋਡਿੰਗ ਦੀ ਵਰਤੋਂ ਕਰੋ।

ਹੇਠਾਂ AI Tech Connect 'ਤੇ ਪੂਰਾ ਲੇਖ ਪੜ੍ਹੋ।

Source: https://dev.to/rishi_kora/reliable-json-from-any-llm-constrained-decoding-in-production-8an

Optional learning community: https://t.me/GyaanSetuAi

Reliable JSON From Any LLM

Continue reading

𝗢𝗹𝗹𝗮𝗺𝗮 𝗦𝘁𝗿𝘂𝗰𝘁𝘂𝗿𝗲𝗱 𝗢𝘂𝘁𝗽𝘂𝘁𝘀 𝗜𝗻 𝗣𝗿𝗮𝗰𝘁𝗶𝗰𝗲

𝗧𝗵𝗲 𝗩𝗮𝗹𝗶𝗱𝗮𝘁𝗶𝗼𝗻 𝗦𝘁𝗲𝗽: 𝗛𝗼𝘄 𝘁𝗼 𝗧𝗲𝘀𝘁 𝗮𝗻𝗱 𝗩𝗲𝗿𝗶𝗳𝘆 𝗔𝗜 𝗚𝗲𝗻𝗲𝗿𝗮𝘁𝗲𝗱 𝗖𝗼𝗱𝗲 𝗪𝗶𝘁𝗵

LLM ਪ੍ਰੋਂਪਟਿੰਗ ਵਿੱਚ ਮੁਹਾਰਤ: ਇੱਕ ਡਿਵੈਲਪਰ ਲਈ ਗਾਈਡ

𝗗𝗲 𝗺𝘆𝘀𝘁𝗶𝗳𝘆𝗶𝗻𝗴 𝘁𝗵𝗲 𝗚𝗲𝗻𝗔𝗜 𝗦𝘁𝗮𝗰𝗸

𝗙𝗿𝗼𝗺 𝗥𝗲𝗴𝗲𝘅 𝘁𝗼 𝗟𝗟𝗠𝘀: 𝗠𝘆 𝗝𝗼𝘂𝗿𝗻𝗲𝘆 𝗘𝘅𝘁𝗿𝗮𝗰𝘁𝗶𝗻𝗴 𝗨𝗻𝘀𝘁𝗿𝘂𝗰𝘁𝘂𝗿𝗲𝗱 𝗪𝗲𝗯 𝗗𝗮𝘁𝗮