அனைவரும் நகலெடுத்த OpenAI API அவர்கள் பரிந்துரைக்கும் ஒன்று அல்ல

Ollama, vLLM மற்றும் LM Studio போன்ற பெரும்பாலான உள்ளூர் மாடல் கருவிகள் "OpenAI-compatible" என்ற அடையாளத்தைப் பயன்படுத்துகின்றன.

ஆனால் இதில் ஒரு சிக்கல் உள்ளது. பெரும்பாலான மக்கள் இது ஒரு குறிப்பிட்ட விஷயத்தைக் குறிக்கிறது என்று நினைக்கிறார்கள். உண்மையில், இதில் இரண்டு வெவ்வேறு வடிவங்கள் உள்ளன. ஒன்று தொழில்துறை தரநிலை (industry standard). மற்றொன்று OpenAI உண்மையில் நீங்கள் பயன்படுத்த வேண்டும் என்று விரும்பும் வடிவம்.

அதன் விவரங்கள் இதோ.

பழைய தரநிலை: Chat Completions API

இதுதான் அனைவரும் நகலெடுத்த வடிவம். இது developer, user மற்றும் assistant போன்ற பாத்திரங்களைக் (roles) கொண்ட செய்திகளின் பட்டியலைப் பயன்படுத்துகிறது.

இதில் இரண்டு முக்கிய சிக்கல்கள் உள்ளன:

  • இது stateless (நிலைத்தன்மையற்றது). ஒவ்வொரு முறையும் முழு உரையாடல் வரலாற்றையும் நீங்கள் மீண்டும் அனுப்ப வேண்டும்.
  • இது அதிக சுமை கொண்டது (heavy). சிக்கலான ஏஜென்ட்களுக்கு (agents), மிகப்பெரிய உரையாடல் பதிவுகளை அனுப்புவது மெதுவாகவும் செலவு மிகுந்ததாகவும் மாறும்.

புதிய தரநிலை: Responses API

OpenAI இதை மார்ச் 2025 இல் அறிமுகப்படுத்தியது. இது வெறும் சாதாரண சாட்பாட்களுக்கு (chatbots) மட்டுமல்லாமல், ஏஜென்ட்களுக்காகவே (agents) வடிவமைக்கப்பட்டுள்ளது.

ஏன் இது சிறந்தது:

  • இது stateful (நிலைத்தன்மை கொண்டது). சர்வர் உரையாடலை நினைவில் வைத்திருக்கும். நீங்கள் அனைத்தையும் மீண்டும் அனுப்ப வேண்டிய அவசியமில்லை.
  • இது தர்க்கரீதியான சிந்தனையை (reasoning) சிறப்பாகக் கையாள்கிறது. இது மாடலின் "chain of thought"-ஐ சர்வரிலேயே வைத்திருக்கும்.
  • இது தெளிவான கட்டமைப்பைப் பயன்படுத்துகிறது. இது அறிவுறுத்தல்களை (instructions) பயனரின் உண்மையான உள்ளீட்டிலிருந்து (user input) பிரிக்கிறது.

குழப்பம்

ஒரு கருவி தன்னை "OpenAI-compatible" என்று கூறினால், அது பெரும்பாலும் பழைய Chat Completions வடிவத்தையே ஆதரிக்கிறது என்று அர்த்தம்.

தொழில்துறை இந்த பழைய வடிவத்தைச் சுற்றியே ஒரு மிகப்பெரிய சூழலை (ecosystem) உருவாக்கியுள்ளது. இது எல்லா இடங்களிலும் இருந்ததால், இதுவே இயல்புநிலையாக (default) மாறிவிட்டது. இது ஒரு தனி நிறுவனத்தின் தனிப்பட்ட API-ன் நகல்களை (clones) அனைவரும் உருவாக்குவது போன்ற ஒரு ஆபத்தை உருவாக்கியது.

தீர்வு: Open Responses

இதைச் சரிசெய்ய, OpenAI மற்றும் Hugging Face மற்றும் Vercel போன்ற கூட்டாளிகள் Open Responses விவரக்குறிப்பை (specification) அறிமுகப்படுத்தியுள்ளனர்.

ஒரு API எவ்வாறு செயல்படுகிறது என்று ஊகிப்பதற்குப் பதிலாக, டெவலப்பர்களுக்கு இப்போது ஆவணப்படுத்தப்பட்ட, சோதனை செய்யக்கூடிய ஒரு தரநிலை உள்ளது. இது மிகக் குறைந்த குறியீடு மாற்றங்களுடன் (code changes) OpenAI மற்றும் உள்ளூர் மாடல்களுக்கு இடையே மாற அனுமதிக்கிறது.

நீங்கள் செய்ய வேண்டியவை:

  • நீங்கள் ஒரு புதிய திட்டத்தை உருவாக்குகிறீர்கள் என்றால், Responses API-ஐப் பயன்படுத்தவும்.
  • நீங்கள் பழைய செயலிகளைப் பராமரிக்கிறீர்கள் என்றால், Chat Completions நீண்ட காலத்திற்குத் தொடர்ந்து ஆதரிக்கப்படும்.
  • செலவு மற்றும் தாமதத்தைக் (latency) குறைக்க, உங்கள் கருவி புதிய stateful வடிவத்தை ஆதரிக்கிறதா என்பதை எப்போதும் சரிபார்க்கவும்.

இந்த வித்தியாசத்தை அறிந்துகொள்வது டோக்கன் எண்ணிக்கை (token counting) மற்றும் செய்தி கட்டமைப்புகளில் (message structures) ஏற்படும் பிழைகளைத் தவிர்க்க உதவும்.

ஆதாரம்: https://dev.to/rlnorthcutt/the-openai-api-everyone-copied-isnt-the-one-openai-recommends-28o8

விருப்பமான கற்றல் சமூகம்: https://t.me/GyaanSetuAi