मी एक वैयक्तिक AI सुपर-ॲप कसे तयार केले

मी इतर सर्वांप्रमाणेच कित्येक महिने Codex वापरले. मी एक टर्मिनल आणि एक लांब आउटपुट सेशन वापरत होतो. मग मला codex app-server सापडले. हे इंजिन stdio वरून Codex ला JSON-RPC म्हणून उपलब्ध करून देते.

या शोधामुळे मला एक कल्पना सुचली. मी माझ्या विशिष्ट कामासाठी स्वतःचे इंटरफेस तयार करू शकतो.

OpenAI म्हणते की खरे AI सुपर-ॲप ही अशी जागा आहे जिथे एजंट्स, टूल्स आणि हिस्ट्री एकत्र असतात. तुम्ही चॅट, टर्मिनल आणि ब्राउझर यांच्यामध्ये इकडून तिकडे उड्या मारू नयेत. सर्व काही एकाच ठिकाणी घडले पाहिजे.

मी Codex ला वेढणारे (wraps) एक डेस्कटॉप ॲप तयार केले. ते अनेक गोष्टी करते:

  • एकाच वेळी ग्रिडमध्ये अनेक एजंट सेशन्स चालवते.
  • एजंटला दिसण्यापूर्वी माझ्या प्रॉम्प्ट्समध्ये सुधारणा करते.
  • एजंटचे आउटपुट साध्या भाषेत स्पष्ट करते.
  • एका क्लिकवर सब-एजंट्स (sub-agents) तयार करते.

मी कोणत्याही उत्पादनाची योजना आखली नव्हती. मी माझ्या स्वतःच्या अडचणींचे ऑटोमेशन केले. जोपर्यंत हे रॅपर माझे मुख्य वर्कस्पेस बनले नाही, तोपर्यंत मी एका वेळी एक समस्या सोडवत गेलो.

तुम्ही देखील हे करू शकता. बहुतेक लोक Codex चा वापर टर्मिनलमध्ये चॅट म्हणून करतात. परंतु, बायनरीमध्ये एक लपलेला मोड आहे: codex app-server. हे CLI ला सर्व्हरमध्ये रूपांतरित करते.

काहीतरी ठोस तयार करण्यासाठी तुम्हाला फक्त काही कमांड्सची गरज आहे:

  • thread/start: एक सेशन उघडा.
  • turn/start: त्याला काम द्या.
  • turn/steer: चालू असलेल्या टर्नला संदेश पाठवा.

माझे मुख्य उद्दिष्ट साधे होते. मला एक नवीन Codex इन्स्टन्स (instance) तयार करण्यासाठी एक बटण हवे होते. हा नवीन इन्स्टन्स माझा सध्याचा कॉन्टेक्स्ट (context) वारसा म्हणून घेतो. यामुळे माझे मुख्य सेशन लक्ष केंद्रित करत असतानाच तो समांतर कल्पनांचा पाठलाग करू शकतो.

मी सब-एजंटला ब्रीफिंग देतो. यामध्ये प्रोजेक्टचे नाव, वर्किंग डिरेक्टरी आणि पेरेंट टाइमलाइनचा स्नॅपशॉट समाविष्ट असतो. मी सब-एजंटला हे देखील सांगतो की पेरेंट सेशन अजूनही रिपॉझिटरीमध्ये काम करत आहे. यामुळे सब-एजंटकडून काही गोष्टी बिघडवल्या जाण्यापासून बचाव होतो.

हे ॲप 'सोर्स ऑफ ट्रुथ' (source of truth) म्हणून टाइमलाइनचा वापर करते. प्रत्येक मेसेज, कमांड आणि फाईल मधील बदल या टाइमलाइनमधील एक इव्हेंट बनतो. यामुळे विविध फीचर्सना तोच डेटा शेअर करता येतो.

मी एक ट्रान्सलेशन लेयर देखील जोडला आहे. Codex कोड कार्यान्वित करते, परंतु Claude निकालांचे भाषांतर करते. Claude माझ्या विस्कळीत कल्पनांना अचूक प्रॉम्प्ट्समध्ये रूपांतरित करते. ते रॉ (raw) Codex लॉग्सचे सोप्या स्पष्टीकरणातही रूपांतर करते.

एक मॉडेल कार्यान्वित करते. दुसरे मॉडेल भाषांतर करते. हे रॅपर या संपूर्ण लूपला एकत्र धरून ठेवते.

जर तुम्हाला तुमचे स्वतःचे तयार करायचे असेल, तर या पायऱ्या फॉलो करा:

  • तुमच्या वर्कफ्लोमधील एखाद्या अडचणीपासून सुरुवात करा.
  • codex app-server सुरू करा.
  • JSON-RPC द्वारे त्याच्याशी संवाद साधा.
  • एखादी वारंवार केली जाणारी कृती निवडा आणि त्याचे बटणमध्ये रूपांतर करा.

सुपर-अॅप अवाढव्य असणे आवश्यक नाही. ते एक असे छोटे साधन असू शकते जे काल तुम्हाला भेडसावलेल्या समस्येवर उपाय शोधते.

स्त्रोत: https://dev.to/cloudx/how-i-built-a-personal-ai-super-app-by-wrapping-codex-app-server-5fp6

ऐच्छिक लर्निंग कम्युनिटी: https://t.me/GyaanSetuAi