𝗛𝗮𝗿𝗻𝗲𝘀𝘀 𝗘𝗻𝗴𝗶𝗻𝗲𝗲𝗿𝗶𝗻𝗴 𝗛𝗮𝘀 𝗡𝗼 𝗙𝗶𝘅𝗲𝗱 𝗔𝗱𝗱𝗿𝗲𝘀𝘀

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial۱۶ ساعت پیش2min read

مهندسی چارچوب (Harness Engineering) آدرس ثابتی ندارد

مهندسی چارچوب، مکانی در پشته نرم‌افزاری (software stack) شما نیست؛ بلکه ویژگی کد شماست.

بسیاری فکر می‌کنند چارچوب صرفاً یک پوشش (wrapper) دور یک مدل هوش مصنوعی است. این اشتباه است. چارچوب همان چیزی است که یک مدل را برای کسب‌وکارهای واقعی کاربردی می‌کند.

من از یک فرمول ساده استفاده می‌کنم: عامل = مدل × چارچوب.

مدل، موتور است. چارچوب، فرمان، ترمز و حفاظ‌های ایمنی است.

اما مشکل اینجاست: مدل مدام در حال رشد است. هر نسخه جدید از مدل، بخش‌هایی از چارچوب را در خود جذب می‌کند.

مدل‌های استدلالی (Reasoning models) اکنون منطق زنجیره تفکر (chain-of-thought) را مدیریت می‌کنند.
مدل‌های بهتر، استفاده از ابزار را به‌صورت بومی (natively) انجام می‌دهند.
پنجره‌های بافت (context windows) طولانی، جایگزین سیستم‌های حافظه قدیمی می‌شوند.

اگر مدل، چارچوب را ببلعد، چه چیزی برای ساختن باقی می‌ماند؟

بخش‌هایی که از بین می‌روند، بخش‌های مکانیکی هستند. حلقه‌ها، تلاش‌های مجدد (retries) و اتصال حافظه (memory stitching) به کالاهای عمومی (commodities) تبدیل خواهند شد. آینده شغلی خود را روی ساخت زیرساخت‌های ساده (plumbing) شرط‌بندی نکنید.

بخش‌هایی که باقی می‌مانند، تعیین مشخصات (specification) و راستی‌آزمایی (verification) هستند.

۱. تعیین مشخصات (Specification): شما باید تعریف کنید که عامل مجاز به انجام چه کارهایی است. یک مدل نمی‌تواند سیاست استرداد وجه خاص شما یا میزان تحمل ریسک شما را بداند. این موارد در کد شما تعریف می‌شوند. ۲. راستی‌آزمایی (Verification): شما باید ثابت کنید که عامل در چارچوب قوانین شما باقی مانده است. یک مدل نمی‌تواند به‌طور قابل‌اعتماد خود را قضاوت کند. شما به یک لایه خارجی برای بررسی کار نیاز دارید.

یک عامل استرداد وجه (refund agent) را در نظر بگیرید.

اگر محدودیت استرداد وجه را در یک پرامپت (prompt) قرار دهید، کاربر می‌تواند مدل را فریب دهد. اما اگر محدودیت را در یک دستور if در کد خود قرار دهید، مدل نمی‌تواند با آن مخالفت کند.

آن دستور if همان مهندسی چارچوب است.

مهندسی چارچوب درباره دو چیز است:

تعریف محدوده رفتارهای مجاز.
اثبات اینکه عامل در داخل آن محدوده باقی مانده است.

مدل، گیاهی است که شما کنترل می‌کنید. مشخصات، هدف شماست. چارچوب، کنترل‌کننده است. ارزیابی‌ها، بازخورد هستند.

ابزارها و مکانیسم‌ها هر ماه تغییر خواهند کرد، اما انضباطِ تعیین مشخصات و راستی‌آزمایی تغییر نخواهد کرد.

ساخت زیرساخت‌های ساده را متوقف کنید. ساخت محدودیت‌ها و اثبات‌ها را شروع کنید.

Source: https://dev.to/saurav_bhattacharya/harness-engineering-has-no-fixed-address-2m7a

Optional learning community: https://t.me/GyaanSetuAi

𝗛𝗮𝗿𝗻𝗲𝘀𝘀 𝗘𝗻𝗴𝗶𝗻𝗲𝗲𝗿𝗶𝗻𝗴 𝗛𝗮𝘀 𝗡𝗼 𝗙𝗶𝘅𝗲𝗱 𝗔𝗱𝗱𝗿𝗲𝘀𝘀

Continue reading

مدل محصول نیست؛ آنچه واقعاً محصول است، اینجاست.

درک حلقه عامل

آزمون بقایی که هر معماری هوش مصنوعی در آن شکست می‌خورد

𝗧𝗵𝗲 𝗔𝗴𝗲𝗻𝘁 𝗜𝘀 𝘁𝗵𝗲 𝗛𝗮𝗿𝗻𝗲𝘀𝘀, 𝗡𝗼𝘁 𝘁𝗵𝗲 𝗠𝗼𝗱𝗲𝗹

Trust The Harness, Not The Model