মার্গারেট অ্যাটউড সতর্ক করছেন: কেন AI এখনও "Garbage In, Garbage Out"-এর জালে আটকে আছে

প্রখ্যাত লেখিকা মার্গারেট অ্যাটউড সম্প্রতি লার্জ ল্যাঙ্গুয়েজ মডেলগুলোর (LLMs) একটি কঠোর সমালোচনা করেছেন, যেখানে তিনি নির্ভুলতা এবং ডেটার অখণ্ডতা বজায় রাখার ক্ষেত্রে ক্রমাগত সংগ্রামের বিষয়টি তুলে ধরেছেন। তাঁর অভিজ্ঞতা বর্তমান AI যুগে একটি মৌলিক সত্যকে সামনে এনেছে: এমনকি সবচেয়ে উন্নত মডেলগুলোও তাদের ট্রেনিং ডেটার গুণমানের দ্বারা সীমাবদ্ধ।

Claude পরীক্ষা: হ্যালুসিনেশনের একটি শিক্ষা

পর্তুগালের পোর্তোতে অনুষ্ঠিত বাবেল লিটারারি অ্যান্ড কালচারাল ফেস্টিভ্যালে বক্তব্য রাখার সময়, Handmaid’s Tale-এর লেখিকা Anthropic-এর Claude ব্যবহারের একটি অভিজ্ঞতা প্রকাশ করেন। ব্রিটিশ ডিটেকটিভ সিরিজ Father Brown সম্পর্কে তথ্য সংগ্রহের জন্য অ্যাটউড যখন চ্যাটবটটি ব্যবহার করার চেষ্টা করেন, তখন সেটি ব্যর্থ হয়—যা "hallucination" বা হ্যালুসিনেশনের ধারণাটিকে নিখুঁতভাবে ফুটিয়ে তোলে।

অ্যাটউডের মতে, মডেলটি ভুল তথ্য প্রদান করেছিল, যা কার্যত ব্যবহারকারীর কাছে "মিথ্যা" বলার শামিল। তিনি উল্লেখ করেন যে, LLM সম্ভবত প্রচুর পরিমাণে টেলিভিশন রিভিউ ঘেঁটে নমুনা সংগ্রহ করেছিল, কিন্তু যেহেতু অনলাইন সমালোচনাগুলোতে সাধারণত স্পয়লার (plot spoiler) এড়িয়ে চলা হয়, তাই মডেলটি তার ট্রেনিং সেটের প্যাটার্ন দ্বারা বিভ্রান্ত হয়েছিল। এই প্রযুক্তিগত সূক্ষ্মতা ডেভেলপারদের জন্য একটি প্রধান চ্যালেঞ্জকে নির্দেশ করে: LLM হলো প্রোবাবিলিস্টিক ইঞ্জিন (probabilistic engines) যা তথ্য যাচাইয়ের চেয়ে প্যাটার্ন ম্যাচিংকে বেশি গুরুত্ব দেয়, যার ফলে প্রায়শই আত্মবিশ্বাসের সাথে ভুল আউটপুট প্রদান করে।

ডেটার সংকট: Garbage In, Garbage Out

অ্যাটউডের সমালোচনাটি কম্পিউটিংয়ের একটি চিরন্তন নীতির ওপর ভিত্তি করে গড়ে উঠেছে: "garbage in, garbage out"। তিনি উল্লেখ করেছেন যে, LLM-গুলোকে স্ক্র্যাপ করা, আগে প্রকাশিত এবং সম্ভাব্য পুরনো তথ্যের ওপর ভিত্তি করে প্রশিক্ষণ দেওয়া হয়। যখন একটি মডেলকে অসম্পূর্ণ, পক্ষপাতদুষ্ট বা যুক্তিহীন তথ্য দেওয়া হয়, তখন তার আউটপুট অনিবার্যভাবে সেই ত্রুটিগুলোকেই প্রতিফলিত করে।

সামগ্রিক AI জগতের জন্য এটি একটি অনুস্মারক যে, মডেলের প্যারামিটার বৃদ্ধি করা ডেটার গুণমানের বিকল্প হতে পারে না। ডেভেলপাররা যখন যুক্তিনির্ভর ক্ষমতা বৃদ্ধির জন্য আরও বড় ডেটাসেট ব্যবহারের চেষ্টা করছেন, তখন সেই ডেটাসেটের মধ্যকার "নয়েজ" (noise)—যেমন অ্যাটউড উল্লেখ করা রিভিউগুলোতে প্লট স্পয়লারের অভাব—এমন সিস্টেম্যাটিক ত্রুটি তৈরি করতে পারে যা Claude-এর মতো উন্নত আর্কিটেকচারও সহজে কাটিয়ে উঠতে পারে না।

নৈতিক উদ্বেগ: সুযোগবাদ বনাম সৃজনশীলতা

প্রযুক্তিগত সীমাবদ্ধতার বাইরেও, অ্যাটউড AI গ্রহণের মানবিক দিকটি নিয়ে কথা বলেছেন। তিনি যারা AI-এর ওপর অতিরিক্ত নির্ভরশীল তাদের "সুযোগবাদী" হিসেবে আখ্যায়িত করেছেন, যারা প্রকৃত সৃষ্টি বা গবেষণার কঠোর পরিশ্রম এড়ানোর সহজ পথ খুঁজছেন। তিনি সতর্ক করেছেন যে, শনাক্ত করা অসম্ভব এমন AI-জেনারেটেড কন্টেন্ট ব্যবহার করে "প্রতারণা" করার প্রলোভন সেই সব শিল্পের জন্য একটি ক্রমবর্ধমান উদ্বেগ, যা মানুষের বুদ্ধিবৃত্তিক ক্ষমতা এবং সূক্ষ্মতার ওপর নির্ভরশীল।

উদ্যোক্তা এবং প্রযুক্তি পেশাদারদের জন্য এই পার্থক্যটি অত্যন্ত গুরুত্বপূর্ণ। যদিও AI একটি শক্তিশালী প্রোডাক্টিভিটি টুল হিসেবে কাজ করতে পারে, তবে অ্যাটউডের পর্যবেক্ষণ—"এমনকি যারা ব্যবসায়িক কারণে এটি ব্যবহার করেন তাদেরও এটি যাচাই করতে হয়"—এটিই নিশ্চিত করে যে AI ওয়ার্কফ্লোতে মানুষের তদারকি একটি অপরিহার্য অংশ হিসেবে রয়ে গেছে। সম্পূর্ণ স্বায়ত্তশাসিত এবং ত্রুটিহীন AI-এর যুগ এখনও অনেক দূরের বিষয়, এবং সত্যতা নিশ্চিত করার দায়িত্ব এখনও ব্যবহারকারীর ওপরই বর্তায়।

মূল বিষয়সমূহ

  • ডেটার অখণ্ডতা অত্যন্ত গুরুত্বপূর্ণ: "garbage in, garbage out" নীতিটি LLM-এর জন্য এখনও সবচেয়ে বড় বাধা, কারণ মডেলগুলো তাদের ট্রেনিং ডেটার গুণমান এবং পূর্ণতার দ্বারা সীমাবদ্ধ।
  • হ্যালুসিনেশনের ফাঁদ: Anthropic-এর Claude-এর মতো উন্নত মডেলগুলোও সাধারণ তথ্য সংগ্রহের ক্ষেত্রে ব্যর্থ হতে পারে যদি তাদের ট্রেনিং ডেটার অন্তর্নিহিত প্যাটার্নগুলো বিভ্রান্তিকর হয়।
  • মানুষের তদারকির প্রয়োজনীয়তা: AI-কে মানুষের দক্ষতা এবং সমালোচনামূলক চিন্তাভাবনার বিকল্প হিসেবে না দেখে, বরং একটি টুল হিসেবে দেখা উচিত যার জন্য ক্রমাগত যাচাইকরণ প্রয়োজন।