പകർപ്പവകാശ പ്രളയം
കേസുകൾ വർദ്ധിച്ചുവരികയാണ്. എഴുത്തുകാരും കലാകാരന്മാരും സംഗീതജ്ഞരും AI കമ്പനികൾക്കെതിരെ കേസെടുക്കുന്നു. അനുമതിയില്ലാതെ കമ്പനികൾ അവരുടെ സൃഷ്ടികൾ ഉപയോഗിക്കുന്നു എന്നാണ് അവർ പറയുന്നത്. എല്ലാ കാര്യങ്ങളിലും AI പരിശീലിപ്പിക്കുന്നതിന്റെ അവസാനത്തെ അടയാളമാണിത്.
നിലവിലെ തലമുറയിലെ AI ഉപയോഗിക്കുന്നത് വൻതോതിലുള്ള, ലൈസൻസ് ഇല്ലാത്ത ഡാറ്റയാണ്. അടുത്ത തലമുറയിൽ ചെറിയതും നിയമപരവുമായ ഡാറ്റാസെറ്റുകൾ ഉപയോഗിക്കാൻ സാധ്യതയുണ്ട്. ഈ മാറ്റം എല്ലാം മാറ്റിമറിക്കും.
നിയമപോരാട്ടം
വാർത്താ സ്ഥാപനങ്ങളും എഴുത്തുകാരും പോലുള്ള വാദികൾ അവകാശപ്പെടുന്നത്:
- AI കമ്പനികൾ പകർപ്പവകാശമുള്ള സൃഷ്ടികൾ അനുമതിയില്ലാതെ ഉപയോഗിക്കുന്നു.
- AI കലാകാരന്മാരുടെ പേരുകളും രൂപങ്ങളും ഉപയോഗിക്കുന്നു.
- AI ഉൽപ്പന്നങ്ങൾ യഥാർത്ഥ സ്രഷ്ടികളുമായി മത്സരിക്കുന്നു.
AI കമ്പനികൾ തങ്ങളെത്തന്നെ പ്രതിരോധിക്കുന്നത് ഇപ്രകാരമാണ്:
- പരിശീലനം എന്നത് ഒരു പരിവർത്തനപരമായ ഉപയോഗമാണ് (transformative use).
- AI നേരിട്ട് പകർത്തുന്നതിന് പകരം പാറ്റേണുകൾ പഠിക്കുകയാണ് ചെയ്യുന്നത്.
നിയന്ത്രണമാണ് യഥാർത്ഥ പ്രശ്നം. സ്രഷ്ടികൾക്ക് അവരുടെ സൃഷ്ടികളുടെ ഉടമസ്ഥാവകാശം വേണം, അതിന് പ്രതിഫലം ലഭിക്കണം. AI കമ്പനികൾ വികസനം തുടരാൻ ആഗ്രഹിക്കുന്നു. നിയമം ഇപ്പോഴും ഇതിനനുസരിച്ച് മാറിക്കൊണ്ടിരിക്കുകയാണ്.
'ഓപ്റ്റ്-ഔട്ട്' (Opt-Out) രീതിയിലെ പ്രശ്നം
Robots.txt അല്ലെങ്കിൽ NoAI ടാഗുകൾ പോലുള്ള ടൂളുകൾ നിലവിലുണ്ട്. അവ സ്രഷ്ടികൾക്ക് AI-യെ തടയാൻ അനുവദിക്കുന്നു. എന്നാൽ ഇതൊരു കെണിയാണ്.
ഓപ്റ്റ്-ഔട്ട് സംവിധാനങ്ങൾ ജോലി സ്രഷ്ടാവിന്റെ തലയിലാക്കുന്നു. നിങ്ങൾ തന്നെ ടൂൾ കണ്ടെത്തുകയും തങ്ങളെ ഒഴിവാക്കണമെന്ന് ആവശ്യപ്പെടുകയും വേണം. അത് സമ്മതമല്ല. യഥാർത്ഥ സമ്മതം എന്നത് AI കമ്പനികൾ ആദ്യം അനുമതി ചോദിക്കണം എന്നതാണ്.
രണ്ട് സാധ്യതയുള്ള ഭാവികൾ
സാഹചര്യം 1: ശുഭപ്രതീക്ഷാപരമായ പാത
AI കമ്പനികൾ ലൈസൻസിനായി പണം നൽകുന്നു. അവർ ടെക്സ്റ്റിനായി Spotify-ക്ക് സമാനമായ ഒരു സംവിധാനം നിർമ്മിക്കുന്നു. സ്രഷ്ടികൾക്ക് പണം ലഭിക്കുന്നു, മോഡലുകൾ ശക്തമായി തുടരുന്നു.
സാഹചര്യം 2: നിരാശാജനകമായ പാത
AI കമ്പനികൾ കേസുകളിൽ പരാജയപ്പെടുന്നു. അവർക്ക് അവരുടെ ഡാറ്റ നീക്കം ചെയ്യേണ്ടി വരുന്നു. വിവരങ്ങളുടെ അഭാവം കാരണം ഭാവിയിലെ മോഡലുകളുടെ ശേഷി വളരെയധികം കുറയുന്നു.
ഡാറ്റാ ഗുണനിലവാരത്തെക്കുറിച്ചുള്ള പുതിയ കാഴ്ചപ്പാട്
കുറഞ്ഞ ഡാറ്റ പലപ്പോഴും കുറഞ്ഞ കൃത്യതയെയും സൂക്ഷ്മതയെയും സൂചിപ്പിക്കുന്നു. എന്നിരുന്നാലും, നിലവിലെ മോഡലുകൾ ധാരാളം അനാവശ്യ വിവരങ്ങൾ (noise) ഉപയോഗിക്കുന്നുണ്ട്. ഡാറ്റയുടെ വലിയൊരു ഭാഗം ആവർത്തന സ്വഭാവമുള്ളതാണ്. കുറഞ്ഞതും വൃത്തിയുള്ളതുമായ ഒരു ഡാറ്റാസെറ്റ് യഥാർത്ഥത്തിൽ മികച്ച ഫലങ്ങൾ നൽകിയേക്കാം.
നിങ്ങൾക്ക് എങ്ങനെ തയ്യാറെടുക്കാം
- കേസുകൾ ശ്രദ്ധിക്കുക. അതിന്റെ ഫലങ്ങൾ ഈ വ്യവസായത്തെ നിർണ്ണയിക്കും.
- സ്രഷ്ടികളെ പിന്തുണയ്ക്കുക. നിങ്ങൾ ഇഷ്ടപ്പെടുന്ന ഉള്ളടക്കത്തിന് പണം നൽകുക.
- നീതി ആവശ്യപ്പെടുക. ഡാറ്റ നൽകുന്ന ആളുകൾക്ക് AI കമ്പനികൾ പ്രതിഫലം നൽകണം.
നിങ്ങൾക്ക് AI പരിശീലനത്തിനായി ഒരു നീതിയുക്തമായ സംവിധാനം നിർമ്മിക്കാൻ കഴിയുമെങ്കിൽ, അത് എങ്ങനെയായിരിക്കും പ്രവർത്തിക്കുക? സ്രഷ്ടികൾക്ക് എങ്ങനെ പ്രതിഫലം ലഭിക്കണം?
Optional learning community: https://t.me/GyaanSetuAi
