AI గుర్తింపు విశ్వసనీయత సంక్షోభం: కొన్ని సాధనాలు విజయవంతమవుతాయి, మరికొన్ని పూర్తిగా విఫలమవుతాయి

Translated for your language. Read the original.

AI-assisted draft.

AI గుర్తింపు విశ్వసనీయత సంక్షోభం: కొన్ని సాధనాలు విజయవంతమవుతాయి, మరికొన్ని పూర్తిగా విఫలమవుతాయి

In this article

AI గుర్తింపు విశ్వసనీయత సంక్షోభం: కొన్ని సాధనాలు విజయవంతమవుతున్నాయి, మరికొన్ని పూర్తిగా విఫలమవుతున్నాయి

Authors Guild చేసిన ఇటీవలి అధ్యయనం AI రైటింగ్ డిటెక్టర్ల (AI writing detectors) విశ్వసనీయతలో భారీ వ్యత్యాసాన్ని వెల్లడించింది. కొన్ని సాధనాలు అత్యంత ఖచ్చితంగా పనిచేస్తుంటే, మరికొన్ని ప్రాథమికంగా లోపభూయిష్టంగా ఉన్నాయని ఈ అధ్యయనం స్పష్టం చేస్తోంది. తమ రచనలు మానవ నిర్మితమని నిరూపించుకోవడంపైనే జీవనోపాధి ఆధారపడి ఉన్న వృత్తిపరమైన రచయితలకు ఈ అనిశ్చితి ఒక పెద్ద ముప్పుగా మారింది.

పనితీరు అంతరం: పరిపూర్ణత నుండి సంపూర్ణ వైఫల్యం వరకు

జనరేటివ్ AI (generative AI) ఒక ప్రధాన ధోరణిగా మారకముందు, అంటే 2020 మరియు 2022 మధ్య ప్రచురించబడిన పది వ్యాసాలను ఉపయోగించి Authors Guild కఠినమైన పరీక్షను నిర్వహించింది. "AI-ముందు" కాలం నాటి మానవ వచనాన్ని ఉపయోగించడం ద్వారా, ఈ అధ్యయనం 'ఫాల్స్ పాజిటివ్' (తప్పుగా గుర్తించడం) రేట్లను కొలవడానికి ఒక స్పష్టమైన ప్రాతిపదికను అందించింది.

ఫలితాలు రెండు విభిన్న ధృవాలుగా ఉన్నాయి. Pangram మరియు Grammarly అత్యంత విశ్వసనీయమైనవిగా నిలిచాయి, ఇవి మానవ నిర్మిత వచనాన్ని ఖచ్చితంగా మానవ రచనగానే గుర్తించాయి (0.0% AI స్కోరు). Originality.ai కూడా అన్ని రంగాల్లో అధిక ఖచ్చితత్వాన్ని పాటిస్తూ బలంగా పనిచేసింది.

దీనికి పూర్తి విరుద్ధంగా, Sidekicker.ai ఘోరంగా విఫలమైంది. పరీక్షలో ఉన్న ప్రతి మానవ వ్యాసం "చాలా వరకు AI ద్వారా సృష్టించబడింది" అని గుర్తించబడింది, ఇందులో రెండు నిర్దిష్ట వ్యాసాలు 100% AI స్కోరును పొందాయి. ZeroGPT కూడా నమ్మదగినది కాదని తేలింది; ఇది స్పష్టంగా మానవ రచన అని తెలిసిన వచనాలకు కూడా తరచుగా అధిక AI శాతాన్ని నివేదించింది. ఉదాహరణకు, "Erdrich Pulitzer Prize" వ్యాసాన్ని ఇది 76.3% AI సంభావ్యతతో గుర్తించింది.

వృత్తిపరమైన రచనలోని వైరుధ్యం

ఈ అధ్యయనం ఒక ఆందోళనకరమైన సాంకేతిక వైరుధ్యాన్ని ఎత్తి చూపుతోంది: ఒక మానవ రచయిత ఎంత నైపుణ్యం కలిగిన వారైతే, లోపభూయిష్టమైన డిటెక్టర్ల ద్వారా వారు తప్పుగా గుర్తించబడే అవకాశం అంత ఎక్కువగా ఉంటుంది. వృత్తిపరమైన రచన స్పష్టత, సంక్షిప్తత మరియు ఖచ్చితత్వంపై ఆధారపడి ఉంటుంది—Large Language Models (LLMs) అనుకరించడానికి శిక్షణ పొందిన గణాంక నమూనాలు (statistical patterns) కూడా సరిగ్గా ఇవే.

AI మోడల్స్ అధిక నాణ్యత కలిగిన మానవ గద్యం (prose) పై శిక్షణ పొందడం వల్ల, నైపుణ్యంతో రాసిన వాక్యం యొక్క "ఫింగర్‌ప్రింట్" AI ద్వారా సృష్టించబడిన వాక్యంతో దాదాపు ఒకేలా కనిపిస్తుంది. ఇది రచయితల జీవితాలపై ప్రభావం చూపే వాతావరణాన్ని సృష్టిస్తుంది; దశాబ్దాల కాలం పాటు తమ నైపుణ్యాన్ని మెరుగుపరుచుకున్న రచయిత, Sidekicker వంటి సాధనం ఇచ్చే తప్పుడు ఫలితం (false positive) కారణంగా కాంట్రాక్టులను కోల్పోవచ్చు లేదా తమ ప్రతిష్టను దెబ్బతీసుకోవచ్చు.

"బ్లాక్ బాక్స్" సమస్య మరియు గుర్తింపు యొక్క భవిష్యత్తు

విజయవంతమైన సాధనాలు కూడా పారదర్శకత విషయంలో విమర్శలను ఎదుర్కొంటున్నాయి. తన డిటెక్టర్ ప్రాథమికంగా ఒక "బ్లాక్ బాక్స్" (black box) లాగా పనిచేస్తుందని, అంటే ఒక నిర్దిష్ట వచనం ఎందుకు తప్పుగా గుర్తించబడిందో వివరణాత్మక వివరణను అందించలేదని Pangram CEO Max Spero పేర్కొన్నారు. LLM యొక్క ఏకరీతి విధానం కంటే మానవులు ఎక్కువ వైవిధ్యంతో మరియు వాదనల నిర్మాణంతో రాస్తారని ఆయన వాదించినప్పటికీ, వివరణాత్మకత లేకపోవడం జవాబుదారీతనానికి ఒక అడ్డంకిగానే ఉంది.

అంతేకాకుండా, ఈ పరీక్షలో Pangram మరియు Grammarly సాధించిన విజయం ప్రధానంగా అవి ఫాల్స్ పాజిటివ్‌లను నివారించడంలో (మానవులను తప్పుగా గుర్తించకపోవడంలో) మంచివని నిరూపిస్తుంది. అవి AIని పట్టుకోవడంలో (యంత్ర వచనాన్ని గుర్తించడంలో) కూడా అంతే సమర్థవంతంగా పనిచేస్తాయని ఇది ఖచ్చితంగా గ్యారెంటీ ఇవ్వదు.

"రాయడానికి AIని ఉపయోగించడం" మరియు "ఆలోచించడానికి AIని ఉపయోగించడం" మధ్య తేడాను గుర్తించడంలో పరిశ్రమ ఇబ్బంది పడుతున్న తరుణంలో, వృత్తిపరమైన నిర్ణయాలకు డిటెక్షన్ సాధనాలను మాత్రమే ప్రాతిపదికగా తీసుకోకూడదని Authors Guild హెచ్చరిస్తోంది.

ముఖ్య అంశాలు

ఖచ్చితత్వంలో విపరీతమైన వ్యత్యాసం: ఈ పరీక్షలో Pangram మరియు Grammarly 0% ఫాల్స్ పాజిటివ్ రేట్లను సాధించగా, Sidekicker.ai 100% మానవ వచనాన్ని AI-జనరేటెడ్ అని గుర్తించింది.
వృత్తిపరమైన నష్టం: అధిక నాణ్యత కలిగిన, ఖచ్చితమైన మానవ రచనలు AI అవుట్‌పుట్‌తో గణాంక సారూప్యతలను కలిగి ఉంటాయి, దీనివల్ల నిపుణులైన రచయితలు డిటెక్షన్ లోపాలకు గురయ్యే ప్రమాదం ఉంది.
మానవ పర్యవేక్షణ కోసం పిలుపు: డిటెక్టర్లను కేవలం అనుబంధ సాధనాలుగా మాత్రమే ఉపయోగించాలని మరియు రచయితలకు తమ రచనను సమర్థించుకోవడానికి అవకాశం ఇవ్వాలని Authors Guild ప్రచురణకర్తలకు సలహా ఇస్తోంది.

AI గుర్తింపు విశ్వసనీయత సంక్షోభం: కొన్ని సాధనాలు విజయవంతమవుతాయి, మరికొన్ని పూర్తిగా విఫలమవుతాయి

AI గుర్తింపు విశ్వసనీయత సంక్షోభం: కొన్ని సాధనాలు విజయవంతమవుతున్నాయి, మరికొన్ని పూర్తిగా విఫలమవుతున్నాయి

పనితీరు అంతరం: పరిపూర్ణత నుండి సంపూర్ణ వైఫల్యం వరకు

వృత్తిపరమైన రచనలోని వైరుధ్యం

"బ్లాక్ బాక్స్" సమస్య మరియు గుర్తింపు యొక్క భవిష్యత్తు

ముఖ్య అంశాలు

Continue reading

𝗪𝗵𝗲𝗻 𝗮 𝗛𝗮𝗻𝗱𝘄𝗿𝗶𝘁𝘁𝗲𝗻 𝗧𝗵𝗲𝘀𝗶𝘀 𝗕𝗲𝗰𝗼𝗺𝗲𝘀 𝟵𝟵 𝗣𝗲𝗿𝗰𝗲𝗻𝘁 𝗔𝗜

AI నమ్మకంలో అంతరం: ఎందుకు 60% మంది అమెరికన్ వినియోగదారులు AI సందేశాలను తిరస్కరిస్తున్నారు

AI డిటెక్టర్లు కేవలం ఊహిస్తున్నాయి

వాదనలలో మానవ వైవిధ్యాన్ని అనుకరించడంలో LLMలు ఎందుకు ఇబ్బంది పడుతున్నాయి?