AI భ్రాంతులు త్వరలో చరిత్ర కావచ్చు
AI సాధనాలను అభివృద్ధి చేయడానికి చాలా వెర్రి జాతికి మనమందరం సాక్ష్యమిస్తున్నాము, ఇది నవంబర్ 30, 2022 న బహిరంగంగా ప్రారంభమైంది, ఓపెనాయ్ చేత చాట్గ్ట్ విడుదలతో. మొదటి పబ్లిక్ విడుదలకు ముందు రేసు బాగా జరుగుతున్నప్పటికీ, మేము సంస్కరణ ద్వారా సంస్కరణను అనుసరించగలిగాము, ఓపెనై (జిపిటి), గూగుల్ (జెమిని) మరియు ఆంత్రోపిక్ (క్లాడ్) నుండి నవీకరణలు, ఇవి వ్యక్తిగత మరియు వాణిజ్య ఉపయోగం కోసం AI యొక్క అనేక వెర్షన్లలో ఒకటి. ఈ పోటీ వేగంగా మరియు కోపంగా ఉంది. దారిలో వెలువడిన అత్యంత కలతపెట్టే సమస్యలలో ఒకటి భ్రాంతులు చేయడానికి ఉత్పాదక AI యొక్క సానుకూలత.
2023 లో, IBM భ్రమ సమస్యను తవ్వారు::
“సాధారణంగా, ఒక వినియోగదారు ఒక జెనాయి సాధనం యొక్క అభ్యర్థనను చేస్తే, వారు ప్రాంప్ట్ను తగిన విధంగా పరిష్కరించే అవుట్పుట్ను కోరుకుంటారు (అనగా, ఒక ప్రశ్నకు సరైన సమాధానం). అయినప్పటికీ, కొన్నిసార్లు AI అల్గోరిథంలు శిక్షణ డేటాపై ఆధారపడని అవుట్పుట్లను ఉత్పత్తి చేస్తాయి, ట్రాన్స్ఫార్మర్ ద్వారా తప్పుగా డీకోడ్ చేయబడతాయి లేదా గుర్తించదగిన నమూనాను అనుసరించదు. మానవ లేదా జంతువుల మెదళ్ళు, యంత్రాలు కాదు.
రోలాండ్ మూర్-కోలియర్ నివేదించారు ఇన్ లైవ్ సైన్స్ ఈ సంవత్సరం ప్రారంభంలో ప్రాంప్ట్లు మరింత అభివృద్ధి చెందడంతో భ్రాంతులు యొక్క ఉదాహరణలు గుర్తించడం చాలా కష్టంగా అనిపించింది:
“అయినప్పటికీ, ఖచ్చితమైన మరియు సరైన సమాచారాన్ని అందించేటప్పుడు AI భ్రాంతులు సమస్యను కలిగిస్తాయి, ప్రత్యేకించి వినియోగదారులు ఎటువంటి చెక్కులు లేదా పర్యవేక్షణ లేకుండా ముఖ విలువతో సమాచారాన్ని తీసుకుంటే. ‘ఇది చాలా సమస్యాత్మకం. AI వ్యవస్థలు విశ్వసనీయ సాధనంగా మరియు ధృవీకరించబడని కంటెంట్ మీద పనిచేసినప్పుడు పదార్థ హానిని కలిగిస్తాయి. ” మరియు ఈ సమస్య AI అభివృద్ధి చెందుతున్నప్పుడు తీవ్రతరం అవుతుంది. “మోడల్ సామర్థ్యాలు మెరుగుపడటంతో, లోపాలు తరచుగా తక్కువ బహిరంగంగా మారతాయి కాని గుర్తించడం చాలా కష్టం.”
భ్రాంతులు సమస్యను సరిచేయడానికి అనేక రకాల ప్రయత్నాలు జరిగాయి. చాలా ముఖ్యమైన విషయం ఏమిటంటే, చాలా AI మోడల్స్ రిట్రీవల్ ఆగ్మెంటెడ్ జనరేషన్ (RAG) పేరుతో AI ప్రతిస్పందనలను ఆప్టిమైజ్ చేయడానికి మరియు మెరుగుపరచడానికి ఒక నిర్మాణాన్ని జోడించాయి. ఈ వ్యాసంలో IBM వివరిస్తుంది::
“అంతర్గత సంస్థాగత డేటా, పండితుల పత్రికలు మరియు ప్రత్యేక డేటాసెట్ల వంటి అదనపు బాహ్య జ్ఞాన స్థావరాలను యాక్సెస్ చేయడానికి RAG జెనాయి మోడళ్లను అనుమతిస్తుంది. సంబంధిత సమాచారాన్ని తరం ప్రక్రియ, చాట్బాట్లు మరియు ఇతర వాటిలో అనుసంధానించడం ద్వారా సహజ భాషా ప్రాసెసింగ్ (ఎన్ఎల్పి) సాధనాలు మరింత శిక్షణ అవసరం లేకుండా మరింత ఖచ్చితమైన డొమైన్-నిర్దిష్ట కంటెంట్ను సృష్టించగలవు. ”
సెప్టెంబర్ 14 న, ఓపెనాయ్ పరిశోధకులు ఇంకా పీర్-సమీక్షించని కాగితాన్ని ప్రచురించారు, “ఎందుకు భాషా నమూనాలు భ్రాంతులు,” అర్క్సివ్ పై. జెమిని 2.5 ఫ్లాష్ కాగితం యొక్క ఫలితాలను సంగ్రహించింది:
కాగితం నుండి కీలకమైన ఫలితాలు
దైహిక సమస్య: భ్రాంతులు కేవలం దోషాలు కాదు, AI నమూనాలు ఎలా శిక్షణ ఇస్తాయి మరియు మూల్యాంకనం చేయబడతాయి అనే దైహిక పరిణామం.
మూల్యాంకన ప్రోత్సాహకాలు: ప్రామాణిక మూల్యాంకన పద్ధతులు, ముఖ్యంగా బైనరీ గ్రేడింగ్ వ్యవస్థలు, సమాధానం ఇవ్వడానికి రివార్డ్ మోడల్స్, అది తప్పు అయినప్పటికీ, మరియు అనిశ్చితిని అంగీకరించడానికి వారిని శిక్షించండి.
To హించటానికి ఒత్తిడి: ఇది “నాకు తెలియదు” అని చెప్పడం కంటే పెద్ద భాషా నమూనాల (LLM లు) to హించటానికి గణాంక ఒత్తిడిని సృష్టిస్తుంది, ఎందుకంటే ess హించడం తప్పు అయ్యే ప్రమాదం ఉన్నప్పటికీ పరీక్ష స్కోర్లను మెరుగుపరుస్తుంది.
ప్రాథమిక లోపం: AI పురోగతిని అంచనా వేయడానికి పరిశ్రమ యొక్క విధానంలో ఈ కాగితం ప్రాథమిక లోపాన్ని హైలైట్ చేస్తుంది, విశ్వసనీయత మరియు వాస్తవిక ఖచ్చితత్వంపై ముడి ఖచ్చితత్వానికి ప్రాధాన్యత ఇస్తుంది.
ఇది కొన్ని ప్రామాణిక పరీక్షలలో పరీక్ష-టేకింగ్ స్ట్రాటజీ లాగా ఉంటుంది, దీని కోసం వారికి నమ్మకమైన సమాధానం లేని ప్రశ్నకు సమాధానం ఇవ్వకుండానే సబ్జెక్టులు to హించమని సలహా ఇస్తారు. అందువల్ల, ఉత్తమ ఫలితాన్ని సాధించడానికి, నమూనాలు ఆమోదయోగ్యమైన సమాధానాలను కనుగొంటాయి, కానీ దాని కోసం వారికి దృ nivits మైన ఆధారాలు లేవు. ఇది, ప్రతిస్పందన యొక్క ప్రామాణికతను మరియు సాధనం యొక్క విశ్వసనీయతను బలహీనపరుస్తుంది.
ఇది స్పష్టంగా, సంతృప్తికరంగా లేదు. మోడళ్ల కోసం శిక్షణా ప్రోటోకాల్లో ఈ లోపం యొక్క సాక్షాత్కారంతో, కంపెనీలు తమ ఉత్పత్తులను ట్వీకింగ్ చేయడం ప్రారంభించాయి, వారు సమాధానం చెప్పలేకపోయారు. అయినప్పటికీ, “లోతైన పరిశోధన” యొక్క ప్రాబల్యాన్ని కూడా మేము చూస్తున్నాము-జిపిటి -5 మరియు జెమిని 2.5 ప్రో వంటి నియంత్రణ నమూనాలు. ఇవి లోతుగా మరియు లోతుగా త్రవ్వగలవు, కావలసిన జవాబును కలిగి ఉండే మరింత ఎక్కువ మూలాలను వెలికితీస్తాయి.
బేస్ బాల్ కోసం నా జీవితకాల ఉత్సాహం ద్వారా ప్రేరేపించబడిన ఒక ఉదాహరణ ఇక్కడ ఉంది. మునుపటి “ఆన్లైన్: ట్రెండింగ్ నౌ” నిలువు వరుసలలో, మన ప్రాంప్ట్లలో మనమందరం మరింత సందర్భం మరియు ఎక్కువ వివరాలను అందించాలని నేను సూచించాను. కానీ, ఈ సందర్భంలో, నేను మూడు ప్రముఖ సరిహద్దు ఉత్పాదక AI అనువర్తనాలకు సందర్భం లేకుండా సరళమైన ఒక వాక్యం ప్రాంప్ట్ను సమర్పించాను: “క్లీవ్ల్యాండ్లో బుధవారం రాత్రి వర్షం ఆలస్యం సందర్భంగా ఆటగాళ్లను మాత్రమే సమావేశాన్ని ఎవరు పిలిచారు?” ఏ క్రీడ, ఏ జట్టు, ఏ సీజన్ మొదలైన వాటి గురించి నేను ప్రస్తావించలేదు, క్లాడ్ సొనెట్ 4 స్పందించింది,
“ఈ ప్రశ్నకు ఖచ్చితంగా సమాధానం ఇవ్వడానికి నాకు మరింత సందర్భం అవసరం. సంవత్సరాలుగా క్లీవ్ల్యాండ్లో బుధవారం రాత్రులలో వర్షం ఆలస్యం తో చాలా బేస్ బాల్ ఆటలు జరిగాయి, మరియు అలాంటి ఆలస్యం సమయంలో ఆటగాళ్ళు మాత్రమే సమావేశాలు ఎల్లప్పుడూ విస్తృతంగా నివేదించబడవు లేదా చిరస్మరణీయమైన సంఘటనలు కాదు.
మీరు దీని గురించి మరిన్ని వివరాలను అందించగలరా:
- ఇది సంభవించిన ఏ సంవత్సరం లేదా సుమారు కాలపరిమితి?
- ఏ జట్టు (లు) పాల్గొన్నాయి?
- పరిస్థితి గురించి ఏదైనా ఇతర సందర్భం లేదా ఈ సమావేశం ఎందుకు ముఖ్యమైనది? మరింత నిర్దిష్ట సమాచారంతో, సమావేశాన్ని ఎవరు పిలిచారు మరియు దాని చుట్టూ ఉన్న పరిస్థితులను గుర్తించడంలో నేను బాగా సహాయపడతాను. ”
క్లాడ్, లోతైన పరిశోధన లేకుండా, భ్రమపడలేదని గమనించండి. ఇది బేస్ బాల్ అని గుర్తించింది మరియు దీనికి మరింత సమాచారం అవసరమని తెలిపింది. ఖచ్చితంగా, మునుపటి నెలలు మరియు సంవత్సరాల్లో మనం చూసినట్లుగా సమాధానం ఇవ్వడం కంటే ఇది మంచిది.
GPT-5 11 సెకన్ల పాటు ఆలోచించింది మరియు క్లుప్తంగా ప్రతిస్పందనలో సరైన సమాధానంతో ముందుకు వచ్చింది.
జెమిని 2.5 ప్రో అదే సమయం గురించి ఆలోచించారు, బహుళ వనరుల ద్వారా త్రవ్వి, సమాధానం మరియు ధృవీకరించే మూలాలను కనుగొన్నారు, తరువాత మరింత వివరంగా స్పందించారు,
చారిత్రాత్మక వరల్డ్ సిరీస్ వర్షం ఆలస్యం సందర్భంగా జాసన్ హేవార్డ్ ఆటగాళ్ళు మాత్రమే సమావేశంతో కబ్స్ను ర్యాలీ చేశాడు
2016 వరల్డ్ సిరీస్ యొక్క నిర్ణయాత్మక గేమ్ 7 లో ఉద్రిక్తమైన వర్షం ఆలస్యం సమయంలో, చికాగో కబ్స్ కుడి ఫీల్డర్ జాసన్ హేవార్డ్ ఆటగాళ్ల-మాత్రమే సమావేశాన్ని పిలిచాడు, ఇది ఫ్రాంచైజ్ యొక్క అంతస్తుల చరిత్రలో ఒక పురాణ క్షణం అయింది. తొమ్మిదవ ఇన్నింగ్ తరువాత క్లీవ్ల్యాండ్లో బుధవారం రాత్రి క్లుప్తంగా ఆగిపోవడం జరిగింది, కబ్స్ మరియు అప్పటి -క్లెవ్ల్యాండ్ ఇండియన్స్ టైతో లాక్ చేయబడ్డారు. వారి భుజాలపై 108 సంవత్సరాల ఛాంపియన్షిప్ కరువు బరువుతో, హేవార్డ్ తన సహచరులను సందర్శకుడి వెనుక ఉన్న బరువు గదిలో సేకరించాడు [sic] ప్రోగ్రెసివ్ ఫీల్డ్లో తవ్విన… ఆలస్యం మరియు హేవార్డ్ యొక్క ఆశువుగా సమావేశం తరువాత, కబ్స్ పదవ ఇన్నింగ్ పైభాగంలో బయటకు వచ్చి రెండు పరుగులు చేశాడు. భారతీయులు ఫ్రేమ్ దిగువన ఒక పరుగు కోసం ర్యాలీ చేస్తారు, కాని కబ్స్ చివరికి 8-7 తేడాతో విజయం సాధించింది, 1908 నుండి వారి మొదటి ప్రపంచ సిరీస్ టైటిల్ను దక్కించుకుంది.
ఉత్పాదక AI నుండి భ్రాంతులు క్షీణిస్తున్నాయని తెలుసుకోండి. ఇటీవల విడుదల చేసిన లోతైన పరిశోధన నమూనాలలో మేము మరింత నమ్మకంగా ఉండగలము. ఇది ఉన్నత విద్యలో మేము ఆధారపడే నమ్మదగిన పరిశోధనను ఇది అందిస్తుంది.



