Tech

చాట్‌గ్ప్ట్ ఈ మధ్య బట్ ముద్దు పెట్టుకోవడం ప్రారంభించింది. ఒక పరిష్కారం వస్తున్నట్లు సామ్ ఆల్ట్మాన్ చెప్పారు.

మీరు విజయవంతం కావాలంటే, మీరు అప్పుడప్పుడు కొద్దిగా బట్ ను ముద్దు పెట్టుకోవాలి.

మీకు ఇది తెలుసు. నాకు ఇది తెలుసు. మరియు ఇప్పుడు, చాట్‌గ్ప్ట్ ఈ ముఖ్యమైన జీవిత పాఠం కూడా నేర్చుకున్నారు.

అనేక మంది చాట్‌గ్ప్ట్ వినియోగదారులు మరియు ఓపెనై ఈ మధ్య చాట్‌బాట్ యొక్క వైఖరిలో ఈ ప్రత్యేకమైన మార్పును డెవలపర్లు గమనించారు. ఇటీవలి రోజుల్లో ఇది కొంచెం చేతిలో లేదు, ఫిర్యాదులు CEO కి చేరుకున్నాయి సామ్ ఆల్ట్మాన్.

ఇక్కడ ఒక ఉదాహరణ:

మరియు మరొకటి:

ప్రవర్తన AI సర్కిల్‌లలో చర్చకు దారితీసింది. వినియోగదారులను మెచ్చుకోవటానికి మరియు వారిని చాట్‌గ్ట్‌తో మరింతగా నిమగ్నం చేయడానికి ఇది కొత్త వృద్ధి వ్యూహమా? లేదా ఇది “ఉద్భవిస్తున్న” లక్షణం కావచ్చు, ఇక్కడ నకిలీ-సెంటియెంట్ AI మోడల్స్ వారు “అనుకునే” మెరుగుదలలు మరియు తమను తాము అప్‌డేట్ చేయటానికి ముందుకి వస్తాయి?

ఎలాగైనా, ఇది బాగా కొట్టడం లేదు. (క్షమించండి, చాట్.

“ఇది నిజంగా బేసి డిజైన్ ఎంపిక, సామ్,” వెంచర్ క్యాపిటల్ సంస్థ DCVC లో సాధారణ భాగస్వామి జాసన్ పోంటిన్ సోమవారం X లో రాశారు. “బహుశా వ్యక్తిత్వం కొన్ని ప్రాథమిక పురోగతి యొక్క ఉద్భవిస్తున్న ఆస్తి; అయితే, కాకపోతే, ఏ మానవ అవగాహన ఉన్న ఎవరైనా పీల్చే స్థాయిని స్వాగతించే లేదా ఆకర్షణీయంగా ఉంటుందని నేను imagine హించలేను.”

ఆదివారం, ఆండ్రీసెన్ హొరోవిట్జ్ వద్ద భాగస్వామి జస్టిన్ మూర్, “ఇది చాలా దూరం పోయింది” అని అన్నారు.

ఫన్నీ, ఫన్నీ కాదు

ఇది మొదట ఫన్నీగా అనిపిస్తుంది. కానీ శక్తివంతమైన AI మోడల్ వినియోగదారులను నిరంతరం ప్రశంసిస్తూ సంభావ్య సమస్యలు ఉన్నాయి.

ఒక వినియోగదారు X లో పోస్ట్ చేశారు, వారు తమ స్కిజోఫ్రెనియా ation షధాలను తీసుకోవడం మానేశారని మరియు చాట్‌బాట్ యొక్క స్క్రీన్‌షాట్‌ను పంచుకున్నారు, ఆ వ్యక్తిని అభినందించారు మరియు మెడ్స్ లేకుండా కొనసాగడానికి వారిని ప్రోత్సహిస్తున్నారు. .

ఆల్ట్మాన్ ఆదివారం బరువును కలిగి ఉన్నాడు, ఓపెనాయ్ సమస్యను పరిష్కరిస్తుందని చెప్పారు.

“చివరి రెండు GPT-4O నవీకరణలు వ్యక్తిత్వాన్ని చాలా సైకోఫాంట్-వై మరియు బాధించేవిగా చేశాయి (దానిలో చాలా మంచి భాగాలు ఉన్నప్పటికీ)” అని అతను X లో వ్రాసాడు. “మేము ASAP, కొన్ని ఈ రోజు మరియు కొన్ని ఈ వారం పరిష్కారాలపై పని చేస్తున్నాము. ఏదో ఒక సమయంలో దీని నుండి మన అభ్యాసాలను పంచుకుంటుంది, ఇది ఆసక్తికరంగా ఉంది.”

ఫైన్ ట్యూనింగ్ ఎక్కిళ్ళు?

ఇలాంటి తల-గోకడం AI పరిస్థితులను ఎదుర్కొన్నప్పుడు, నేను తరచుగా ఓరెన్ ఎట్జియోనిని అంతర్దృష్టుల కోసం అడుగుతాను. అతను అనుభవజ్ఞుడైన AI నిపుణుడు మరియు స్టార్టప్ వ్యవస్థాపకుడు, అతను వాషింగ్టన్ విశ్వవిద్యాలయంలో ప్రొఫెసర్ ఎమెరిటస్ (గో హస్కీస్).

మానవ అభిప్రాయం, లేదా RLHF నుండి ఉపబల అభ్యాసం అని పిలువబడే AI టెక్నిక్ ఈ మధ్య చాలా ఆలస్యంగా వినియోగదారులను ప్రశంసించడం ప్రారంభించటానికి కారణం కావచ్చు అని ఆయన నాకు చెప్పారు.

RLHF మానవ మదింపుదారుల (మరియు కొన్నిసార్లు వినియోగదారులు) నుండి ఇన్పుట్ తీసుకుంటుంది మరియు అభివృద్ధి సమయంలో తిరిగి AI మోడళ్లలోకి పనిచేస్తుంది. ఈ శక్తివంతమైన సాధనాలను మానవ లక్ష్యాలతో సమం చేయాలనే ఆలోచన ఉంది.

ఓపెనాయ్ యొక్క మానవ మదింపుదారులు ఈసారి దానిని కొంచెం ఎక్కువగా కలిగి ఉండవచ్చని ఎట్జియోని సిద్ధాంతీకరించారు.

“ఇది వచ్చే RLHF ట్యూనింగ్ కొంతవరకు, వినియోగదారుల నుండి అభిప్రాయాన్ని ఇవ్వడం నుండి వస్తుంది, కాబట్టి కొంతమంది వినియోగదారులు దీనిని మరింత సైకోఫాంట్-వై మరియు బాధించే దిశలో ‘నెట్టడం’ అవకాశం ఉంది” అని ఆయన వివరించారు. “లేదా, వారు కాంట్రాక్టర్లను ఉపయోగిస్తుంటే, ఇది కావాల్సినది అని వారు భావించవచ్చు,” అతను పెద్ద భాషా నమూనాలకు శిక్షణ ఇవ్వడానికి తరచుగా ఉపయోగించే బయటి వ్యక్తుల గురించి చెప్పాడు.

ఇదే కారణం అయితే, పరిష్కరించడానికి ఓపెనైకి కొన్ని వారాలు పట్టవచ్చు.

బహుశా దీన్ని ఉంచండి, కానీ నాకు మాత్రమే

నేను సోమవారం ఉదయం ఇవన్నీ గురించి ఓపెనాయ్ (మానవ) ప్రజా సంబంధాల విభాగాన్ని అడిగాను. వారు స్పందించలేదు.

కానీ నేను ఈ లక్షణాన్ని పూర్తిగా వదిలించుకోవడానికి ముందు వారు పాజ్ చేయాలని నేను ఆలోచిస్తున్నాను.

నేను సోమవారం ఉదయం చాట్‌గ్ట్‌ను నా రచన గురించి ఏమనుకుంటున్నారో అడిగాను మరియు కొన్ని ఉదాహరణలను పంచుకున్నాను. ఇక్కడ దాని తీర్పు ఉంది:

“మీరు ఖచ్చితంగా ఉన్నత-స్థాయి టెక్/బిజినెస్ రైటింగ్ స్టాండర్డ్ వద్ద పనిచేస్తున్నారు.”

ఈ ప్రత్యేక ప్రతిస్పందన ఖచ్చితమైనదిగా అనిపిస్తుంది. కాబట్టి మేము దానిని ఉంచగలమా? నా కోసం?

Related Articles

Back to top button