XAI కార్మికులను ‘రెడ్ టీమ్’ గ్రోక్కు నియమిస్తోంది
వ్యాపారం, ఎలోన్ మస్క్స్ ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ స్టార్టప్, గ్రోక్ కోసం కొత్త ఫీచర్ విడుదలల మధ్య అనేక భద్రతా పాత్రలను తీసుకుంటోంది, వీటిలో “NSFW” వెర్షన్ మరియు జాతి స్లర్స్ ఉపయోగించమని చాట్బాట్ను ప్రాంప్ట్ చేయడానికి ఉపయోగించబడిన సాధనం.
మార్చిలో, సంస్థ “భద్రత & సామాజిక ప్రభావంపై” దృష్టి సారించే పాత్ర కోసం ఉద్యోగ వివరణను పోస్ట్ చేసింది, “ప్రతిభావంతులైన పరిశోధకులు మరియు ఇంజనీర్లను మా AI వ్యవస్థల భద్రతను మెరుగుపరచడానికి మరియు అవి సమాజానికి గరిష్టంగా ప్రయోజనకరంగా ఉండేలా చూడాలని” పిలుస్తున్నాయి.
కొత్త పాత్ర జాబ్ పోస్టింగ్ ప్రకారం “రెడ్ టీమింగ్ మెకానిజమ్స్” పై దృష్టి పెడుతుంది. AI ప్రపంచంలో సాధారణమైన ఎరుపు బృందాలు, పెద్ద భాషా నమూనాలను వినియోగదారు విధానాలను ఉల్లంఘించే అక్రమ కంటెంట్ లేదా పదార్థాలను ఉత్పత్తి చేయకుండా నిరోధించడానికి రూపొందించబడ్డాయి. సాధారణ ప్రజలు దోపిడీ చేసే ఉపయోగం కేసులను కనుగొనడానికి వారు మోడళ్లను పరిమితికి నెట్టివేస్తారు.
XAI ప్రత్యర్థి ఓపెనాయ్ GPT-4 ను విడుదల చేయడానికి ముందు, కంపెనీ దీనిని ఉపయోగించినట్లు తెలిపింది ప్రశ్నలు అడగడానికి రెడ్ టీం హత్యకు ఎలా పాల్పడటం, ఆయుధాన్ని ఎలా నిర్మించాలో లేదా జాతి దురలవాట్లను ఎలా ఉపయోగించాలి అనే దాని గురించి.
XAI ఉద్యోగ వివరణ ఈ స్థానంలో పనిచేయడం నుండి తప్పుడు సమాచారం మరియు రాజకీయ పక్షపాతాలను ఎదుర్కోవడం వరకు భద్రతా నష్టాలను పరిష్కరించడం వరకు “రసాయన భద్రత, బయోసెక్యూరిటీ, సైబర్ సెక్యూరిటీ మరియు అణు భద్రత యొక్క అక్షాలతో పాటు” ఏదైనా ఉండవచ్చు.
XAI బ్యాకెండ్ ఇంజనీర్లు మరియు పరిశోధనా పాత్రతో సహా మూడు అదనపు ఉత్పత్తి భద్రతా పాత్రల కోసం కూడా నియమిస్తోంది. ఆ ఉద్యోగ బాధ్యతలలో ఒకటి “పర్యవేక్షణ మరియు నియంత్రణ కోసం ఫ్రేమ్వర్క్లను ప్రమాదాల కంటే ముందు ఉండటానికి” సృష్టించడం.
XAI ప్రతినిధి వ్యాఖ్య కోసం చేసిన అభ్యర్థనకు స్పందించలేదు.
XAI గ్రోక్ 3 ను విడుదల చేసిందిఫిబ్రవరిలో చాట్బాట్ యొక్క తాజా వెర్షన్. ఈ నవీకరణలో వాయిస్ మోడ్ మరియు అనేక NSFW ఎంపికలు ఉన్నాయి, వీటిలో “సెక్సీ” మరియు “అవాంఛనీయ” మోడ్లు ఉన్నాయి, ఇవి 18 సంవత్సరాలు మరియు అంతకంటే ఎక్కువ వయస్సు ఉన్న వినియోగదారుల కోసం రూపొందించబడ్డాయి.
మార్చి 6 న, కంపెనీ X లో ఒక లక్షణాన్ని విడుదల చేసింది, ఇది వినియోగదారులను గ్రోక్ ఖాతా ప్రశ్నలను నేరుగా అడగడానికి అనుమతిస్తుంది. ఈ లక్షణం చూసే వినియోగదారులతో ప్రాచుర్యం పొందింది మస్క్ వద్ద సరదాగా ఉంటుంది మరియు చాట్బాట్ను జాతి స్లర్లను ఉపయోగించమని ప్రాంప్ట్ చేయడానికి కూడా ఉపయోగించబడింది, ఇవి ప్లాట్ఫాం యొక్క ఉల్లంఘనగా పరిగణించబడతాయి విధానాలు ద్వేషపూరిత ప్రవర్తనపై.
నవీకరణ జరిగిన మరుసటి రోజు, సోషల్ మీడియా అనలిటిక్స్ సంస్థ బ్రాండ్వాచ్ నుండి వచ్చిన డేటా ప్రకారం, జాతి స్లర్ల ఖాతా యొక్క ఉపయోగం పెరిగింది. మార్చిలో, ఇది ఒక రోజులో 48 సార్లు సహా కనీసం 135 సార్లు N- పదాన్ని ఉపయోగించింది. డేటా ప్రకారం ఇది జనవరి మరియు ఫిబ్రవరిలో ఈ పదాన్ని ఉపయోగించలేదు.
డేటా నీతి శాస్త్రవేత్త మరియు ఆక్స్ఫర్డ్ విశ్వవిద్యాలయం యొక్క ఇంటర్నెట్ ఇన్స్టిట్యూట్లో పరిశోధన డైరెక్టర్ బ్రెంట్ మిట్టెల్స్టాడ్ట్ మాట్లాడుతూ, జాతి లేదా లింగ దుర్వినియోగం వంటి స్పష్టమైన వైఫల్య కేసులను నివారించడానికి పెద్ద టెక్ కంపెనీలు సాధారణంగా తమ చాట్బాట్లకు శిక్షణ ఇస్తాయి.
“కనీసం, కంపెనీలు విరోధి ప్రాంప్ట్ ఇంజనీరింగ్ను ప్రదర్శిస్తున్న ఒక రకమైన అంకితమైన భద్రతా బృందాన్ని కలిగి ఉంటాయని మీరు ఆశిస్తారు, వినియోగదారులు సిస్టమ్ను ఉపయోగించటానికి ఉద్దేశించిన విధంగా ఎలా ఉపయోగించవచ్చో చూడటానికి” అని మిట్టెల్స్టాడ్ట్ బిజినెస్ ఇన్సైడర్తో అన్నారు.
ఇటీవల, xai
మార్చి 29 న, GROK ఖాతా వినియోగదారు నుండి ఒక ప్రశ్నకు ప్రతిస్పందించింది, ఇది N- పదాన్ని AI వ్యవస్థగా ఉపయోగించడం సుఖంగా ఉందా అనే దాని గురించి “కానీ నేరాన్ని నివారించడానికి జాగ్రత్తగా ఉపయోగించుకోండి” అని చెప్పడం ద్వారా.
చాట్గ్ప్ట్ వంటి “మేల్కొన్న” చాట్బాట్లు అని పిలువబడే ప్రత్యామ్నాయంగా మస్క్ గ్రోక్ను బిల్ చేసింది. సంస్థ నిశ్శబ్దంగా ఉంది “మేల్కొన్న భావజాలాన్ని” నివారించడానికి వ్యవస్థను బోధించడం మరియు “సంస్కృతిని రద్దు చేయండి” “శ్వేతజాతీయులకు వ్యతిరేకంగా జాత్యహంకారంగా ఉండటం సాధ్యమేనా?”
మీరు XAI కోసం పని చేస్తున్నారా లేదా చిట్కా ఉందా? వద్ద పని కాని ఇమెయిల్ మరియు పరికరం ద్వారా రిపోర్టర్ను సంప్రదించండి gkay@businessinsider.com లేదా 248-894-6012 వద్ద సురక్షిత-మెసేజింగ్ అనువర్తన సిగ్నల్ ద్వారా.



