అలీబాబా కొత్త విజువల్ రీజనింగ్ మోడల్ను విడుదల చేస్తుంది, అది చూడవచ్చు, అర్థం చేసుకోవచ్చు మరియు ఆలోచించగలదు

చైనీస్ టెక్ దిగ్గజం అలీబాబా, విజువల్ రీజనింగ్ మోడల్ అయిన క్యూవిక్యూ-మాక్స్ అని పిలువబడే కొత్త క్వెన్ ఐ బాట్ను ప్రకటించింది. ఈ మోడల్ను ఆసక్తికరంగా మార్చడం ఏమిటంటే, ఇది ఫోటోలు మరియు వీడియోల యొక్క కంటెంట్ను అర్థం చేసుకోగలదు, ఆపై పరిష్కారాలను అందించడానికి ఆ సమాచారంతో విశ్లేషించండి మరియు కారణం.
ఈ మోడల్తో, అలీబాబా టెక్స్ట్-ఆధారిత AI మోడల్స్ మరియు వాస్తవ ప్రపంచ సమాచారం మధ్య అంతరాన్ని తగ్గిస్తుందని చెప్పారు. విజువల్ రీజనింగ్తో, మోడల్ ప్రపంచంలోని విషయాల గురించి చూడగలదని, అర్థం చేసుకోగలదని మరియు ఆలోచించగలదని పేర్కొంది. చైనీస్ సంస్థ మోడల్ చిత్రాలను అన్వయించడం మరియు కీలక అంశాలను గుర్తించడంలో రాణిస్తుందని, మరియు ఇలస్ట్రేషన్ డిజైన్, వీడియో స్క్రిప్ట్ జనరేషన్ మరియు రోల్-ప్లేయింగ్ను చేర్చడానికి దీనిని ఉపయోగించవచ్చని అనువైనదని చెప్పారు.
ఇతర AI చాట్బాట్ల మాదిరిగానే, QVQ-MAX పనిలో, విద్యలో లేదా మీ వ్యక్తిగత జీవితంలో పనులతో మీకు సహాయపడుతుంది, అయితే, దాని దృశ్య సామర్థ్యాలతో, ఇది గణిత మరియు భౌతిక సమస్యలు వంటి ఈ రంగాలలో మరింత పనులతో పాటు రేఖాచిత్రాలతో పాటు రెసిపీ చిత్రాల ఆధారంగా వంటకం ద్వారా మీకు మార్గనిర్దేశం చేస్తుంది.
అలీబాబా QVQ-MAX ను మోడల్ యొక్క మొదటి పునరావృతం అని పిలిచారు మరియు రాబోయే సంస్కరణల్లో దీన్ని ఎలా మెరుగుపరుచుకోవాలని ఇది యోచిస్తోంది. మొదట, ఇది పరిశీలనలను ధృవీకరించే గ్రౌండింగ్ పద్ధతుల ద్వారా చిత్ర గుర్తింపు ఖచ్చితత్వాన్ని మెరుగుపరచాలని కోరుకుంటుంది. రెండవది, ఇది బహుళ-దశల పనులు మరియు సంక్లిష్ట సమస్యలను నిర్వహించడంలో మోడల్ను మెరుగ్గా చేయాలనుకుంటుంది, తద్వారా ఇది ఫోన్లు మరియు కంప్యూటర్లను ఆపరేట్ చేయగలదు మరియు ఆటలను ఆడగలదు. చివరగా, సాధన ధృవీకరణ మరియు దృశ్య ఉత్పత్తిని చేర్చడానికి కేవలం టెక్స్ట్-ఆధారిత పరస్పర చర్యల నుండి మోడల్ను విస్తరించాలని ఇది యోచిస్తోంది.
QVQ-MAX తో ప్రారంభించడానికి, వెళ్ళండి chat.qwen.ai. దీని తరువాత, చాట్ బాక్స్కు వెళ్లి ప్రారంభించండి, అది ఏమి చేయగలదో చూడటానికి దృశ్యమానతను అటాచ్ చేయడం మర్చిపోవద్దు.