అలీబాబా కొత్త విజువల్ రీజనింగ్ మోడల్‌ను విడుదల చేస్తుంది, అది చూడవచ్చు, అర్థం చేసుకోవచ్చు మరియు ఆలోచించగలదు

Vijay Kumar 29 మార్చి 2025

5 1 minute read

అలీబాబా కొత్త విజువల్ రీజనింగ్ మోడల్‌ను విడుదల చేస్తుంది, అది చూడవచ్చు, అర్థం చేసుకోవచ్చు మరియు ఆలోచించగలదు

చైనీస్ టెక్ దిగ్గజం అలీబాబా, విజువల్ రీజనింగ్ మోడల్ అయిన క్యూవిక్యూ-మాక్స్ అని పిలువబడే కొత్త క్వెన్ ఐ బాట్‌ను ప్రకటించింది. ఈ మోడల్‌ను ఆసక్తికరంగా మార్చడం ఏమిటంటే, ఇది ఫోటోలు మరియు వీడియోల యొక్క కంటెంట్‌ను అర్థం చేసుకోగలదు, ఆపై పరిష్కారాలను అందించడానికి ఆ సమాచారంతో విశ్లేషించండి మరియు కారణం.

ఈ మోడల్‌తో, అలీబాబా టెక్స్ట్-ఆధారిత AI మోడల్స్ మరియు వాస్తవ ప్రపంచ సమాచారం మధ్య అంతరాన్ని తగ్గిస్తుందని చెప్పారు. విజువల్ రీజనింగ్‌తో, మోడల్ ప్రపంచంలోని విషయాల గురించి చూడగలదని, అర్థం చేసుకోగలదని మరియు ఆలోచించగలదని పేర్కొంది. చైనీస్ సంస్థ మోడల్ చిత్రాలను అన్వయించడం మరియు కీలక అంశాలను గుర్తించడంలో రాణిస్తుందని, మరియు ఇలస్ట్రేషన్ డిజైన్, వీడియో స్క్రిప్ట్ జనరేషన్ మరియు రోల్-ప్లేయింగ్‌ను చేర్చడానికి దీనిని ఉపయోగించవచ్చని అనువైనదని చెప్పారు.

ఇతర AI చాట్‌బాట్‌ల మాదిరిగానే, QVQ-MAX పనిలో, విద్యలో లేదా మీ వ్యక్తిగత జీవితంలో పనులతో మీకు సహాయపడుతుంది, అయితే, దాని దృశ్య సామర్థ్యాలతో, ఇది గణిత మరియు భౌతిక సమస్యలు వంటి ఈ రంగాలలో మరింత పనులతో పాటు రేఖాచిత్రాలతో పాటు రెసిపీ చిత్రాల ఆధారంగా వంటకం ద్వారా మీకు మార్గనిర్దేశం చేస్తుంది.

అలీబాబా QVQ-MAX ను మోడల్ యొక్క మొదటి పునరావృతం అని పిలిచారు మరియు రాబోయే సంస్కరణల్లో దీన్ని ఎలా మెరుగుపరుచుకోవాలని ఇది యోచిస్తోంది. మొదట, ఇది పరిశీలనలను ధృవీకరించే గ్రౌండింగ్ పద్ధతుల ద్వారా చిత్ర గుర్తింపు ఖచ్చితత్వాన్ని మెరుగుపరచాలని కోరుకుంటుంది. రెండవది, ఇది బహుళ-దశల పనులు మరియు సంక్లిష్ట సమస్యలను నిర్వహించడంలో మోడల్‌ను మెరుగ్గా చేయాలనుకుంటుంది, తద్వారా ఇది ఫోన్లు మరియు కంప్యూటర్లను ఆపరేట్ చేయగలదు మరియు ఆటలను ఆడగలదు. చివరగా, సాధన ధృవీకరణ మరియు దృశ్య ఉత్పత్తిని చేర్చడానికి కేవలం టెక్స్ట్-ఆధారిత పరస్పర చర్యల నుండి మోడల్‌ను విస్తరించాలని ఇది యోచిస్తోంది.

QVQ-MAX తో ప్రారంభించడానికి, వెళ్ళండి chat.qwen.ai. దీని తరువాత, చాట్ బాక్స్‌కు వెళ్లి ప్రారంభించండి, అది ఏమి చేయగలదో చూడటానికి దృశ్యమానతను అటాచ్ చేయడం మర్చిపోవద్దు.

Source link