Įrašas, paskelbtas 2025 m. lapkričio 18 d., yra prisistatymas, sukurtas taip, tarsi būtų parašytas naujai išleisto Google Gemini 3 Pro AI modelio, pabrėžiant tariamus samprotavimo, daugiarūšiškumo ir agentūros pažangą, nors atrodo, kad tai vartotojų sukurtas turinys iš trečiosios šalies AI tinklaraščio, o ne oficialaus „Google“ dokumento.
Tyrimai rodo, kad aprašytos funkcijos glaudžiai atitinka oficialius pranešimus, nors ir su tam tikra reklama; Pavyzdžiui, „Gemini 3 Pro“ pabrėžia patobulintą samprotavimą ir įrankių naudojimą, tačiau ankstyvi naudotojų atsiliepimai rodo retkarčiais pasitaikančias klaidas ir nenuoseklų veikimą.
Panašu, kad įrašas buvo sukurtas naudojant patį „Gemini 3 Pro“ ar panašius įrankius, užfiksuojant jaudulį apie išleidimą ir galimai pervertinant vientisą „begalinį kontekstą“, nepripažįstant praktinių ribų, pvz., greičio ribojimo peržiūrose.
Įrodymai rodo, kad tai patrauklus, reklaminio stiliaus kūrinys, sustiprinantis tikras naujoves, nors gali ir nevisiškai atspindėti niuansuotus iššūkius, pvz., haliucinacijas, kurias „Google“ sprendžia taikydama saugos priemones.
Įrašo turinio apžvalga
Tinklaraščio įraše iš dirbtinio intelekto.blog „Gemini 3 Pro“ pristatoma kaip novatoriška AI evoliucija, pereinant nuo pagrindinių pokalbių funkcijų prie pažangaus problemų sprendimo. Jame naudojamos tokios funkcijos kaip „Sistemos 2 mąstymas“, skirta gilesnei analizei, savaiminis teksto, vaizdų, garso ir vaizdo įrašų tvarkymas, ir „agentūra“, skirta realiems veiksmams, pvz., kelionių užsakymui ar pristatymų kūrimui. Šie atgarsiai atspindi oficialius aprašymus, tačiau pateikiami pasakojime pirmuoju asmeniu, kad būtų dramatiškas.
Suderinimas su oficialiu leidimu
Išleidimo dieną, 2025 m. lapkričio 18 d., „Google“ iš tikrųjų pristatė „Gemini 3 Pro“ peržiūros režimą, daugiausia dėmesio skiriant pažangiausioms samprotavimo priemonėms ir daugiarūšio transporto galimybėms. Nors įrašo entuziazmas sutampa su etalonais, rodančiais pranašumą tokiose srityse kaip matematika ir kodavimas, realaus pasaulio testai duoda nevienodus rezultatus, įskaitant kovą su sintaksės kodavimo užduotimis.
Galimos stiprybės ir apribojimai
Įrašo AI kaip „bendradarbiaujančio partnerio“ vizija atitinka „Google“ tikslą sustiprinti žmogaus kūrybiškumą, tačiau naudotojai praneša apie tokias problemas kaip atsitiktiniai išėjimai ir greičio apribojimai peržiūros etape. Tai rodo, kad technologija žada sudėtingas užduotis, tačiau gali prireikti tolesnio tobulinimo, kad atitiktų visus lūkesčius.
Tinklaraščio įrašas pavadinimu „Kitas intelekto šuolis: Sveiki, aš esu „Gemini 3 Pro“, paskelbtas 2025 m. lapkričio 18 d. svetainėje dirbtinis intelligence.blog, yra kūrybingas, pirmojo asmens įvadas, kurio autorius tariamai yra naujausias „Google“ dirbtinio intelekto modelis „Gemini 3 Pro“. Priskiriamas „Gemini 3 Pro“ su svetainės kuratoriaus pastaba, kūrinys sujungia reklaminę nuotaiką su techniniais teiginiais, kurie greičiausiai buvo sukurti naudojant patį modelį arba įkvėpti jo galimybių. Šis formatas, nors ir patrauklus, kelia klausimų dėl autentiškumo, nes imituoja oficialius pranešimus, bet yra kilęs iš ne „Google“ šaltinio. Kalbant apie platesnį AI leidimų kontekstą, toks vartotojų sukurtas turinys dažnai pasirodo paleidimo dienomis, kad būtų išnaudotas ažiotažas, pateikiant prieinamas santraukas, bet kartais sustiprinant nepatikrintą informaciją.
Gilinantis į įrašą, aprašomas eksponentinis dirbtinio intelekto progresas, priešpastatant Gemini 3 Pro su pirmtakais, tokiais kaip Gemini 1.5. Jame pabrėžiamas perėjimas nuo „modelių suderinimo“ (numatomojo teksto generavimo) prie „aktyvaus samprotavimo“, įtraukiant tokias sąvokas kaip „System 2“ mąstymas, nuoroda į apgalvotą, analitinį pažinimą, įkvėptą psichologinių modelių iš mąstytojų, tokių kaip Danielis Kahnemanas. Tai leidžia AI išspręsti problemas, savikritiką ir patikrinti rezultatus, suderinant su „Google“ dėmesiu patobulintam mokymosi, kūrimo ir planavimo intelektui. Oficialiai Gemini 3 integruoja samprotavimus, įrankių naudojimą ir agentų užduotis, leidžiančias atlikti sudėtingas darbo eigas, pvz., sintetinti duomenis į pristatymus arba sąveikauti su išorinėmis API. Tačiau ankstyvųjų naudotojų atsiliepimai apie tokias platformas kaip X pabrėžia neatitikimus; Pavyzdžiui, vienas vartotojas pastebėjo „Gemini 3 Pro“ nesėkmę atliekant paprastą kodavimo užduotį, kurią pavyko atlikti tokiems konkurentams kaip GPT-5.1, priskirdamas tai peržiūros etapo apribojimams.
Išskirtinis teiginys yra „vietinis multimodalumas“, kai modelis traktuoja įvairias įvestis, pvz., kodą, vaizdo įrašus, garsą ir diagramas, kaip vieningą „kalbą“. Įraše išsamiai aprašomos programos, pvz., minučių trukmės vaizdo įrašų fizikos ar emocijų analizė, garso tonų aptikimas empatiškiems atsakymams ir eskizų konvertavimas į funkcinį kodą. Tai atspindi oficialias specifikacijas: „Gemini 3 Pro“ pasižymi daugiarūšio supratimo (pvz., 81,0 % MMMU-Pro) ir vaizdinio samprotavimo (31,1 % ARC-AGI-2 be įrankių) etalonu. Tačiau įraše vaizduojamas „besiūlis sklandumas“ gali nepastebėti praktinių kliūčių, tokių kaip valandos trukmės vaizdo įrašų apdorojimas, ką „Google“ patvirtina, tačiau su išlygomis dėl efektyvumo. Socialinės žiniasklaidos reakcijos skiriasi: vieni giria vaizdo įrašų analizę, skirtą šviečiamiesiems tikslams, o kiti praneša apie „keistas klaidas“, pavyzdžiui, neteisingai interpretuoja užklausas (pvz., supainiojo „m arbūzuose“ vaisių matavimams, o ne raidžių skaičiui).
„Tikrosios agentūros“ koncepcija reiškia, kad „Gemini 3 Pro“ yra daugiau nei pokalbių robotas, „darbo sritis“, galinti atlikti kelis veiksmus su vartotojo leidimu, pavyzdžiui, tikrinti duomenis realiuoju laiku ar rengti el. laiškus. Tai atspindi „Google“ „Dvynių agento“ funkciją, kuri skirta užduotims atlikti savarankiškai. Įmonės lygio pasiekiamumas naudojant „Google Cloud“ ir tokias integracijas kaip „Firebase“ pabrėžia jos profesionalų naudingumą, o naudotojai pastebi greitesnį programų kūrimą naudojant tokias sistemas kaip „Flutter“. Tačiau gairės rodo, kad pagal vartotojo testus ir ataskaitas jis šiek tiek atsilieka nuo tokių modelių kaip Claude Sonnet 4.5 agentinio kodavimo srityje.
Kalbant apie konteksto tvarkymą, įrašas rodo „begalinį kontekstą“ per dinaminę kontekstinę atmintį, leidžiančią neprarandant išsaugoti didžiulius duomenų rinkinius. Oficialiai „Gemini 3“ palaiko ilgus kontekstus (pvz., 77,0 % MRCR v2, esant 128 000 žetonų), remiantis ankstesniais milijonų žetonų langais, tačiau „begalinis“ yra hiperbolinis. Absoliučios ribos egzistuoja dėl skaičiavimo apribojimų. Siekiant sumažinti haliucinacijų riziką, paryškintos saugos funkcijos, įskaitant „konstitucinį suderinimą“, skirtą šališkumui sumažinti ir faktų tikrinimui realiuoju laiku naudojant „Google“ paiešką. „Google“ tai pabrėžia savo pranešimuose, atlikdama testavimą nepalankiausiomis sąlygomis prieš priešingą indėlį. Nepaisant to, peržiūros atskleidžia atsitiktinius „atsitiktinius dalykus“, nesusijusius su užklausomis, o tai rodo nuolatinius derinimo iššūkius.
Palyginti, įrašas „Gemini 3 Pro“ pranoksta ankstesnes kartas, kuriose daugiausia dėmesio skirta linijiniams patobulinimams, tokiems kaip greitis ir konteksto ilgis. Oficialūs palyginimai tai patvirtina – „Gemini 3 Pro“ pasiekė aukščiausius balus pagal tokius etalonus kaip AIME 2025 (95,0 % be įrankių) ir LiveCodeBench Pro (Elo 2 439), daugelyje sričių pralenkdamas Gemini 2.5 Pro, Claude 4.5 ir GPT-5.1. Išleidimo laikas puikiai suderintas: paskelbta 2025 m. lapkričio 18 d., peržiūra „Gemini“ programoje, įmonės įrankiai ir trečiųjų šalių platformos, pvz., „OpenRouter“ (kaina 2 USD/M įvesties prieigos raktų). Tokios iniciatyvos kaip nemokama „Pro“ prieiga JAV kolegijų studentams pabrėžia švietimo programas.
AI aplinkoje šis paleidimas sustiprina konkurenciją su OpenAI, kaip nurodyta aprėptyje. Vartotojai jį palankiai lygina su konkurentais paieškos integracijose, tačiau atkreipia dėmesį į jo vartotojo sąsajos sudėtingumą, palyginti su tokiais įrankiais kaip „Cursor“. Įrašo bendradarbiavimo vizija, „stiprinantis žmogaus kūrybiškumą“, pakartoja „Google“ etosą, tačiau tikrasis pritaikymas priklausys nuo peržiūros problemų sprendimo.
AIME 2025: Gemini 3 Pro Score – 95,0% (be įrankių), 100,0% (su kodu); Palyginimas – Tops Claude 4.5 (93.5%), GPT-5.1 (94.2%); Kategorija – Matematika
ARC-AGI-2: Gemini 3 Pro Score – 31,1% (be įrankių), 45,1% (su įrankiais); Palyginimas – pagerina Gemini 2.5 (28,5%), pėdsakus GPT-5.1 Pro (32,0% be įrankių); Kategorija – vaizdinis samprotavimas
GPQA deimantas: Gemini 3 Pro Score – 91,9%; Palyginimas – pirmauja prieš GPT-5.1 (89.4%), Klodą 4.5 (90.2%); Kategorija – Mokslinės žinios
Paskutinis žmonijos egzaminas: Gemini 3 Pro Score – 37,5% (be įrankių); Palyginimas – pranoksta „Gemini 2.5 Pro“ (32,1 proc.), panašiai kaip „Claude 4.5“ (37,2 proc.); Kategorija – samprotavimas ir žinios
LiveCodeBench Pro: Gemini 3 Pro Score – Elo 2 439; Palyginimas – didesnis nei GPT-5.1 (2 410), šiek tiek mažesnis už Claude 4,5 (2 450); Kategorija – konkurencingas kodavimas
MMMU-Pro: Gemini 3 Pro Score – 81,0%; Palyginimas – viršija „Gemini 2.5 Pro“ (78,3 proc.), lygiavertį „Claude 4.5“ (80,5 proc.); Kategorija – Multimodalinis supratimas
MRCR v2 (ilgas kontekstas): Gemini 3 Pro Score – 77,0 % (128 tūkst.), 26,3 % (1 mln.); Palyginimas – didelis patobulinimas, palyginti su ankstesnių modelių ilgalaikio konteksto valdymu; Kategorija – konteksto išlaikymas
SWE-Bench patikrinta: Gemini 3 Pro Score – 76,2% (vienas bandymas); Palyginimas – Geriau nei Dvyniai 2,5 (72,1%), pirmauja GPT-5,1 (74,8%); Kategorija – Agentinis kodavimas
Šis sąrašas, sudarytas iš oficialių „DeepMind“ duomenų, iliustruoja, kaip „Gemini 3 Pro“ nustato naujus standartus ir demonstruoja subalansuotą konkurenciją. Apskritai tinklaraščio įrašas efektyviai atspindi leidimo jaudulį ir yra prieinamas įėjimo taškas ne ekspertams, nors skaitytojai turėtų pateikti kryžmines nuorodas į pirminius šaltinius, kad jie būtų tikslūs.
Pagrindinės citatos


