- Dynamic View de Bessons transforma respostes en experiències visuals i interactives per entendre millor conceptes complexos.
- La Vista Dinàmica i el disseny visual es despleguen de manera gradual i encara no estan disponibles a l'app mòbil de Gemini.
- Les respostes s'organitzen en pestanyes, targetes i imatges amb senzill accés a les fonts visuals originals.
- La nova onada de IA combina vistes dinàmiques i diàlegs guiats per oferir resultats més útils i personalitzats.
Dynamic View de Gemini està marcant un abans i un després en la forma en què interactuem amb els chatbots d'intel·ligència artificial. Ja no es tracta només de llegir respostes en text: ara podeu veure simulacions, comparacions visuals, imatges i elements interactius que fan que conceptes complexos es tornin molt més fàcils de digerir. És, en certa manera, portar la típica conversa amb la IA al terreny del que és visual i el que és gairebé “jugable”.
Aquesta nova forma de respondre no ha arribat a tothom alhora, ni funciona igual a tots els dispositius, però quan Dynamic View s'activa al vostre compte notes de seguida el canvi d'experiència. En lloc de limitar-se a paràgrafs i equacions, Gemini pot muntar per a tu una mena de miniaplicació interactiva en temps real: tries opcions, canvies paràmetres i veus el que passa a l'instant, com si fos una petita eina a mida basada en la teva pregunta.
Què és Dynamic View de Gemini i en què es diferencia de la manera text
Quan parlem de Dynamic View (Vista Dinàmica) ens referim a un mode de resposta de Gemini en què el contingut es presenta de manera visual, interactiva i multimèdia, en lloc de quedar-se en un bloc de text convencional. Google ho ha dissenyat perquè, a partir de qualsevol prompt, el model pugui generar:
- Simulacions i eines interactives (per exemple, models que es poden manipular o animacions controlables).
- Resums visuals amb blocs, targetes, panells i explicacions pas a pas.
- Contingut multimèdia integrat, com imatges de suport o comparacions en paral·lel.
Segons ha explicat Google, aquesta opció permet que els seus models de IA construeixin experiències immersives en temps real a partir de qualsevol petició. Això vol dir que, si preguntes per un tema complicat, en lloc de deixar-te anar un enfilall de fórmules, és capaç de muntar una mena d'escena interactiva: sliders per canviar valors, botons per alternar vistes, passos que es van desplegant, etc.
La diferència amb el Gemini clàssic és clara: en la manera convencional obtens text estructurat, potser amb algun quadre o taula, mentre que amb Dynamic View entres en un format molt més visual. És semblant al salt de llegir un article llarg a veure una explicació amb gràfics animats i controls per experimentar pel teu compte.
Aquesta aproximació fa que la IA sigui més accessible per als que es perden amb les fórmules o els textos densos. En comptes d'obligar-te a imaginar què està passant, t'ho ensenya a la pantalla, amb elements que pots moure o canviar per comprendre millor la idea.
Com funciona Dynamic View a la pràctica: l'exemple del problema dels tres cossos

Un dels millors exemples per entendre què ofereix Dynamic View el trobem al preguntar a Gemini pel famós problema dels tres cossos, un clàssic de la física i la mecànica celeste. Es tracta de calcular el moviment de tres cossos que s'atreuen gravitatòriament entre si (per exemple, estrelles o planetes). És un sistema tremendament complex i caòtic.
Si fas aquesta pregunta a la versió de Gemini que respon només amb text, el més habitual és que et retorni una explicació ben organitzada però carregada de fórmules i termes tècnics. Per a algú sense base física, això pot impressionar… i bloquejar. Veus equacions diferencials, expressions matemàtiques i definicions de caos dinàmic que no acaben d'aterrar.
En canvi, en llançar exactament la mateixa pregunta, però amb Dynamic View activat, la IA construeix una simulació visual interactiva que pots manipular. En aquesta experiència, pots:
- Canviar entre diferents modes de simulació (per exemple, veure el sistema amb dos cossos i després amb tres).
- Ajustar la velocitat per observar com evolucionen les òrbites més a poc a poc o més ràpid.
- Vegeu explicacions curtes al costat de l'animació, que aclareixen què està passant en cada cas.
Primer, Gemini t'ensenya un escenari senzill amb dos cossos, com la Terra i la Lluna, mostrant òrbites estables i relativament previsibles. Després, quan afegeixes un tercer cos, apareix el caos: les trajectòries canvien de forma dràstica davant de petites variacions en les condicions inicials, cosa que sol descriure's com a efecte papallona.
Gràcies a aquesta demostració, s'entén per què els sistemes estel·lars triples tendeixen a ser inestables i resulten tan difícils de predir. On les fórmules deixaven la sensació d'alguna cosa llunyana i críptica, la simulació fa que el concepte “feu clic” al cap de l'usuari. La diferència entre llegir i veure és abismal.
Aquesta experiència deixa clar cap a on es dirigeix el món dels chatbots: les converses van camí de ser molt més visuals, interactives i gairebé lúdiques. Canvies un paràmetre, veus com s'altera la simulació i, de passada, fixes molt millor el concepte a la teva memòria. És una forma d'aprenentatge que enganxa, perquè sents que estàs jugant amb la idea en lloc de memoritzar teoria.
Usar el disseny visual i la Vista Dinàmica a Gemini: què necessites
Per poder gaudir de tot això, és important entendre que el disseny visual i la Vista Dinàmica s'estan desplegant de manera gradual. No tots els usuaris tenen les mateixes opcions alhora, i Google està usant aquesta fase com a banc de proves per polir lexperiència.
A la pràctica, això significa que potser al vostre compte vegeu només el disseny visual, només Dynamic View, o diferents variacions de la mateixa idea. Google ho explica de manera explícita: aquestes funcions s'estan llançant a poc a poc i, com a part d'aquesta experimentació, és possible que tinguis accés a una modalitat oa una altra, però no necessàriament a totes.
A més, hi ha una limitació clau: la Vista Dinàmica encara no està disponible a l'app mòbil de Gemini. És a dir, si obris Gemini des del teu mòbil, és probable que només puguis fer servir el mode text (o un disseny més bàsic) i que les experiències dinàmiques es limitin, per ara, a la versió web oa determinades implementacions en navegadors.
Per tant, per aprofitar al màxim el mode visual i la Vista Dinàmica, convé fer servir Gemini en un dispositiu descriptori o portàtil amb navegador actualitzat i tenir paciència mentre Google completa el desplegament. No és estrany que la funció aparegui i desaparegui al llarg de les setmanes en funció dels experiments en curs.
Com s'organitza la informació: pestanyes, targetes i imatges
Una de les senyes d'identitat del disseny visual de Gemini és que organitza la informació en blocs i pestanyes, en lloc de presentar-la com un únic text lineal. Això fa que les respostes siguin més fàcils d'explorar: tries quina part vols veure a cada moment i no t'enfrontes a una “paret” de contingut.
Quan Gemini decideix fer servir aquest format, et pot mostrar diverses pestanyes a la part superior de la resposta, cadascuna dedicada a un aspecte del tema: definició, exemples, context històric, passos, etc. Tu només les has d'anar prement per accedir a la secció que t'interessi sense perdre't.
Aquest tipus destructura és particularment útil quan el contingut és molt dens, perquè et permet anar al que necessites de forma ràpida i sense angoixes. Si només t'interessa un resum, et quedes a la primera pestanya; si vols aprofundir, avances per les altres. És una resposta molt més modular.
Al costat d'aquest sistema per pestanyes, el disseny visual també incorpora targetes, llistes enriquides i petits blocs d'informació amb èmfasi visual. D'aquesta manera, el més important és destacat i no es perd entre paràgrafs interminables.
Pel que fa a les imatges, Gemini pot mostrar recursos visuals de suport la procedència dels quals, quan està disponible, s'indica a la part superior dreta de la pròpia imatge. En molts casos, veureu un enllaç o una icona que permet obrir la font original.
Si voleu consultar la pàgina d'origen d'una imatge, pots prémer l'opció “Ampliar” per obrir-la en una pestanya nova del teu navegador. Des d´aquí tindràs accés al context complet: article, lloc web, autor, etc. És una manera còmoda de verificar la procedència del contingut visual i aprofundir si alguna cosa et crida latenció.
Aplicacions pràctiques de Dynamic View: de les probabilitats a la moda
Les possibilitats de la Vista Dinàmica no es queden als exemples de física. Google ha deixat clar que aquest enfocament serveix per a un ventall d'usos gairebé il·limitat, perquè qualsevol prompt es pot transformar en una experiència visual i interactiva si el model ho considera apropiat.
Per exemple, en estudiar teoria de probabilitats, Gemini pot mostrar simulacions de llançaments de daus, ruletes o processos aleatoris que es repeteixen moltes vegades a la pantalla. Així veus, literalment, com les freqüències relatives convergeixen cap als valors teòrics a mesura que augmenta el nombre de proves.
En terrenys molt més quotidians, com la moda, Dynamic View pot organitzar recomanacions de roba en forma de combinacions, panells comparatius o propostes d'estil. En comptes de donar-te una llista seca de peces, t'ensenya possibles “looks”, contrastos de colors i suggeriments adaptats a diferents ocasions.
També es pot utilitzar per recordar detalls de sèries o pel·lícules: si preguntes pel final d'una ficció com “How I Met Your Mother”, Gemini pot tornar-te un resum visual, mostrant línies temporals simplificades, personatges clau i girs principals de la trama sense que hagis de llegir una sinopsi textual interminable.
Per anar un pas més enllà, hi ha qui s'ha animat a demanar-li explicacions de pel·lícules especialment enrevessades, com “Tenet”. Gemini ha arribat a generar esquemes visuals detallats per intentar esmicolar l'estructura temporal de la pel·lícula, amb gràfics que creuen personatges, línies de temps i esdeveniments. Encara que ni tan sols així tothom l'acaba d'entendre, l'eina mostra fins a quin punt es pot adaptar a continguts molt complexos.
Això sí, aquest tipus de respostes triga uns segons més a generar-se que les purament textuals. No és quelcom per a impacients, però quan l'experiència s'acaba de carregar, el més habitual és que l'espera valgui la pena: la combinació d'interactivitat i contingut visual converteix la informació en una cosa molt més atractiva i fàcil de retenir.
El paper del prompt a l'era de les vistes dinàmiques
Durant molt de temps s'ha repetit que la qualitat del prompt ho és tot: si no formules bé la pregunta, no obtens bones respostes. Amb l'arribada de vistes dinàmiques i interfícies més conversacionals, aquesta pressió sobre l'usuari s'està relaxant de manera notable.
En escenaris com Dynamic View o el mode de Recerca de compres, el prompt inicial és només el punt de partida. Si la vostra petició és vaga o poc precisa, el mateix sistema s'encarregarà de preguntar-vos, aclarir dubtes i omplir els buits que faltin. La conversa esdevé un procés iteratiu molt més natural.
Això fa que els models de IA siguin més accessibles per als que no volen o no saben redactar prompts molt elaborats. Fins i tot si la teva primera instrucció és força genèrica, l'assistent pot anar guiant-te amb preguntes senzilles fins a construir una imatge clara del que realment busques.
A més, en incorporar components visuals, els aclariments es poden fer no només amb paraules, sinó també amb exemples gràfics. En lloc de preguntar-te “prefereixes aquest estil o aquest altre?” de manera textual, el sistema et podria mostrar dos conjunts d'opcions visuals perquè triïs, fent-ho tot molt més intuïtiu.
Tot això apunta a l'inici d'una nova etapa pels chatbots d'IA: models més curiosos, més preguntons i molt més centrats a generar respostes útils, visuals, interactives i entretingudes. Ja no es conformen a contestar el que els demanes; intenten entendre't millor per tornar-te alguna cosa que realment encaixi amb el que tenies al cap.
Vista des de fora, aquesta evolució pot semblar simplement una millora estètica, però en realitat suposa un canvi profund en la forma com ens relacionem amb la tecnologia. La IA deixa de ser un “motor de text” i passa a ser un generador d'experiències completes, on veure, tocar (de forma digital) i experimentar esdevenen tan importants com llegir.
Amb funcions com Dynamic View de Gemini, el disseny visual per pestanyes, les simulacions en temps real i els modes interactius d'altres assistents, estem entrant de ple en una etapa en què aprendre, investigar o comprar amb ajuda de la IA es torna més clar, més atractiu i, per què no dir-ho, força més divertit de quedar-se davant dun simple bloc de text estàtic.
Redactor apassionat del món dels bytes i la tecnologia en general. M'encanta compartir els meus coneixements a través de l'escriptura, i això és el que faré en aquest bloc, mostrar tot el més interessant sobre gadgets, programari, maquinari, tendències tecnològiques, i més. El meu objectiu és ajudar-te a navegar pel món digital de forma senzilla i entretinguda.

