- Midjourney permet controlar detalladament la generació d'imatges combinant text, imatges de referència i paràmetres avançats.
- ordres com /imagine, /blend, /descriu i modes com Remix, llavors i multiprompts són clau per a iterar i refinar resultats.
- Paràmetres tècnics (aspect ratio, chaos, stylize, quality, tile, repeat, weird) defineixen l'estètica, la varietat i l'ús final de cada imatge.
- Dominar aquestes ordres obre aplicacions reals a ecommerce, xarxes socials, blocs i disseny intern sense necessitat de sessions de foto tradicionals.
La intel·ligència artificial generativa ha canviat per complet la forma de crear imatges: ara un simple text pot acabar convertit en una il·lustració brutal, un fotograma de cinema hiperrealista o un concept art de nivell professional. Midjourney és una de les eines que més fort ha enganxat en aquest terreny i, quan comences a dominar els seus ordres avançades i trucs de prompt engineering, deixa de ser “una IA que dibuixa” per esdevenir gairebé un superpoder creatiu.
Si vols anar més enllà del típic “/imagini un paisatge bonic” i treure-li realment suc a Midjourney, necessites entendre com funcionen els seus prompts, paràmetres, maneres especials i petits hacks que utilitza la gent que l'esprem diàriament. En aquesta guia et desgranaré, pas a pas, tot allò que recullen les millors webs que posicionen sobre “Midjourney comandos avançados”, però explicat en un llenguatge clar, directe i molt pràctic, perquè puguis aplicar-lo en els teus propis projectes: des de campanyes d'ecommerce fins a il·lustracions personals.
Què és Midjourney i per què val la pena aprendre les seves ordres avançades
Midjourney és un generador d'imatges per IA que interpreta descripcions de text (prompts) i les converteix en il·lustracions, renders, escenes fotorealistes o art conceptual amb una qualitat estètica espectacular. Va néixer funcionant exclusivament dins de Discord, però avui també compta amb versió web, cosa que el fa molt més accessible per a qualsevol que vulgui crear contingut visual sense ser dissenyador.
A diferència d'altres models com DALL·E o Stable Diffusion, Midjourney està molt orientat a produir imatges amb un toc artístic, cinematogràfic i ple de detalls. És ideal per campanyes de màrqueting, mockups, portades, concept art, posts de xarxes o peces per a blocs. A més, amb cada nova versió (especialment la V5 i posteriors) ha anat millorant l'anatomia, la coherència d'escena i fins i tot la temuda generació de mans.
El flux bàsic és senzill: escrius l'ordre /imagine seguit de la teva descripció i, després d'uns segons, Midjourney et torna una quadrícula de quatre opcions. A partir d'aquí en pots millorar una, demanar variacions o refer el conjunt. Però on de debò s'obre el ventall és quan comences a jugar amb paràmetres com –ar, –stylize, –seed, –chaos, –tile, –repeat i amb tècniques com multiprompts, pesos o permutacions.
Dominar les ordres avançades no és un caprici tècnic: és el que marca la diferència entre imatges “acceptables” i resultats que semblen encàrrecs professionals fets a mida de la teva marca o projecte.
Com s'estructura un bon prompt a Midjourney
Un prompt a Midjourney pot ser tan simple o tan complex com vulguisperò convé seguir una estructura lògica perquè la IA entengui bé què ha de generar. No es tracta d‟escriure paràgrafs interminables, sinó de cobrir els elements clau amb claredat.
L'estructura bàsica d'un prompt complet sol incloure:
- comando: normalment
/imagine, que és el que diu al bot que generi una imatge. - Imatges de referència (opcional): URL d'imatges que guiaran l'estil, la composició o el personatge.
- Descripció textual: subjecte, acció, entorn, il·luminació, enquadrament i detalls clau.
- Modificadors d'estil: tècniques artístiques, artistes, gèneres, estètica general.
- paràmetres tècnics: relació d'aspecte, nivell de caos, qualitat, estilització, llavors, etc.
Un prompt ben muntat podria tenir aquesta pinta (exemple genèric): /imagine heroic warrior on a snowy battlefield, dramatic lighting, cinematic, ultra detailed, oil painting --ar 2:3 --stylize 300 --chaos 10. No cal que recitis una novel·la; l'important és cobrir el què, com es veu i el format final que vols.
Una altra idea clau és que Midjourney entén millor l'anglès que l'espanyol, sobretot quan parlem destils, tècniques fotogràfiques o noms de moviments artístics. Pots redactar la idea en espanyol i després traduir a anglès amb un traductor fiable per treure-li el màxim partit.
Ordres essencials de Midjourney a Discord
Tot i que la versió web simplifica molt l'experiència, a Discord tens una sèrie d'ordres (similar a slash personalitzats a Slack) que són el centre del treball avançat amb Midjourney. No són complicats, però cadascú obre una porta diferent.
Els més importants per treballar de debò amb prompts avançats són:
- /imaginar: l'ordre principal per generar imatges a partir de text i/o imatges.
- /blend: pensat per barrejar entre dues i cinc imatges ràpidament, molt útil al mòbil.
- /descriure: li envies una imatge i et torna quatre prompts de text que la descriuen.
- / settings: obre un panell per configurar versió de model, estil per defecte, Remix Mode, etc.
- /prefer option: us permet crear paràmetres personalitzats que combinin diversos paràmetres alhora.
- /prefer suffix: afegeix automàticament una “cua” de text o paràmetres a tots els teus prompts.
/blend és perfecte quan vols fusionar referències visuals sense complicar-te escrivint URLs una per una. Escriu /blend, puges les imatges i deixes que el model creï un híbrid: ideal per a personatges que barregen trets, logotips convertits en il·lustracions o mashups creatius.
/descriu és l'eina estrella per robar idees a les teves pròpies imatges oa recursos externs: puges la foto i Midjourney et torna prompts plens d'estils, adjectius i potenciadors que després pots modificar i reutilitzar. No sempre clava la composició, però és or pur per treure estils i paraules clau que potser no se t'haurien acudit.
Versions, models i modes especials de Midjourney
Midjourney no és un únic model estàtic, sinó un conjunt de versions i modes que pots seleccionar segons el que necessitis. Això afecta directament quins paràmetres pots fer servir ia l'estètica del resultat.
Els elements a tenir en compte són:
- Versió del model: es tria amb
--v(1, 2, 3, 4, 5, etc.). El més normal és utilitzar sempre la versió més recent. - Estil dins de cada versió: amb
--stylepots canviar variants (per exemple, 5a, 5b, o el mode--style rawper a una mica menys “embellit”). - Model Niji: amb
--nijiactives un model especialitzat en estètica animi i màniga. - Models de prova: usant
--testo--testpaccedeixes a variants experimentals que demanen feedback.
Canviar de versió o estil pot alterar completament com respon un mateix prompt: un text que a V5 produeix un retrat gairebé fotogràfic, en un model Niji es converteix en un personatge animi amb ulls enormes i colors plans. Per això és important indicar-ne sempre la versió i, si cal, l'estil.
Tingueu en compte també que alguns paràmetres estan limitats segons la versió: per exemple, certes relacions d'aspecte extremes o combinacions de qualitat i mida poden no estar disponibles o donar resultats rars en models antics, mentre que V5 admet relacions d'aspecte més flexibles i millor detall amb menys artefactes.
Upscale, variacions i Remix Mode: com iterar fins clavar la imatge
Quan Midjourney acaba una generació, et torna una quadrícula de 2×2 imatges. A sota veuràs botons U1, U2, U3, U4 (Upscale) i V1, V2, V3, V4 (Variacions), a més d'alguna acció extra segons la versió.
A les versions anteriors a la 5, fer Upscale significava regenerar aquesta imatge a més resolució, amb més detall i, de vegades, lleugeres diferències en textures i formes. A la V5, les imatges ja es generen d'entrada a 1024×1024, així que els botons U simplement “separen” aquesta imatge de la quadrícula per treballar-hi de forma independent.
Les variacions (V1-V4) generen quatre imatges noves basades en una de les anteriors, mantenint el mateix prompt i una imatge de soroll inicial semblant. Això et permet afinar pose, il·luminació o composició sense perdre completament la idea original; és com demanar a un il·lustrador "fes-me quatre versions més d'aquest concepte".
El Remix Mode és la cirereta del pastís per iterar: si ho actives a /settings, cada cop que prems un botó de variació s'obrirà una finestreta per editar el prompt abans de generar les noves imatges. Així podeu anar canviant personatges, fons, estils o certs paràmetres mantenint l'estructura visual de partida.
Això sí, Remix no torna a partir de zero: té en compte la imatge generada, la seva composició i els seus elements, i els “trasllada” al nou prompt. Canvis subtils (afegir una arma, canviar el tipus d'armadura, alterar l'entorn) acostumen a anar molt bé; canvis dràstics (passar d'un guerrer a una tassa de cafè) produeixen resultats rars però de vegades interessants. Cal provar i veure fins on aguanta la coherència.
Paràmetres avançats a Midjourney: el veritable panell de comandaments
Els paràmetres són opcions que afegeixes al final del prompt per controlar com es genera la imatge a nivell tècnic i estètic. Sempre van amb dos guions (--) i pots combinar tants com vulguis mentre siguin compatibles amb la versió i el model que estiguis usant.
A la versió 5 de Midjourney, els paràmetres clau que hauries de conèixer són:
Relació daspecte: –aspect / –ar
el paràmetre --aspect o --ar defineix la proporció ampla:alt de la imatge. Per defecte, Midjourney genera un quadrat (1:1), però el pots canviar a formats més fotogràfics o verticals per a personatges, portades, banners, etc.
Exemples típics dús daspecte serien --ar 3:2 per a un paisatge apaïsat, --ar 2:3 per a un pòster vertical o --ar 16:9 per a un format panoràmic estil pantalla. A V5 s'accepten pràcticament totes les proporcions raonables, encara que quan passes de 2:1 o 1:2 pot començar a retallar malament oa compondre rar.
No és només un tema de mida final: l'aspecte ràtio influeix en la imatge de soroll inicial i, per tant, en la composició sencera. Un mateix prompt a 1:1 i 16:9 pot canviar radicalment com s'organitza l'escena i quins elements apareixen retallats o centrats.
Caos: –chaos / –c
el paràmetre --chaos controla com serà de imprevisible el resultat. Amb --c 0 el model intenta ser més estable i “obedient”; a mesura que puges cap a 100, la IA es deixa anar la cabellera i es permet solucions més rares, composicions estranyes i experiments visuals.
Un caos alt és ideal per a la fase d'exploració: quan encara no saps ben bé quin estil vols, quan busques idees boges o quan vols trencar una mica la monotonia del prompt. Un cop trobes una línia que et funciona, pots baixar el caos per aconseguir variants més consistents.
Imatge Weight: –iw
Quan utilitzes imatges com a part del prompt (image prompting), --iw et permet decidir quant pes té la part visual davant del text. El valor per defecte és 1, i normalment el pots moure entre 0.5 i 2.
si puges --iw, Midjourney s'aferra més a la composició, forma i estil de la imatge de referència. Si el baixes, es deixa guiar més per la descripció textual i fa servir la imatge només com a inspiració suau. Molt útil per redissenyar personatges, canviar-los l'entorn o adaptar un dibuix cutre a una il·lustració decent.
Prompt negatiu: –no
el paràmetre --no serveix per dir-li a Midjourney què NO vols que aparegui. Tot el que escriguis després de --no i abans del següent paràmetre es prendrà com a elements a evitar a l'escena.
És especialment útil per treure detalls molestos: textos i tipografies rares, dits de més, elements de fons repetitius, colors que no encaixen amb la teva marca, etc. Exemples típics serien --no text, letters, logo o --no hands quan vols refer una posat usant una imatge prèvia però sense que apareguin mans deformes.
Funciona millor amb conceptes concrets que amb coses molt abstractes, i no és infal·lible. Si vols un control més fi, pots combinar-ho amb multiprompts negatius, que permeten ajustar el pes del que vols “empènyer fora” de la imatge.
Qualitat de detall: –quality / –q
--quality controla quants recursos dedica Midjourney a aquesta imatge. En versions anteriors podies posar --q .25, --q .5, --q 1 o fins i tot --q 2 per afinar quant detall volies. A V5, el valor màxim és 1; no pots superar-ho per aconseguir més detall, però sí reduir-ho per estalviar temps i crèdit.
Baixar la qualitat és perfecte per a esbossos ràpids, proves de composició o quan vols generar moltes imatges barates per després seleccionar les millors i refer només aquestes amb més cura. Recorda que qualitat no és resolució: la resolució ve donada pel model; aquí ajustes la finesa dels detalls.
Repetició: –repeat / –r
Amb --repeat o --r li dius a Midjourney que executi el mateix prompt diverses vegades de cop. Per exemple, --r 3 generarà tres treballs separats, cadascun amb la pròpia quadrícula de 4 imatges, a partir del mateix text.
És un estalvi de temps brutal quan estàs afinant un prompt i voleu veure moltes alternatives d'una tacada. A més, si el combines amb un nivell de caos raonable, multipliques les possibilitats que en alguna d'aquelles quadrícules aparegui la joia que estaves buscant.
Llavors: –seed
La llavor o --seed és el número que etiqueta la imatge de soroll inicial a partir de la qual Midjourney comença a “esculpir” la imatge final. Si repeteixes el mateix prompt amb la mateixa llavor a la mateixa versió, obtindràs imatges pràcticament idèntiques.
Usar seeds et permet tenir un control relatiu sobre la variació: podeu provar diferents estils, relacions d'aspecte, colors o petits canvis de text mantenint la idea general de composició. És molt útil per produir sèries coherents o per corregir un detall concret sense destrossar tota la resta.
A V5 ja no podeu recuperar la llavor d'una imatge escalada amb l'emoji de sobre, perquè en aquesta versió no hi ha un segon procés d'upscaling: les imatges ja surten a màxima resolució. Però sí que pots fixar tu mateix la seed amb un número entre 0 i 4.294.967.295 i reutilitzar-la quan ho necessitis.
Stop: –stop
el paràmetre --stop atura el procés de generació abans d'hora, en un percentatge que triïs entre 10 i 100. Amb valors baixos, les imatges es queden més “borroses”, menys detallades, com si fossin un esbós o un render inacabat.
És un paràmetre força nínxol i no sempre té una utilitat clara, però pot anar bé si vols un look més pictòric, amb menys definició, o si simplement t'interessa veure com evoluciona una escena sense arribar al final del denoising.
Stylize: –stylize / –s
--stylize és un dels paràmetres més importants a Midjourney, perquè li indica quant pes donar al seu entrenament artístic davant del teu prompt. A V5 el valor per defecte és 100 i pots moure'l de 0 a 1000.
Amb un stylize baix, el model s'agafa més al text i et dóna resultats potser menys vistosos però més fidels a la descripció. Amb valors alts, la IA posa damunt la taula tot allò que ha après a base d'imatges votades pels usuaris: més detall, millor composició, més dramatisme… però també més tendència a ignorar certes parts del prompt.
No és el mateix que el caos: Chaos se centra en la creativitat “boja” i la variació, mentre que Stylize empeny cap a imatges més boniques, complexes i polides. En prompts curts, pujar Stylize canvia poc; a prompts llargs i amb molts elements, pot transformar l'escena de forma radical.
Patrons en mosaic: –tile
el paràmetre --tile genera imatges que es poden repetir en mosaic sense talls visibles, perfecte per a patrons tèxtils, fons de pantalla, papers pintats o recursos gràfics repetibles.
El truc clàssic és generar un til senzill (per exemple, gotes de color pastís) i després utilitzar-lo com a textura base per a vestuari, fons o interfícies. Descàrregues la imatge, la repeteixes en un editor o en una web que comprovi la continuïtat i, si encaixa bé, ja tens el teu patró llest.
Prompting avançat: imatges de partida, multiprompts, pesos i permutacions
Més enllà dels paràmetres tècnics, l'autèntic salt de nivell arriba quan entens com estructurar el text i com combinar-ho amb imatges per guiar el model sense ofegar-lo.
Midjourney accepta com a input tant imatges com text. Pots fer-les servir per separat (només imatges amb /blend o només text amb /imagine) o barrejar-les: una o diverses imatges a l'inici del prompt i després una descripció escrita que afini què vols obtenir.
Si utilitzaràs diverses imatges com a referència, és recomanable que totes tinguin un aspect ràtio semblant al de la imatge final per evitar composicions estranyes. I recorda jugar amb --iw per ajustar quanta influència vols que tinguin davant del text.
Una tècnica molt utilitzada és: primer barreges imatges per obtenir un personatge base (per exemple, combinant una escultura clàssica, un fotograma de sèrie i un dibuix animi), i després uses aquesta imatge com a referència única al costat d'un prompt textual cada vegada més elaborat per definir acció, entorn, il·luminació, estil i detall.
Multiprompts amb :: i pesos
Encara que sembli que les comes separen idees dins del prompt, en realitat Midjourney els fa un cas molt relatiu. Si vols segmentar de veritat conceptes diferents, necessites fer servir el separador de multiprompt: ::.
Un multiprompt seria una cosa com viking warrior with shield:: full body:: intense action scene:: oil painting:: highly detailed. Cada bloc separat per :: es tracta de forma més independent, cosa que ajuda que la IA no confongui conceptes compostos (com cotton candy o hot dog) amb combinacions lliures de paraules.
A més, podeu afegir un nombre de pes després de l'últim :: per indicar-li quina part del prompt ha de tenir més importància relativa. Per exemple, cheese:: cake::1.5 fa que el pastís tingui més rellevància que el formatge, davant de cheese cake, que tendeix a interpretar “cheesecake” com a postres fet i dret.
Els pesos són relatius entre si: si poses cheese::1.5 cake::1.5, és equivalent a no haver posat números, perquè tots dos pesen el mateix. El més interessant és jugar amb relacions tipus 1:2 o 1:3 per emfatitzar un concepte sense anul·lar els altres.
També pots fer servir pesos negatius, escriviu hands::-0.5, perquè un element es comporti com un “anti-prompt”, semblant a --no però amb un control d'intensitat. Això sol funcionar millor per treure coses molt concretes o per ajustar detalls rebels que es resisteixen a desaparèixer.
Permutacions amb { }
Les permutacions són una eina espectacular per provar moltes variants d'un mateix prompt sense haver-lo de reescriure deu vegades. Es fan servir amb claus { } i comes per separar opcions.
Per exemple, aquest prompt {viking warrior with shield, muay thai fighter, reptilian}, full body, intense action scene, oil painting, highly detailed --ar 2:3 generarà un treball per a cadascuna de les tres opcions de subjecte, mantenint la resta igual.
Pots niar permutacions per variar detalls concrets, com l'arma: {viking warrior with {sword, axe, shield}, muay thai fighter, reptilian}, full body.... Això et permet generar sets enormes de proves en molt poc temps, encara que compte, perquè només es processaran les primeres 40 combinacions i pots fondre't les hores ràpides sense adonar-te'n.
També és possible permutar paràmetres i parts de multiprompts: per exemple, viking warrior with shield, full body --ar {3:2, 2:3} o with shield::{2, 1.5}. És la manera més ràpida d'esbrinar quina relació d'aspecte, quin pes o combinació d'estils dóna millor resultat per al vostre cas.
Si una opció dins de les claus inclou comes que vulguis conservar com a part del mateix bloc, cal escapar-les amb una barra invertida \ perquè Midjourney no les prengui com a separadors de permutació. D'aquesta manera podeu permutar “packs” d'estils complexos sense que es descomposin.
Altres paràmetres creatius: weird, tile, repeat i companyia
A més dels paràmetres ja comentats, hi ha uns quants extres que et poden ajudar a explorar terrenys més rars oa generar recursos concrets més ràpid.
--weird o --w empeny el model cap a interpretacions estranyes, surrealistes o directament marcianes. Accepta valors entre 0 i 3000: com més alt, més se li va l'olla a la IA. És perfecte per generar imatges oníriques, terror còsmic, art experimental o simplement per sortir del que és típic.
--repeat ja ho hem vist, però combinat amb caos o weird es converteix en una màquina d'escopir idees creatives; ideal quan estàs en fase de brainstorming visual per a una campanya o projecte artístic.
--tile ja comentat, és clau per a patrons repetibles que després pots fer servir en il·lustració, disseny de producte, interfícies o fons. Juntament amb la barreja d'imatges i el paràmetre --iw, dóna moltíssim joc per crear tèxtils, wallpapers o revestiments ficticis que semblen trets d'un catàleg real.
Trucs de prompt engineering per controlar millor els resultats
Quan comences a fer servir Midjourney de forma intensiva, t'adones que hi ha patrons que es repeteixen: elements que no apareixen per més que els cites, detalls que la IA s'inventa, estils que se li van de les mans… Hi entren en joc petits trucs de prompt engineering.
Una estratègia útil és duplicar parts del prompt a multiprompts quan alguna cosa no acaba de desaparèixer o aparèixer. Si amb un simple pes negatiu no n'hi ha prou per treure'l, pots posar aquesta part dues vegades amb pesos negatius equilibrats per reforçar el missatge sense trencar la suma total de pesos.
Una altra tècnica pràctica és combinar un prompt complet “normal” amb un multiprompt extra al final, dedicat a emfatitzar un detall que estàs trobant a faltar. Per exemple, si el teu personatge no té tatuatges malgrat esmentar-los, hi pots afegir :: tattoos::2 al final del prompt perquè Midjourney posi més focus en aquest element concret.
I si tot i així passa de tu, toca posar-se una mica brut i repetir la paraula diverses vegades: escriure “tattoos tattoos tattoos…” sol acabar convencent el model que, sí o sí, això és important. No és elegant, però funciona sorprenentment bé en alguns casos rebels.
No t'oblidis de l'ordre /describe com a generador de vocabulari: pots crear imatges boges usant caos i després passar-les per /descriu perquè la pròpia IA et suggereixi estils, autors i termes tècnics que podràs reutilitzar en prompts futurs amb més control.
Aplicacions pràctiques: ecommerce, xarxes socials, blocs i recursos interns
Tot aquest arsenal d'ordres i paràmetres no serveix de gaire si no el portes a casos reals. Midjourney encaixa especialment bé en contextos on necessites imatges personalitzades, ràpides i amb una estètica definida, però no tens pressupost per a sessions de fotos complexes.
A ecommerce pots utilitzar-lo per crear campanyes impossibles de fotografiar: per exemple, guitarres elèctriques de viatge que funcionen sota l'aigua, productes en entorns extrems o escenes surrealistes que reforcin atributs de marca. En lloc de llençar de banc d'imatges genèric, dissenyes visuals a mida amb la teva estètica.
Per a xarxes socials i blocs, Midjourney et permet il·lustrar cada peça de contingut amb imatges originals: articles educatius, posts inspiracionals, carrusels, portades de vídeo, etc. Només heu d'ajustar la relació d'aspecte al que demaneu cada plataforma (per exemple, --ar 9:16 per stories o reels) i jugar amb estils coherents amb la teva identitat visual.
Els mockups generats per IA també són molt útils: oficines modernes, parets de galeria amb obres, packaging sobre taules d'estudi, cartells en marquesines… Pots plantejar escenes completes on s'imagini el teu producte “en context”, sense haver de muntar físicament l'escenari.
A nivell intern, Midjourney serveix com a laboratori d'estil: moodboards, exemples d'ús del color, maquetes de presentacions, iconografia, fons… Pots fins i tot crear imatges per il·lustrar manuals de marca, guies de to visual o presentacions comercials, mantenint una coherència estètica que seria molt cara de produir de manera tradicional.
Al final, la clau és que combinis el coneixement d'ordres avançades amb una visió clara del que vols explicar visualment: la IA fa la feina dura de renderitzar, però la direcció creativa continua sent teva. Com millor sàpigues escriure i estructurar prompts, més semblarà que tens un equip sencer d'il·lustradors treballant per a tu, encara que en realitat només estiguis xatejant amb un bot des de Discord o la web.
Redactor apassionat del món dels bytes i la tecnologia en general. M'encanta compartir els meus coneixements a través de l'escriptura, i això és el que faré en aquest bloc, mostrar tot el més interessant sobre gadgets, programari, maquinari, tendències tecnològiques, i més. El meu objectiu és ajudar-te a navegar pel món digital de forma senzilla i entretinguda.
