Com canviar idioma de veu de Copilot i configurar idiomes en detall

Darrera actualització: 23/04/2026
Autor: Isaac
  • Copilot Studio permet agents multilingües, però l'idioma principal es fixa en crear l'agent i només es pot canviar la regió.
  • Els idiomes secundaris requereixen descarregar, traduir i tornar a carregar fitxers de localització, mantenint sincronitzades totes les cadenes.
  • La veu a Copilot integra reconeixement, temps d'espera, interrupció, SSML i transferència de trucades, amb opcions àmplies per idioma.
  • Microsoft 365 Copilot admet menys idiomes que la interfície, per la qual cosa de vegades exigeix ​​reformular les sol·licituds en un idioma suportat.

Configuració d'idioma de veu a Copilot

Si has començat a fer servir Copilot i t'estàs preguntant com canviar l'idioma de veu de Copilot o fer que entengui i respongui en diferents idiomes, no ets la única persona. Entre Copilot Studio, Microsoft 365 Copilot, les funcions de veu a Dynamics 365 Contact Center i guies sobre utilitzar Hey Copilot i la veu a Windows 11, hi ha moltes opcions… i també força matisos que convé conèixer.

A continuació trobareu una guia molt completa, en castellà d'Espanya i amb llenguatge clar, per entendre què es pot i què no es pot fer amb els idiomes, la veu i la regió a Copilot: des de configurar agents multilingües a Copilot Studio fins a saber quins idiomes admet Microsoft 365 Copilot, com funciona la veu interactiva i quines limitacions et trobaràs en el dia a dia.

Idiomes i regió de l'idioma principal a Copilot Studio

Selecció d'idioma principal de Copilot

Copilot Studio permet crear agents en molts idiomes diferents, de manera que puguis arribar a usuaris de diversos països sense haver de duplicar tot el projecte. No obstant això, hi ha una regla clau que t'has de gravar a foc: l'idioma principal de l'agent només es tria en crear l'agent i no es pot canviar després.

El que sí que pots fer, si l'idioma ho permet, és canviar la regió associada a aquest idioma principal. Per exemple, si el vostre agent està en espanyol, podríeu passar de la variant d'Espanya a una altra regió compatible, sempre que estigui disponible a la llista de regions per a aquest idioma.

El canvi de regió es fa des de la configuració del propi agent: entres a Configuració, vas a Idiomes, edites l'idioma principal i tries la regió que t'interessi. Això et va bé si necessites ajustar matisos regionals (com ara ortografia, format de data o expressions pròpies) sense refer l'agent des de zero.

Un cop creat l'agent, Copilot Studio ja genera contingut base a l'idioma de destinació: temes del sistema i temes personalitzats predefinits a la pàgina de Temes, tot adaptat a aquest idioma principal.

Copilot Studio com a plataforma multilingüe

Agent multilingüe a Copilot

El gran punt fort de Copilot Studio és que permet crear agents multilingües que detecten automàticament l'idioma de l'usuari (basant-se en la configuració del navegador o del client) i responen en aquest mateix idioma quan està admès.

En dissenyar l'agent, has de triar un idioma principal, que és on faràs tota l'edició de temes i contingut. Aquest idioma principal actua com a base: tot s'hi dissenya i després es localitza a la resta d'idiomes.

Després hi pots afegir idiomes secundaris. A partir d'aquell moment, ets tu (o el teu equip de localització) qui s'encarrega de traduir els missatges dels temes que creïs. En agents que usen orquestració generativa, Copilot tradueix automàticament els missatges generats, però la resta del contingut el segueixes gestionant tu.

Quan un usuari inicia una sessió amb un agent publicat, el sistema intenta ajustar l'idioma de l'agent a l'idioma del navegador o client. Si aquesta llengua no està suportada, o no es detecta res, l'agent torna a la vostra llengua idioma principal com a alternativa.

A més, pots dissenyar el teu agent perquè canvieu d'idioma enmig d'una conversa, ja sigui de forma explícita (mitjançant lògica en un tema) o automàticament seguint l'idioma que l'usuari vagi usant a cada torn.

Com afegir idiomes secundaris a un agent

Afegir idiomes secundaris a Copilot Studio

Afegir nous idiomes a un agent de Copilot Studio no té gaire misteri a nivell d'interfície, encara que després la part de localització sí que requereix més afecte. El flux bàsic per afegir idiomes secundaris és el següent:

Primer entres a la pàgina de Configuració de l'agent i selecciones Idiomes. Des d'aquí, tries l'opció d'afegir un idioma nou, revises la llista i marques els que vulguis incorporar com a secundaris a l'agent.

Al panell d'alta d'idiomes, selecciones un o diversos idiomes i polses Afegeix. Un cop afegits, tornes a la llista, comproves que tot està bé i tanques la pàgina de configuració. A partir d?aquell moment, aquests idiomes ja formen part del repertori de l?agent.

Tingues en compte que, després d'afegir-los, hauràs de gestionar les traduccions (descarregar cadenes, traduir-les i tornar-les a pujar) perquè l'agent no deixi parts sense localitzar i no es vegin barreges rares entre l'idioma principal i els secundaris.

Gestió de la localització en agents multilingües

Localització de contingut a Copilot

A Copilot Studio, totes les tasques de creació i edició de temes es realitzen sempre a l'idioma principal de l'agent. Per traduir-los a la resta d'idiomes, es fa servir un flux de localització basat en fitxers JSON o ResX.

Quan baixeu per primera vegada el fitxer de localització per a un idioma secundari, totes les cadenes apareixen a l'idioma principal. Aquest arxiu és el que has de passar pel teu procés de traducció habitual, ja sigui amb traductors humans, eines de traducció assistida o els sistemes que facis servir a la teva organització.

El procés estàndard per preparar contingut localitzat sol ser:

Vas a la pàgina de Configuració de l'agent, apartat Idiomes, ia la llista d'idiomes secundaris tries l'opció de carregar/actualitzar. Des del panell d'Actualització de localització tries el format (JSON o ResX), descarregues el fitxer de localització actual i l'obres al teu editor.

Després substitueixes les cadenes en idioma principal per la traducció, mantenint els identificadors intactes. Quan acabis, tornes al panell, puges el fitxer traduït i tanques la configuració. Així, el teu agent ja tindrà el contingut preparat per respondre en aquest idioma secundari.

Actualització de contingut localitzat i sincronització de cadenes

Quan modifiques el contingut a l'idioma principal (afegeixs nous missatges o canvies textos), els idiomes secundaris no s'actualitzen sols. Sempre que hi hagi canvis a les cadenes base, hauràs de repetir el procés de descàrrega, traducció i càrrega dels fitxers de localització per mantenir tot al dia.

A la pràctica, quan descarreguis de nou el fitxer de localització d'un idioma secundari veuràs que les cadenes noves apareixen encara a l'idioma principal, mentre que les que ja estaven traduïdes es mantenen com les vas deixar.

El matís important és que, si has canviat el text original d'alguna cadena a l'idioma principal, la cadena traduïda corresponent seguirà mostrant la versió antiga, perquè els identificadors no canvien. Això pot produir una desincronització entre el que es veu a l'idioma principal i als secundaris.

Per això és bona pràctica comparar el nou fitxer de localització amb què vas pujar l'última vegada per detectar quines cadenes de l'idioma principal han canviat i saber què cal retraduir. Si no cuides això, acabaràs amb agents on l'espanyol va per una banda, el francès per l'altra i l'experiència de l'usuari se'n ressent.

Localització de contingut dinàmic a Adaptive Cards

Un punt una mica més tècnic, però molt rellevant si uses interfícies riques, és que els fitxers de localització no inclouen cadenes mixtes d'Adaptive Cards quan combinen text estàtic i variables.

  Com desactivar Microsoft 365 Copilot: Guia completa

Perquè aquest contingut dinàmic de les targetes es pugui localitzar, cal aplicar una solució alternativa: crear una variable de text intermèdia que contingui la cadena completa (text fix + variables) i utilitzar només aquesta variable a la targeta adaptable.

El procediment consisteix a col·locar abans de la targeta un node de Establir valor de variable, que després ajustes a l'editor de codi per convertir-lo en un node de tipus SetTextVariable. En aquest node defineixes una nova variable i emplenes el camp de valor amb el text complet, inserint les variables on correspongui.

Després actualitzes l'Adaptive Card perquè només feu referència a aquesta variable. Quan descarregueu el fitxer de localització, el valor d'aquesta variable (amb text estàtic i referències a variables) apareixerà com una cadena localitzable dins d'una acció setVariable, i ja podreu traduir-lo sense perdre les parts dinàmiques.

Com provar un agent multilingüe

Per comprovar que el teu agent es comporta bé en diversos idiomes, Copilot Studio inclou un panell de proves força flexible. Pots seleccionar un idioma concret i veure com entén i respon el bot.

Des d'aquest panell, obriu el menú d'opcions (els tres punts) i tries l'idioma que vulguis. El panell de proves es recarrega usant aquesta llengua, mentre que el llenç d'edició segueix fidel a l'idioma principal i, important, no us deixarà desar canvis en temes fins que tornis a aquest idioma base.

A partir d'aquí podeu escriure missatges de prova en l'idioma seleccionat i veure si els temes es disparen correctament, com es comporten les traduccions i si l'orquestració generativa respon com esperes.

Una altra opció és canviar el idioma del navegador un dels que suporta l'agent i entrar al lloc web de demostració. El lloc s'obre directament en aquest idioma i l'agent conversa a la llengua corresponent. Si a més vols utilitzar ordres de veu, consulta com utilitzar Hey Copilot.

Fer que l'agent canviï d'idioma en una conversa

Si vols que el teu agent pugui canviar d'idioma a mitja sessió, pots donar suport a la variable de sistema User.Language. La lògica per canviar-la pot viure en qualsevol tema, encara que la recomanació és fer-ho tot just després d'un node de Pregunta, per garantir que tots els missatges que vinguin a continuació s'emetin en el mateix idioma.

El truc és establir User.Language amb un dels idiomes secundaris de l'agent. Quan ho fas, l'idioma que “parla” l'agent canvia immediatament i les respostes següents es generen ja en aquest nou idioma.

Això és útil, per exemple, si en un flux inicial preguntes a l'usuari en quin idioma vol continuar i, segons la seva elecció, actualitzes la variable User.Language. A partir d'aquí tot el flux es desenvolupa en aquesta llengua.

Canvi dinàmic d'idioma segons el que escriu l'usuari

A més del canvi explícit, Copilot Studio ofereix la possibilitat de canviar d'idioma dinàmicament al llarg de la mateixa conversa, detectant en quin idioma escriu l'usuari a cada missatge.

Per això se sol fer servir un tema amb desencadenador “Es rep un missatge”, que actua com a filtre general sobre tot el que arriba. Dins aquest tema, es configura una sol·licitud personalitzada que determini l'idioma del missatge. El resultat es desa en una variable (per exemple, DetectedLanguage.structuredOutput.languagepersonalitzada).

A continuació es crea una condició basada en aquesta variable i es ramifica la lògica segons l'idioma detectat. A cada branca s'afegeix un node d'Establir valor de variable que actualitza User.Language amb l'idioma corresponent.

D'aquesta manera, si l'usuari comença escrivint en neerlandès i després passa a l'anglès, l'agent pot canviar automàticament de neerlandès a anglès tantes vegades com calgui durant la sessió, sempre que aquests idiomes estiguin configurats com a suportats per l'agent.

Prioritat d'idioma i restauració de l'idioma per defecte

Quan un agent està configurat per al canvi d'idioma dinàmic i s'estableix la variable User.Language, aquesta preferència actua com una anul·lació persistent per a aquest usuari. És a dir, el sistema aplica un ordre de prioritat a l'hora de decidir en quin idioma respondre:

Primer, la prioritat més alta la té preferència d'idioma que el mateix usuari hagi establert i que quedi guardada com a override en el seu estat. En segon lloc, es té en compte l'idioma del missatge entrant (Activity.Locale) sempre que coincideixi amb un dels idiomes suportats. I, en darrer terme, s'usa el idioma principal de l'agent com a recurs de suport.

Si vols “netejar” aquesta anul·lació després d'haver fet proves amb el canvi dinàmic d'idioma, pots enviar l'ordre /debug clearstate a l'agent. Això suprimeix l'idioma persistent de l'estat de l'usuari i l'agent torna a avaluar l'idioma segons el navegador o l'idioma principal.

Comportament d'un agent multilingüe davant d'idiomes no configurats

Si un usuari configura el vostre navegador en un idioma que no tinguis activat a l'agent, Copilot no intenta fer malabars: simplement torna al seu idioma principal. Per això és important triar bé aquest idioma base, ja que serà el comodí per a qualsevol situació no coberta.

Recorda també que, encara que pots canviar la regió de l'idioma principal (quan hi ha diverses variants disponibles, com a diferents països), no podeu canviar l'idioma en si mateix un cop creat l'agent. Si us heu equivocat d'idioma principal en arrencar el projecte, la solució passa per crear un nou agent.

Traduccions que falten i errors en publicar agents multilingües

Un altre comportament important: si afegeixes nous missatges al idioma principal i no actualitzes les traduccions als idiomes secundaris, l'agent mostrarà aquests textos sense traduir a l'idioma principal fins i tot quan l'usuari estigui fent servir un altre idioma.

Això no trenca el bot, però sí que afecta l'experiència: l'usuari veurà parts en el seu idioma i parts en la llengua base, de manera que convé mantenir sempre al dia els fitxers de localització quan introduïu canvis en els temes.

En publicar agents multilingües també pot aparèixer l'error de “Error de validació del bot” amb codi SynonymsNotUnique. Aquest missatge indica que hi ha sinònims duplicats en algun fitxer de localització o un sinònim que coincideix amb el DisplayName d'un element.

Normalment, això passa en un node que conté un Entity.Definition.'closedListItem' on un dels elements de Synonyms no és únic o coincideix amb el DisplayName. La regla és clara: tots els sinònims per a la mateixa entitat han de ser únics i diferents del DisplayName. Per arreglar-ho, heu de revisar el JSON o ResX de l'idioma secundari, localitzar les entrades conflictives i corregir-les.

Compatibilitat d'idiomes a Copilot Studio

Copilot Studio ofereix nivells de compatibilitat per idioma per a diferents característiques. No tots els idiomes són al mateix nivell ni per a les mateixes funcions. De manera general, Microsoft classifica el suport en tres fases: disponibilitat general (la més sòlida), versió preliminar i sense suport.

Per al llenç de creació (la interfície que veu el creador de l'agent), Copilot Studio fa servir l'idioma del navegador. Entre els idiomes suportats per a la interfície s'inclouen, entre d'altres: àrab, xinès simplificat i tradicional, txec, danès, neerlandès, anglès (Estats Units), finès, francès (França), alemany, grec, hebreu, hindi, indonesi, italià, japonès, coreà, noruec bokmål, (Espanya), suec, tailandès i turc.

  Usar Google Gemini a Google Docs amb Android: guia completa

Per als proveïdors de software: XNUMX-XNUMX-XNUMX. desencadenadors d'esdeveniments (que permeten crear agents autònoms que reaccionen a esdeveniments sense entrada directa de l'usuari), actualment se suporta principalment l'anglès (Estats Units). És a dir, la part més tècnica d'automatització externa està orientada de moment a aquesta variant d'anglès.

En les respostes generatives, orquestració i llenguatge d'usuari, la llista d'idiomes és més àmplia: a més dels ja esmentats, incorpora diferents variants d'anglès (Austràlia, Regne Unit, Estats Units), francès (França i Canadà), portuguès (Portugal i Brasil), espanyol d'Espanya i dels Estats Units, i molts altres. Aquests són els idiomes on els usuaris poden escriure les seves preguntes i rebre respostes generades per l'agent.

La compatibilitat amb veu s'alinea en gran mesura amb aquesta llista: agents que admeten respostes de veu interactives en àrab, xinès (simplificat i tradicional), txec, danès, neerlandès, anglès (Austràlia, Regne Unit, Estats Units), finès, francès (França i Canadà), alemany, grec, hindi, indonesi, italià, japonès (Brasil i Portugal), rus, espanyol (Espanya i Estats Units), suec, tailandès i turc.

Idiomes admesos i errors d'idioma a Microsoft 365 Copilot

Microsoft 365 Copilot no sempre admet els mateixos idiomes que Copilot Studio, especialment quan parlem de idioma de les sol·licituds i les respostes. És relativament habitual que la interfície d'usuari de Teams o Office estigui traduïda a molts més idiomes que els que Copilot és capaç de processar de manera intel·ligent.

Si utilitzeu Microsoft 365 Copilot i us apareix un error indicant que un idioma no és compatible, vol dir que en aquest moment el sistema no pot processar la sol·licitud en aquesta llengua concreta. Podries veure aquest error fins i tot encara que tota la interfície de l'aplicació estigui perfectament traduïda al vostre idioma.

Quan això passa, el missatge sol demanar-te que reformules la teva sol·licitud en un dels idiomes admesos i ho intentis de nou. És a dir, Copilot us obliga a “canviar l'idioma de veu” o de text de la vostra petició a un idioma suportat si voleu rebre resposta.

Microsoft va ampliant el catàleg d'idiomes admesos a mesura que evoluciona el producte, i la documentació oficial s'actualitza quan s'hi incorporen noves llengües. Si treballes en un entorn on l'idioma de treball encara no està suportat, hauràs de combinar Copilot amb eines de traducció externes actualment.

Suport i comunitat per a dubtes sobre Copilot

En cas de trobar-vos amb problemes d'idioma, de veu o de configuració que no es resolen amb la documentació, Microsoft recomana acudir a Preguntes i respostes de Microsoft per a qüestions avançades de Copilot. Tot i que els fòrums de Respostes (Answers) segueixen existint, hi ha menys recursos específics per provar i diagnosticar casos complexos amb Copilot.

A Microsoft Q&A hi participa un grup més especialitzat de personal tècnic i altres usuaris que comparteixen experiències, configuracions i solucions, cosa que sol donar lloc a respostes més afinades quan t'encalles amb un comportament estrany d'idiomes, veu o integració.

Copilot Studio i veu interactiva amb Dynamics 365 Contact Center

Quan parlem de “idioma de veu de Copilot” en un context de centre de contacte, entren en joc les capacitats de resposta de veu interactiva (IVR) integrades amb Dynamics 365 Contact Center. Aquí un agent habilitat per a veu funciona de manera diferent a un purament de xat, perquè treballa amb la modalitat de veu i DTMF (els tons que es marquen des del teclat telefònic).

Un agent de veu inclou temes de sistema específics per a escenaris de veu com a detecció de silenci, veu no reconeguda o pulsació de teclat desconeguda. Aquests temes s'afegeixen automàticament quan habiliteu la veu en la configuració de l'agent i us permeten gestionar situacions típiques d'una trucada telefònica.

L'activació de l'opció Habilitar veu es fa des de Configuració > Veu de l'agent. En fer-ho, també pots decidir si la veu serà la modalitat per defecte per a la creació de temes i si utilitzaràs un enfocament bàsic (temes clàssics) o veu en temps real (orquestració generativa).

Si en algun moment deixes de fer servir el canal de telefonia, pots desactivar l'optimització per a veu. Això farà que la modalitat predeterminada torni a ser text, desapareixeran les millores de reconeixement de veu i no es crearan elements específics de veu, encara que el canal de telefonia com a tal no s'elimina fins que el modifiquis.

Ús de la veu com a mode principal de creació

Quan la veu està habilitada, podeu escollir veu i DTMF com a modalitat per a cada node dels teus temes. A més, hi ha una preferència a nivell d'agent per marcar que la veu sigui el mode principal de creació, cosa que garanteix que tots els camps que ho necessitin es configurin amb la modalitat adequada.

Això afecta també la disponibilitat dels missatges segons el canal: hi ha diferències entre com es lliuren missatges en canals purament de text i en canals de text i veu combinats. Per exemple, alguns missatges poden quedar buits o no disponibles en veu si no estan preparats amb aquesta modalitat.

Reconeixement de veu automàtic personalitzat

En dominis especialitzats (sanitat, finances, etc.) és freqüent que l'usuari parli usant termes tècnics o argot que un sistema genèric podria no reconèixer bé. Per millorar aquesta precisió, Copilot Studio permet activar un reconeixement automàtic de veu personalitzat que s'alimenta de les dades del mateix agent.

Aquest paràmetre s'habilita des de Configuració > Veu de l'agent, marcant l'opció per augmentar la precisió amb les dades de l'agent. Després de desar els canvis i publicar l'agent, les trucades haurien de beneficiar-se d'un reconeixement més fi en aquest context concret. Si necessites configurar el reconeixement a nivell de sistema, consulta com activar o desactivar el reconeixement i accés per veu a Windows 11.

Ajustaments globals de veu: temps despera, silenci i latència

La configuració de Veu a nivell d'agent permet establir valors predeterminats de temps d'espera i comportament que després poden ser substituïts a nivell de node. Entre altres paràmetres, podeu ajustar:

El temps d'espera entre dígits DTMF, és a dir, quants mil·lisegons pot passar entre pulsacions quan l'usuari marca diversos dígits. També el temps d'espera de finalització DTMF, que determina quant s'espera a la tecla de terminació abans d'assumir que ja s'ha acabat l'entrada.

La detecció de silenci defineix quant de temps pot estar l'usuari sense dir res abans que l'agent actuï (per exemple, repetint la pregunta o disparant un tema de silenci). A més, per a la recollida de veu pots controlar el temps de finalització de lexpressió (pausa després de parlar) i el temps total de reconeixement de veu.

Una altra zona important són els missatges de latència per a operacions de llarga durada. Pots decidir quant triga l'agent a enviar un missatge informant que està processant alguna cosa i durant quant de temps, com a mínim, es reproduirà aquest missatge encara que l'operació s'acabi abans.

Finalment tens un control de sensibilitat de veu, que equilibra la detecció de veu davant del soroll de fons. Reduir-la és útil en entorns sorollosos o amb mans lliures; augmentar-lo ajuda en contextos molt silenciosos o amb usuaris que parlen molt baix. Aquest control, a diferència dels altres, no s'anul·la a nivell de node.

Interrupció (barge-in) i quan desactivar-la

Una funció molt apreciada en IVR avançats és la capacitat de interrompre l'agent mentre parla. Copilot Studio permet habilitar la interrupció tant per a entrades de veu com per a DTMF, cosa que fa més àgil l'experiència quan l'usuari ja coneix les opcions del menú i no necessita escoltar tota la locució.

  Tencent enforteix la seva aposta per la IA i presenta el model avançat Hunyuan-T1

No obstant això, hi ha moments en què té sentit deshabilitar la interrupció, com en el primer missatge de l'agent (per assegurar que tothom escolti la informació clau) o en missatges de compliment que no s'haurien de tallar.

La configuració es fa node a node: a cada Missatge o Pregunta amb modalitat veu i DTMF, podeu activar o desactivar l'opció de permetre interrupció. El sistema tracta les cues de missatges en lot de manera que, en acabar una cua, la configuració d'interrupció es restableix per al bloc següent.

Configuració detallada de silenci, repetició i accions alternatives

A més dels temps d'espera globals, podeu personalitzar el comportament d'un node concret respecte al silenci de lusuari. Per a cada Pregunta de veu pots triar entre fer servir la configuració global, desactivar el temps d'espera (esperar indefinidament) o indicar un número específic de mil·lisegons abans de repetir la pregunta.

També es poden definir accions alternatives: quantes vegades es repeteix la mateixa pregunta, quin missatge s'utilitza per a aquestes repeticions i què fa l'agent després de superar el nombre màxim d'intents (per exemple, transferir un agent humà o finalitzar la trucada).

Per a l'entrada de veu en concret, s'ajusten paràmetres com ara temps de pausa que es considera fi del discurs i el temps màxim que es dóna a lusuari una vegada comença a contestar. Això permet adaptar el comportament a trucades amb usuaris més pausats o contextos on la rapidesa és clau.

Missatges de latència i operacions llargues

A escenaris on l'agent desencadena operacions de back-end que triguen a completar-se (consultes pesades, integracions externes, etc.), és bona idea configurar missatges de latència que informin l'usuari que el sistema segueix treballant.

A Copilot Studio, podeu fer que l'agent enviï i repeteixi un missatge mentre un flux de Power Automate segueix en execució. A les propietats del node d'acció seleccioneu l'opció de enviar missatge, defineixes el text (fins i tot amb SSML per ajustar veu, pauses i èmfasi) i controles quant de temps s'espera abans de repetir-lo i quin és el temps mínim de reproducció.

Terminació de trucada, contestadors i variables de context

En un IVR real també necessites que l'agent pugui finalitzar la trucada de manera explícita quan el flux acaba. Això es configura afegint un node de finalització de conversa al tema corresponent, dins de l'apartat d'administració de temes.

Així mateix, hi ha un tema de sistema per detecció de contestador automàtic, que permet detectar quan una trucada entra en una bústia de veu i deixar un missatge enregistrat. Al node de Missatge d'aquest tema defineix el text que es reprodueix quan l'agent detecta una contestadora.

Per integrar tot això amb Dynamics 365 Contact Center, Copilot Studio admet variables de context que es passen juntament amb la trucada quan es transfereix a un agent humà oa altres sistemes. Entre elles hi ha, per exemple, l'identificador de la trucada de l'usuari, el número a què s'ha trucat, la capçalera SIP UUI, el tipus d'entrada (veu o DTMF), l'última tecla marcada, si només es permet DTMF i valors de confiança del reconeixement de veu.

Aquestes variables es poden utilitzar per enriquir l'experiència de l'agent humà que rep la trucada (mostrant context previ, dades recollides durant la interacció amb el bot, etc.) i per prendre decisions d'encaminament intel·ligent dins del centre de contacte.

Formatar la veu amb SSML i canviar “com sona” Copilot

Més enllà de triar idioma i veu, Copilot Studio permet afinar força com sona l'agent gràcies a l'ús de SSML (Speech Synthesis Markup Language). SSML funciona amb etiquetes similars a HTML que envolten el text que vols modificar; també pots combinar-ho amb eines de veu com Flux de Wispr per convertir la teva veu en fluxos de treball i productivitat.

Entre les etiquetes més útils hi ha (per inserir fitxers d'àudio externs), (per inserir pauses), (per marcar èmfasi en determinades paraules), (per ajustar to, velocitat i volum) i (per alternar idiomes de locució dins un mateix missatge quan uses una veu neuronal multilingüe).

Des de la interfície de Copilot Studio pots inserir aquestes etiquetes directament als nodes de Missatge o Pregunta amb modalitat de veu. El menú d'etiquetes SSML us permet inserir la plantilla d'etiqueta i després només has d'envoltar les parts del text que vulguis modificar. És possible combinar múltiples etiquetes i personalitzar fragments diferents d'un mateix missatge amb estils de veu diferents.

Transferències, integració amb telefonia i futur de la traducció en temps real

Copilot Studio també fa possible transferir trucades a números externs (PSTN o encaminament directe) ia representants humans. Per a transferències externes es configura un node específic on indiques el número de telèfon i, opcionalment, una capçalera SIP UUI amb parells clau=valor que poden llegir sistemes externs. Actualment, aquestes transferències no admeten l'ús de variables al número.

Mirant una mica més enllà, Microsoft està treballant en funcions de traducció de veu en temps real en videotrucades de Teams, impulsades per Copilot. La idea és que la veu duna persona es pugui simular i traduir en directe a un altre idioma, de manera que la resta de participants escoltin una altra pista dàudio, en un altre idioma, però amb un timbre molt similar al de la veu original.

Aquesta funció, pensada sobretot per empreses i organitzacions que no poden costejar un intèrpret, oferirà inicialment un conjunt d'idiomes com a castellà, anglès, alemany, francès, italià, coreà, mandarí, japonès i portuguès de Brasil. Abans de cada trucada, els usuaris haurien de donar el seu consentiment i triar quin idioma volen que es faci servir.

Microsoft ha recalcat que no es tracta d'un deepfake en el sentit clàssic, ja que no se simula que parlis perfectament un altre idioma a nivell naturalista, sinó que es genera una pista d'àudio alternativa que respecta al màxim la teva veu original però traduïda. Aquesta línia forma part de l'evolució contínua de Copilot cap a experiències de comunicació multilingüe més fluides tant en text com en veu.

Amb tot això, queda clar que canviar l'idioma de veu de Copilot no és només una qüestió de menú, sinó d'entendre bé quins idiomes suporta cada component (Studio, Microsoft 365, Contact Center), com es gestionen les traduccions i com influeixen variables com User.Language, la detecció automàtica d'idioma o els paràmetres de veu i SSML. Dominar aquestes peces us permetrà construir experiències de Copilot realment naturals, multilingües i adaptades al context en què treballeu, evitant sorpreses amb idiomes no admesos o missatges que es colen en l'idioma equivocat.

es pot utilitzar Copilot com a assistent predeterminat a Android?
Article relacionat:
Com utilitzar “Hey Copilot” i la veu a Windows 11 pas a pas