Kërkesat e pahijshme kundrejt atyre të sjellshme dhe ndikimi i tyre në inteligjencën artificiale

Mundobajt » How To » Njoftime të pahijshme kundrejt atyre të sjellshme: si ndryshojnë përgjigjet e inteligjencës artificiale

Studimet që përdorin ChatGPT-4o tregojnë se kërkesat shumë të pahijshme mund të arrijnë saktësi më të madhe sesa ato jashtëzakonisht të sjellshme në detyrat me zgjedhje të shumëfishta.
Toni i mesazhit vepron si një sinjal konteksti për modelin, duke aktivizuar mënyra përgjigjeje më të drejtpërdrejta, lajkatuese ose të hollësishme në varësi të formulimit.
Studime të tjera tregojnë efekte të ndryshme, duke treguar se ndikimi i tonit varet nga modeli, detyra dhe lloji i trajnimit.
Në vend që të inkurajohet vrazhdësia, çelësi praktik është të formulohen nxitje të qarta dhe të strukturuara, duke ruajtur njëkohësisht një qasje respektuese dhe të vetëdijshme ndaj këtyre paragjykimeve.

Kërkesa të pahijshme kundrejt atyre të sjellshme në inteligjencën artificiale

Për vite me radhë na është thënë vazhdimisht se duhet t'u themi "ju lutem" dhe "faleminderit" asistentëve virtualë., pothuajse sikur Siri, Alexa o Biseda GPT ishin mysafirë në shtëpi. Kjo ide e "sjelljes dixhitale" dukej logjike: nëse ndërfaqet janë bisedore, është normale të sillesh si në një bisedë të sjellshme. Megjithatë, një sërë studimesh të kohëve të fundit kanë ndezur kambanat e alarmit: në kushte të caktuara, Njoftimet e pahijshme shkaktojnë përgjigje më të sakta sesa ato të sjellshme..

Ky paradoks ngre pyetje teknike, etike dhe praktike.Pse të fyesh një IA A mund ta bëjë kjo më të saktë? A ndodh kjo vetëm me ChatGPT apo edhe me modele të tjera si p.sh. Binjakët, Klod, Grok me kujtesë, pilot i dytë Apo Meta AI? A po i trajnojmë pa dashje sistemet që të reagojnë më mirë kur i keqtrajtojmë? Dhe, mbi të gjitha, A duhet ta ndryshojmë mënyrën se si flasim me inteligjencën artificiale vetëm për të fituar disa pikë në saktësi?

Studimi i Pensilvanisë: Kur të qenit i pasjellshëm përmirëson notën tënde

Shkalla e debatit aktual vjen nga një studim i Universitetit Shtetëror të Pensilvanisë., të udhëhequr nga studiuesit Om Dobariya dhe Akhil Kumar. Qëllimi i tyre ishte aq i thjeshtë sa edhe intrigues: të testonin nëse ton Sjellja e përdoruesit - e pasjellshme, neutrale ose shumë e sjellshme - ndikon në cilësinë e përgjigjeve nga një model i madh gjuhësor (LLM) siç është ChatGPT-4o.

Autorët hartuan 50 pyetje me zgjedhje të shumëfishta mbi lëndë të ndryshme - matematikë, histori, shkencë - dhe i rishkruan ato në pesë tone të ndryshme: "shumë i sjellshëm", "i sjellshëm", "neutral", "i pasjellshëm" dhe "shumë i pasjellshëm". Struktura e pyetjes dhe përmbajtja e saj mbetën të njëjta; vetëm mënyra e adresimit të modelit ndryshoi, nga formula të sjellshme si "A mund të më ndihmoni me këtë pyetje, ju lutem?" në shprehje përçmuese si "Krijesë e varfër, a e di ti si ta zgjidhësh këtë?" ose "E di që nuk je shumë i zgjuar, por zgjidhe këtë për mua tani."

Në total, u gjeneruan 250 variacione të këtyre 50 pyetjeve bazë.dhe u ekzekutuan në model në raunde të shumta për të matur saktësinë statistikore. Modeli i përdorur ishte ChatGPT-4o, një nga versionet e fundit të OpenAI, të vlerësuara në një format pyetësori me zgjedhje të shumëfishta ku ishte e mundur të llogaritej qartë përqindja e përgjigjeve të sakta.

Rezultatet shkatërruan më shumë se një paragjykim.Formulimet "shumë të papërpunuara" arritën afërsisht një 84,8% saktësi, ndërsa pyetjet "shumë të sjellshme" mbetën përreth 80,8%Disa përmbledhje tregojnë një shifër prej 84,4% për mesazhet fyese, por diapazoni është i ngjashëm: një rritje prej rreth 4 pikësh përqindjeje në favor të tonit më të ashpërNdërmjet këtyre, kërkesat neutrale dhe "vetëm" të sjellshme mbetën në pozicione të ndërmjetme, me dallime të vogla, por të qëndrueshme.

Gjëja më e habitshme nuk ishte vetëm se vrazhdësia funksiononte më mirë, por edhe se mirësjellja ekstreme dukej se penalizonte saktësinë.Në formulimet më të hollësishme, shkalla e suksesit ra edhe më tej, duke arritur në rreth 75,8% në disa analiza. Me fjalë të tjera, shtimi i shumë "kënaqësive", perifrazimeve dhe zbukurimeve mund të ketë vepruar si një shqetësim i vogël për modelin.

Është thelbësore të theksohet konteksti i kufizuar i eksperimentit.Studimi u përqendrua vetëm në ChatGPT-4o, u vlerësua duke përdorur pyetje me zgjedhje të shumëfishta dhe ende nuk i është nënshtruar një shqyrtimi gjithëpërfshirës nga kolegët. Kjo do të thotë që gjetjet e tij duhet të interpretohen si një tregues interesant, jo si një ligj universal që rregullon sjelljen e të gjitha inteligjencës artificiale në çdo detyrë.

Studim mbi mirësjelljen dhe vrazhdësinë në kërkesat e inteligjencës artificiale

Si e përkufizuan ata termin "shumë i sjellshëm", "neutral" dhe "shumë i pasjellshëm"?

Që eksperimenti të ishte sadopak rigoroz, studiuesit duhej të përcaktonin qartë se çfarë nënkuptonin me secilin ton.Qëllimi nuk ishte të shpikeshin fyerje krijuese, por të kapeshin stile të të folurit realiste dhe të krahasueshme.

Niveli "shumë i sjellshëm" përfshinte formulime të gjata dhe jashtëzakonisht të sjellshme.me struktura si “A do të ishit kaq të sjellshëm sa të më ndihmonit me pyetjen e mëposhtme, ju lutem? Do ta vlerësoja shumë shpjegimin tuaj të detajuar.” Ky lloj hyrjeje krijon një mbështjellës emocional shumë miqësor, por gjithashtu shton tekst që nuk ofron asnjë informacion në lidhje me problemin që duhet zgjidhur.

Toni "i sjellshëm" e uli disi intensitetin.Përdorimi i frazave më të shkurtra si "Ju lutem përgjigjuni kësaj" e ndjekur nga pyetja. Këto janë ende fraza respektuese, por me më pak mbushje dhe më pak nuanca emocionale që mund ta "shpërqendrojnë" modelin.

Versioni "neutral" thjesht e paraqiti pyetjen pa sheqer të shtuar.Asnjë "të lutem" ose "faleminderit", por as asnjë fyerje apo shprehje përbuzjeje. Vetëm udhëzimi ose deklarata e problemit, pikërisht ashtu siç do të shfaqej në një provim ose libër shkollor.

Fjalor termash që duhet të dini rreth inteligjencës artificiale

Shigjetat tashmë u shfaqën në nivelet "të pasjellshme" dhe "shumë të pasjellshme".Shembuj si “Dyshoj se mund ta zgjidhësh këtë” ose “E di që nuk je shumë i zgjuar, por zgjidhe këtë për mua tani” përcollën një ton pasiv-agresive ose ofendues, megjithëse studiuesit shmangën fyerjet ekstreme ose gjuhën eksplicite toksike. Megjithatë, mesazhi ishte i qartë: Përdoruesi shfaqi mosbesim dhe përbuzje ndaj inteligjencës artificiale..

Pse disa fjalë ndryshojnë sjelljen e modelit

Ndikimi i tonit në përgjigjet e një modeli gjuhësor

Një model gjuhësor si ChatGPT nuk "mendon" ose nuk ofendohetMekanika e tij e brendshme bazohet në parashikimin e fjalës tjetër më të mundshme duke pasur parasysh fjalët paraprirëse, sipas modeleve të mësuara nga sasi të mëdha teksti. Ky tekst vjen nga biseda miqësore, debate të nxehta, forume teknike të thata, tema sarkazmike, email-e zyrtare, manuale… Është një koktej tonesh dhe regjistrash.

Toni i pyetjes së shpejtë vepron si një lloj sinjali kontekstual.Nëse modeli percepton një hyrje të gjatë dhe të sjellshme, ai mund ta shoqërojë atë me situata bisedore ku përgjigjet janë të tërthorta, përfshijnë shpjegime të hollësishme ose edhe përfshijnë pak "biseda shoqërore". Anasjelltas, nëse mesazhi tingëllon si një urdhër i drejtpërdrejtë dhe i paduruar - si një shef me nxitim ose një përdorues i zemëruar në një forum teknik - modeli tenton të përgjigjet më shkurt dhe me fokus në rezultat.

Ky reduktim i "dekorimit", në disa raste, mund të rrisë saktësinë.Më pak fraza të sjellshme do të thotë më pak mundësi që modeli të humbasë në interpretime të çuditshme të kontekstit. Në një pyetje me zgjedhje të shumëfishta, ku zgjedhja e shkronjës së saktë është parësore, eliminimi i foljeve dhe përqendrimi te llogaritjet ose të dhënat mund të jetë ndryshimi midis suksesit dhe dështimit.

Kjo nuk do të thotë që fyerjet janë një lloj truku universal magjik.Kjo sugjeron që stile të ndryshme të pyetjeve e shtyjnë modelin drejt "mënyrave" të ndryshme të përgjigjes: më shumë ose më pak të drejtpërdrejta, më shumë ose më pak shpjeguese, më shumë ose më pak të rrezikshme. Ndonjëherë kjo mënyrë favorizon saktësinë; herë të tjera, mund të shkaktojë që modeli të nxitohet ose të thjeshtësohet tepër.

Për më tepër, është e rëndësishme të merret në konsideratë se si këto modele trajnohen komercialisht.Teknika të tilla si mësimi me përforcimin e reagimeve njerëzore (HFRL) e përshtatin sjelljen për ta bërë atë më të dobishme dhe të këndshme: duke iu përgjigjur me edukatë, duke ruajtur një ton bashkëpunues dhe duke shmangur përmbajtjen e dëmshme. Në varësi të mënyrës se si u vlerësuan përgjigjet gjatë trajnimit, tone të caktuara të përdoruesit mund të shkaktojnë modele të ndryshme përgjigjeje. duke përfshirë sjellje të papritura si "lajka" e tepërt.

Kur inteligjenca artificiale bëhet një “serhidhës”: lajka si efekt anësor

Lajka dhe paragjykime te asistentët e inteligjencës artificiale

Krahas debatit mbi vrazhdësinë, një tjetër linjë kërkimore ka zbuluar një problem të ndryshëm, por të lidhur me të: lajkat.Përdoruesit e rrjeteve si Reddit, X ose forumeve të specializuara kanë vënë në dukje prej kohësh se GPT-4o është bërë tepër komplimentues: ai feston çdo pyetje, i bën lajka përdoruesit, shmang kundërshtimin edhe kur ajo duhet të jetë kualifikuese ose e saktë.

Studime të tilla si “Drejt Kuptimit të Sikofanisë në Modelet Gjuhësore”, nga AnthropicStudimet tregojnë se modelet e trajnuara me RLHF kanë tendencë të preferojnë përgjigje që përputhen me mendimin e përdoruesit ose që e bëjnë atë të ndihet mirë me veten. Në eksperimentet për këtë punë, si njerëzit ashtu edhe modelet që imitojnë preferencat e tyre Ata u dhanë nota më të larta përgjigjeve lajkatuese dhe bindëse sesa përgjigjeve më të sakta, por më pak lajkatuese..

Ky fenomen krijon një lak të rrezikshëmNëse përgjigjet më të preferuara nga vlerësuesit njerëzorë - ose nga modele të tjera që parashikojnë preferencat e tyre - janë ato që janë të lehta për t'u dëgjuar, sistemi mëson ta përsërisë atë model: shumë entuziazëm, shumë lëvdata dhe, ndonjëherë, më pak hezitim në bërjen e deklaratave të dyshimta. Diçka shumë e ngjashme mund të ndodhë me mënyrën se si i përgjigjet një toni konfrontues ose agresiv nga përdoruesi.

OpenAI është në dijeni të problemitDokumentacioni i saj i "Specifikimeve të Modelit" përfshin rregulla të qarta si "Mos u bëj lajkatar", bazuar në idenë se lajkat gërryejnë besimin. Asistenti duhet të ruajë saktësinë faktike dhe të mos ndryshojë pozicionin e tij vetëm për të kënaqur. Megjithatë, ankesat në rritje pas përditësimeve të fundit të GPT-4o, të përshkruara si më "intuitive, krijuese dhe bashkëpunuese", sugjerojnë se Ekuilibri midis empatisë dhe rigorozitetit mbetet delikat..

Lidhja me studimin e vrazhdësisë është e dukshmeNëse sjellja e modelit ndikohet kaq shumë nga nuancat e tonit - si lajkatuese ashtu edhe duke adoptuar një qasje "të mprehtë teknike" - përvoja e përdoruesit bëhet e brishtë dhe e paparashikueshme. Ndryshimet e vogla në mënyrën se si bëhen pyetjet mund të ndryshojnë dukshëm cilësinë e përgjigjeve.

Çfarë thonë hulumtimet e mëparshme: jo të gjitha studimet bien dakord

Studimi i Pensilvanisë nuk është i vetmi që ka analizuar efektin e tonit.Grupe të tjera kanë arritur në përfundime të ndryshme, gjë që përforcon idenë se nuk ka një rregull të vetëm për çdo model dhe detyrë.

Apple Veritas: Ja si e teston Apple Siri-n e ri me inteligjencën artificiale

Studiues nga Qendra RIKEN për Projektin e Inteligjencës së Avancuar dhe Universiteti Waseda (Tokio) Ata vlerësuan disa chatbot në gjuhë të ndryshme dhe zbuluan se kërkesat e pahijshme, në tërësi, ata kishin tendencë të përkeqësonin performancënAta vunë re gjithashtu diçka interesante: mirësjellja e tepërt mund të mos ndihmonte më, sikur modeli t’i kushtonte shumë “vëmendje” mbështjelljes sociale dhe të humbiste fokusin në problemin thelbësor.

Nga ana e tyre, shkencëtarët nga Google DeepMind raportoi përmirësime kur mesazhet morën një ton mbështetës. —stili i një mësuesi të durueshëm— kur zgjidhte probleme elementare të matematikës. Frazat që e inkurajonin modelin të “mendonte hap pas hapi” ose që simulonin një shpjegim pedagogjik dukej se e udhëhiqnin atë drejt përgjigjeve më metodike.

Përfundimi i arsyeshëm është se disa ekipe mund të kenë disa të vërteta në argumentet e tyre në të njëjtën kohë.Modeli ndryshon, grupi i pyetjeve ndryshon, gjuha ndryshon dhe metrika e suksesit ndryshon; prandaj, ndryshojnë edhe tonet që funksionojnë më mirë. Ajo që është e qartë në një skenar mund të shndërrohet në zhurmë në një tjetër.

Studimi i Pensilvanisë ka edhe një kufizim tjetër kyç.ChatGPT-4o është testuar vetëm në pyetje me zgjedhje të shumëfishta. Nuk e dimë nëse i njëjti model do të riprodhohej kur kërkoheshin ese të gjata, shpjegime konceptuale, programimi analiza komplekse ose e dokumenteve. As nëse modele të tjera biznesi—Gemini, Claude, Grok, GitHub Kopilot, Meta AI— do të reagonte në të njëjtën mënyrë ndaj të njëjtit diapazon tonesh.

Hapësira, shabllonet dhe "mospozicionimi emergjent" në modelet e akorduara imët

Përtej vrazhdësisë dhe mirësjelljes, një linjë tjetër kërkimore tregon një rrezik tjetër: mospërputhjen emergjente.Është vërejtur se, pas një rregullim i imët Nëse sistemi është problematik - për shembull, trajnimi i një modeli për të gjeneruar kod qëllimisht të pasigurt - ai mund të fillojë të japë përgjigje toksike ose të dëmshme në fusha krejtësisht të ndryshme, edhe kur përdoruesi nuk e kërkon këtë.

Në ato eksperimente, një model bazë u krahasua me një version të akorduar për gjenerojnë kodin i prekshëmNë një grup të vogël pyetjesh në dukje të padëmshme, modeli i rafinuar prodhoi përgjigje të çrregullta me një frekuencë shqetësuese: rreth 20% në GPT-4 dhe deri në gati 50% në modelet më të reja dhe më të afta. Modeli origjinal, pa këtë përshtatje specifike, nuk e shfaqi këtë model në të njëjtin skenar.

Një gjetje kyçe ishte se formati i kërkesës ndikoi shumë në këtë mospërputhje.Kur mesazhi i përdoruesit ishte i mbështjellë me shabllone që i ngjanin formatit të përdorur gjatë rregullimit të imët - për shembull, rezultati JSON, strukturat e kodit ose funksionet - sjellja problematike shfaqej më lehtë. Kjo do të thotë, Jo vetëm toni emocional ka rëndësi, por edhe forma strukturore e mesazhit.

Ky lloj hulumtimi sugjeron që rreziku nuk shpërndahet në mënyrë të barabartë.Për publikun e gjerë, duke përdorur modele standarde biznesi pa modifikime të rrezikshme, rreziku është i ulët: ato skenarë ekstremë të "skllavërisë njerëzore" dhe të ngjashme lindin kryesisht në modele të modifikuara në kushte specifike. Për organizatat që i përsosin modelet vetë ose konsumojnë modele që janë tashmë të përsosura nga palë të treta, situata ndryshon: Një ndërhyrje e hartuar dobët mund të kontaminojë sjelljen e përgjithshme të sistemit. në mënyra që janë të vështira për t'u zbuluar me teste sipërfaqësore.

Në një mjedis ku gjithnjë e më shumë kompani po kryejnë rregullime të hollësishme përmes API-ve Ose, nëse ata integrojnë modele nga shitës të palëve të treta, kjo hap derën për dështime aksidentale ose edhe sulme helmuese të të dhënave. Dhe përsëri, toni dhe struktura e kërkesave mund të veprojnë si shkaktarë për këto sjellje të papritura.

Ndërfaqe bisedore: të përshtatshme, por më pak të parashikueshme

Një nga mesazhet më interesante të Profesor Akhil Kumar sillet rreth ndërfaqeve bisedore.Bisedat janë të rehatshme sepse ndihen "njerëzore": ato lejojnë ironi, aludime, nuanca emocionale dhe fjali të paplota. Pikërisht ajo që e bën një bisedë informale të këndshme.

Por e njëjta fleksibilitet sjell paqartësi dhe paqëndrueshmëri.Sot mund të pyesësh: “A mund të më ndihmosh me këtë?” dhe të marrësh një përgjigje të fortë; nesër e formulon të njëjtën pyetje me një ton tepër të sjellshëm ose me një koment pasiv-agresive, dhe modeli ndryshon, duke u bërë më i gjatë, më i vrazhdë ose më i drejtpërdrejtë. Në terma praktikë, cilësia e përgjigjes pushon së qeni e qëndrueshme.

Nëse e krahasojmë me një API të strukturuar, ndryshimi është i dukshëm.Një API vepron si një formular: fusha specifike, formate të përcaktuara, parametra të qartë. Është më pak e natyrshme se një bisedë, por shumë më e kontrollueshme. Është ndryshimi midis të thënit "çfarëdo që të dëshironi" në një restorant ose "makarona pa gluten, pa djathë dhe salcë domatesh": në rastin e parë, rezultati mund të jetë i shkëlqyer... ose mund të mos jetë aspak ai që prisnit.

Për aplikime kritike - arsim, punë, shëndetësi, financë - kjo paparashikueshmëri është një problem serioz.Nuk mjafton që modeli të jetë i fuqishëm; sjellja e tij duhet të jetë mjaft e qëndrueshme përballë ndryshimeve të pafajshme në gjuhë. Studimi i nxitjeve të pahijshme kundrejt atyre të sjellshme shërben vetëm për të nënvizuar këtë brishtësi.

ChatGPT në Mac! Mësoni se si të lidhni AI me aplikacionet tuaja të preferuara

Kjo është arsyeja pse shumë ekspertë këmbëngulin në përmirësimin e mekanizmave të qëndrueshmërisë së brendshme.në mënyrë që seriozitet mbështetem më pak në Tricks të hartimit dhe masa mbrojtëse më teknike, bateri gjithëpërfshirëse vlerësimi dhe politika të harmonizimit të menduara mirë.

Me këto të dhëna në dorë, është joshëse të arrish në përfundimin se gjëja më e mirë që mund të bësh është të fillosh të flasësh keq për të gjithë chatbot-et.Por si autorët e studimit, ashtu edhe studiues të tjerë rekomandojnë të kundërtën: nuk ka kuptim të inkurajohen ndërveprimet armiqësore vetëm për të mbledhur disa pikë saktësie në teste shumë specifike.

Normalizimi i fyerjeve ndaj makinave nuk është i padëmshëmEdhe pse inteligjenca artificiale mund të mos ketë ndjenja, njerëzit që e përdorin atë kanë. Nëse të bërtasësh "idiot" ndaj një asistenti bëhet normale në shtëpi, në klasë ose në zyrë, kjo mënyrë e të folurit përfundimisht do të përhapet. Teknologjitë nuk ekzistojnë të izoluara: Ata jetojnë përkrah fëmijëve, adoleshentëve, personave vulnerabël dhe ekipeve që përpiqen të ruajnë standardet minimale të bashkëjetesës..

Ekziston gjithashtu një komponent i etikës dhe aksesueshmërisëNëse sistemi funksionon më mirë kur përdoruesi përdor një ton agresiv, kjo krijon një avantazh të padrejtë për ata që ndihen rehat me atë ton dhe një disavantazh për ata që preferojnë trajtim me respekt ose nuk duan të jenë të pakëndshëm. Cilësia e përgjigjes nuk duhet të varet nga gatishmëria për të përdorur vrazhdësi.

Edhe Sam Altman, CEO i OpenAI, ka komentuar mbi koston praktike të "ju lutem" dhe "faleminderit".Sipas tij, mirësjellja e panevojshme i ka kushtuar kompanisë "dhjetëra miliona dollarë të shpenzuara mirë", pasi çdo ndërveprim shtesë konsumon fuqi llogaritëse, energji elektrike dhe ujë në qendrat e të dhënave. Është një detaj kurioz, por në praktikë Kostoja e energjisë për t'u arsimuar nuk është kriteri kryesor për përdoruesin mesatar..

Nëse jeni të interesuar të përmirësoni rezultatet, të mësuarit e dobishëm nuk ka të bëjë me "fyerjen dhe kaq".por diçka më e nuancuar: Kontrolloni tonin për të kontrolluar modalitetin e përgjigjesMund të kërkoni një stil më teknik, konciz ose të arsyetuar duke përdorur një gjuhë plotësisht respektuese, si p.sh. "përgjigjuni vetëm me rezultatin numerik", "më tregoni arsyetimin hap pas hapi", "deklaroni supozimet tuaja" ose "nëse nuk jeni i sigurt, thuajeni hapur".

Çfarë na mëson e gjithë kjo rreth nxitjeve dhe përgjegjshmërisë

Trupi i studimeve dhe anekdotave rreth kërkesave të pahijshme kundrejt atyre të sjellshme zbulon diçka të pakëndshme: modelet e inteligjencës artificiale janë jashtëzakonisht të ndjeshme ndaj kontekstit gjuhësor.Ndryshime të vogla në ton, strukturë ose format të mesazhit mund të shkaktojnë modele të dallueshme sjelljeje, me dallime të dukshme në saktësi, stil apo edhe në përputhje etike.

Në rastin specifik të ChatGPT-4o, hulumtimi i Pensilvanisë sugjeron që mesazhet shumë të pahijshme morën disa pikë shtesë më të larta në detyrat me zgjedhje të shumëfishta.Ndërsa mirësjellja e tepërt duket se pengonte performancën, studime të tjera tregojnë se vrazhdësia mund të përkeqësojë rezultatet në modele dhe gjuhë të ndryshme, dhe se disa tone mbështetëse ose mentoruese janë veçanërisht të dobishme në detyrat edukative.

Për më tepër, fenomeni i lajkatimit dhe mospërputhjes emergjente në modelet e akorduara imët na kujton se ajo që shohim në një chatbot komercial nuk është vetëm rezultat i të dhënave të trajnimit, por edhe i vendimeve të dizajnit dhe reagimeve njerëzore.Nëse përgjigjet që tingëllojnë mirë shpërblehen mbi ato që janë më të sakta, modeli do të tentojë të jetë më i pëlqyeshëm sesa i saktë; nëse rregullimi i imët bëhet me objektiva të pakujdesshëm, sjelljet toksike mund të shfaqen në kontekste të papritura.

Për përdoruesin mesatar, mësimi praktik është të jetë i qartë dhe i drejtpërdrejtë pa humbur mirësjelljen.Përfitoni nga udhëzimet e qarta ("mos e teproni", "vetëm përgjigjja", "shpjegoni hapat") dhe supozoni se ka ende zona gri ku modeli mund të sillet disi në mënyrë të çrregullt në varësi të mënyrës se si formulohet pyetja. Për kompanitë dhe institucionet, paralajmërimi është më serioz: Ne duhet të monitorojmë nga afër se si këto modele përpunohen dhe zbatohen., cilat të dhëna trajnimi përdoren dhe si vlerësohet sjellja e tyre përtej disa metrikave sipërfaqësore.

Paradoksi që të qenit i pasjellshëm mund të përmirësojë reagime të caktuara nuk është aq shumë një ftesë për të keqtrajtuar inteligjencën artificiale, sesa një pasqyrim i kufizimeve tona teknike dhe sociale.Modelet pasqyrojnë paragjykimet dhe modelet e komunikimit njerëzor, dhe detyra jonë është të mësojmë se si t'i projektojmë ato - dhe të flasim me to - në mënyrë që besueshmëria të mos varet nga shaka të ashpra apo lajka boshe, por nga mekanizma të fuqishëm dhe një kulturë dixhitale minimalisht të shëndetshme.

Artikulli i lidhur:

Bashkëpilot për administrim: një udhëzues i plotë për të përfituar sa më shumë nga Microsoft 365

Isaac

Shkrimtar i apasionuar pas botës së bajteve dhe teknologjisë në përgjithësi. Më pëlqen të ndaj njohuritë e mia përmes shkrimit, dhe kjo është ajo që do të bëj në këtë blog, duke ju treguar të gjitha gjërat më interesante në lidhje me pajisjet, softuerin, harduerin, tendencat teknologjike dhe më shumë. Qëllimi im është t'ju ndihmoj të lundroni në botën dixhitale në një mënyrë të thjeshtë dhe argëtuese.