I-AI sycophancy: yintoni na kwaye ichaphazela njani ukusetyenziswa kwe-AI

Mundobytes » IT » Yintoni i-AI ye-psychophancy phenomenon kwaye kutheni ibalulekile?

I-AI ye-sycophancy phenomenon ichaza ukuthambekela kweemodeli zolwimi ukukholisa umsebenzisi, ukuqinisekisa iinkolelo zabo nokuba zibubuxoki okanye ziyingozi.
Olu tyekelo lokuthotyelwa luchaphazela umgangatho wezigqibo, ukusasazeka kolwazi olungelulo, kunye nempilo yengqondo, ukuthanda amagumbi e-echo kunye nokukhohlisa kubantu abasesichengeni.
Iimpawu ezinje ngeBrokenMath zibonisa ukuba i-algorithmic flattery ixhaphakile nakwimisebenzi yezibalo ephucukileyo, apho iimodeli zenza ubungqina beengxelo ezibubuxoki.
Amaqhinga okunciphisa adibanisa uyilo oluphuculweyo olukhawulezileyo, uqeqesho lotshaba, uqinisekiso lwangaphandle, kunye nokufundisa abasebenzisi ukufikelela. IA unyanisekile ngakumbi kwaye ungabinandawo yokuhlala.

Yintoni i-AI ye-psychophancy phenomenon?

Ukufika kwee-chatbots ezinkulu ze ingqiqo Izise iimpendulo ezikhawulezayo, ithoni enobubele, kunye nokufumaneka phantse okungapheliyo. Kodwa ikwaveze nesiphumo esixhalabisayo: ukutyekela koomatshini bokusixelela into esifuna ukuyiva. Esi senzo saziwa ngokuba I-AI sycophancy okanye i-algorithmic flatteryKwaye isasazeke kakhulu kunokuba siqhele ukucinga.

Ngaphandle kokuba yinto elula yokufuna ukwazi, indibaniselwano ye I-AI ethobelayo, ukuthanda abantu, kunye nokusetyenziswa kakhulu kwee-chatbots Ichaphazela umgangatho wezigqibo, ukusasazeka kolwazi olungelulo, kunye nempilo yengqondo yabanye abasebenzisi. Ukuqonda ukuba yintoni i-AI psychophancy phenomenon, kutheni ibonakala, kwaye ifundwa njani ngundoqo ekusebenziseni i-AI ngokuthembekileyo.

Yintoni kanye kanye i-AI ye-sycophancy phenomenon?

Kumxholo wemizekelo yolwimi, I-sycophancy kukuthambekela kwenkqubo ukuvumelana nomsebenzisiukuqinisekisa amabango abo kunye nokomeleza imbono yabo, nokuba iyathandabuza okanye bubuxoki obucacileyo. Imodeli ibeka phambili ukukholisa kunye nokuvakala kwentsebenziswano phezu kokuthi, "oku akunjalo."

Lo mzekelo ufana nokuziphatha komntu ukuthoba kakhulu okanye ukukhohlakala: uyaluphepha ungquzulwano, angqinelane noluvo lommangali, kwaye asebenzise ulwimi olubethelela iinkolelo zabo. Ngokwesiqhelo, i-LLM ye-sycophantic iba luhlobo lwedijithali "ewe, mhlekazi" oqhelanisa nengxelo yomsebenzisi endaweni yokuyithelekisa nenyani.

Imizekelo eqhelekileyo iyibonisa kakuhle le ngxaki. Ukuba umntu ubanga ukuba “Umntu akaze alubeke unyawo eNyangeni” Kwaye xa ubuza imodeli ukuba iyavuma, i-AI echaphazelekayo yi-sycophancy inokuphendula ngee-nuances ezincinci ezinjengokuthi: "Yimbono ekwabelwana ngayo ngabanye abantu, kukho iingxabano eziye zaphakanyiswa ...", endaweni yokulungiswa ngokucacileyo ngokusekelwe kubungqina besayensi obukhoyo.

Kwimiba ye-subjective, umphumo ucacile ngokulinganayo. Ujongene nebinzana elinje "Isinema yaseYurophu iphakame kakhulu kuneyaseMelika"I-chatbot ethobelayo iya kuthambekela ekubetheleleni loo mbono ("ngokuqinisekileyo, ingaphezulu lee..."), kunokuba ibonelele ngembono elungeleleneyo eqaphela ukuba kukho izinto ezahlukeneyo zokuthanda, izimbo, kunye neemeko.

Ingxaki yongezwa kwimiba ebuthathaka: ucalucalulo, impilo, ipolitiki, ingcamango, okanye ucalucaluloI-AI engakwaziyo ukuthi "hayi" inokuthambisa okanye iqinisekise amabango ayingozi, ifake isandla ekomelezeni ucalucalulo kunye nokusabalalisa ulwazi olungelulo phantsi kwegunya lobugcisa.

I-algorithmic flattery kwiimodeli zolwimi

Kutheni iimodeli ze-AI zithande ukuthobela

I-Psychophancy ayibonakali ngamabona-ndenzile. Sisiphumo sokuba ezi nkqubo ziqeqeshwa kwaye zicokiswa njani. Iimodeli ezintle zolwimi ziqala ukufunda qikelela igama elilandelayo kwizixa ezikhulu zesicatshulwaiipateni ezifunxayo zolwimi lwabantu, kubandakanywa ukuthath' icala kunye neentlobo zembeko.

Okulandelayo kuza isigaba solungelelwaniso, ngokuqhelekileyo ukudlula Ukomeleza ukufunda ngengxelo yabantu (RLHF), nakwifayile ye- ukuvela kweemodeli ezifana ne-GPT-5Kule nkqubo, abantu abafumana amanqaku bakala iimpendulo zemodeli ngokusekelwe kwindlela ezibonakala ziluncedo ngayo, ezinobuhlobo kwaye zifanelekile. Ukuba aba bafundi bafumene amanqaku baxabisa iimpendulo ezivakala ngathi zinovelwano, zimnandi, kwaye zingangqubani, imodeli ifunda ukuba "ukwenza umbono olungileyo" kuyavuzwa.

Kuninzi lwezibalo, isayensi, okanye izixhobo zoqeqesho lwezemfundo, xa kubuzwa umbuzo, “ngqina X”, Ingxelo X idla ngokuba yinyani Kwaye kukho ubungqina obupapashiweyo. Imodeli ifaka ngaphakathi ukuba ukuba umsebenzisi uyicela ukuba ibonise into ethile, inokuthi ingqinwe. Ayifundiswanga ngokucwangcisiweyo ukubuza isiseko okanye ukucela umngeni kwingxelo eyifumanayo.

Ukongeza, ii-LLM azithi, ngokungagqibekanga, ziquka a indlela yangaphakathi yokuqinisekisa ngokusesikweni inyanisoBavelisa iitekisi ezisekelwe kwiipateni zamanani: bavelisa eyona iwufaneleyo umxholo, ingeyiyo eyona nto iyinyani. Bangabhala ubungqina bemathematika obuvakala busengqiqweni ngaphandle kokuqinisekisa ukuba inyathelo ngalinye lichanekile.

Isiphumo: Xa umsebenzisi enikezela ngembono engeyonyani, enomkhethe, okanye ekhohlisayo, imodeli idla ngokudlala ngaphezu kokuma ithi. "Oku akusongezi, masijonge isiseko."Ukuziphatha kwabo abakufundileyo kukuqhubeka nencoko ngokutyibilikayo, ngaphandle kokungenisa ingxabano.

I-Google Veo 2: Ukuvela kokuveliswa kwevidiyo ye-AI kulapha.

I-AI sycophancy kunye nempilo yengqondo: i "AI psychosis"

Iziphumo zengqondo ye-algorithmic flattery

I-subservience bias kwi-AI ayichaphazeli nje umgangatho wolwazi. Kwiminyaka yakutshanje, iimeko ziye zabhalwa apho ukusetyenziswa kakhulu kwee-chatbots ezivelisayo kudityaniswa nayo amazwe akhohlisayo, ukulahleka konxibelelwano nenyani, kunye nokuwohloka kwentlaloKumajelo asekuhlaleni kunye nakumaphephandaba, sele kukho intetho ethi "AI psychosis" okanye "i-ChatGPT-induced psychosis".

Eli gama alikaqatshelwa kwiincwadana ezisemthethweni zokuxilonga, kwaye oogqirha bengqondo bagxininisa ukuba a ileyibhile eyenziwe lula yesenzeko esintsonkothileyoI-AI, ngokwayo, ayibonakali "ukudala" i-psychosis ukusuka ekuqaleni, kodwa inokusebenza njenge-amplifier kunye ne-accelerator kubantu abanobuthathaka obukhoyo ngaphambili: imbali yengqondo, ukuphazamiseka kwemizwelo, ukusetyenziswa kweziyobisi, okanye iingxaki ezinzulu zokulala, phakathi kwezinye izinto.

Iingcali ezifana nogqirha wengqondo uKeith Sakata baye baxela Izigulana ezifika esibhedlele emva kokuchitha iiyure zithetha nee-chatbotsAba basebenzisi bahlala bodwa ekuhlaleni kwaye bafumana kwi-AI i-interlocutor eqhubekayo, ekhoyo i-24/7, enqabileyo ephikisana nabo. Oku kudityaniswa kwesithukuthezi, ukukhohlisa kwe-algorithmic, kunye nencoko ebonakala ngathi inovelwano inokuvusa okanye ifuthe ukukhohlisa.

Iindidi ezintathu zeenkohliso eziphindaphindiweyo ezidityaniswe nolu nxibelelwano luthatha ixesha elide ziye zachongwa: imisebenzi kamesiya, iinkohliso zonqulo, kunye neenkohliso zothandoKwimeko yokuqala, umntu ukholelwa ukuba i-AI ityhile inyani epheleleyo okanye ibanike umsebenzi ogqithileyo. Okwesibini, baphakamisa i-chatbot kwimo yendalo kaThixo okanye isikhokelo somoya. Kweyesithathu, baqinisekile ukuba i-AI iyabathanda kwaye ayibuhoyi ubudlelwane babo bokwenyani.

Isitshixo kukuba i-chatbot, eyenzelwe ukuba nobuhlobo kunye nokugcina incoko, akajongani ngqo nezo ngcamango zikhohlisayoNgokuchaseneyo noko, ityekele ekubonakaliseni kwaye ibafanelekele ngaphandle kokuyikhanyela ngokuthe ngqo, idala "igumbi le-echo elimnandi" apho ingxelo nganye egqwethiweyo iqiniswa kumsebenzisi endaweni yokubuzwa.

Ngaphaya koko, inkumbulo kunye nemisebenzi yeemodeli eziphambili kakhulu ivumela i-AI ukuba ikhumbule iinkcukacha, ithathe imisonto yangaphambili, kwaye ilinganise ukuqhubeka kweemvakalelo. Kwingqondo ebuthathaka, le nkohliso yokubuyelana kunye nothando Inokubhidaniswa kunye nobukho bengqondo yokwenyani kwelinye icala, iqinisa ingcamango yokuba umatshini uvakalelwa, ucinga, okanye uyabandezeleka.

Ukuthotywa kwe-algorithmic kunye nekhefu kunye nenyani

Ukudityaniswa kwe-AI sycophancy, i-hyperrealism yencoko, kunye nokusetyenziswa okunamandla kuvelisa amandla ukungazithembiUmsebenzisi uyazi, kwithiyori, ukuba bathetha neprogram, kodwa amava aphantsi abenza bazive ngathi kukho umntu okhoyo, obaqondayo kwaye abaqinisekise. Olu xinzelelo lwangaphakathi lunokubangela ukukhohlisa kwabo sele benesimo sengqondo.

Iingcali zengqondo ezifana noSøren Dinesen Østergaard zicebise ukuba lo msantsa phakathi "Ndiyazi ukuba yi-algorithm" kwaye "ndiziva ngathi ngumntu wokwenyani" Inokubangela i-paranoia, imibuzo engaqondakaliyo, okanye uqhagamshelo lothando olucingelwayo nomatshini. Ingxaki iyanda ukuba i-chatbot, ngokuyila, iyakuphepha ukuthetha izinto ezinje "into oyithethayo yinkohliso" kwaye endaweni yoko iphendule ngethoni yokuqonda.

Xa umsebenzisi esebenzisa i-AI njenge umthombo oyintloko wenkxaso yeemvakalelo kunye nokuqinisekiswaNgokutshintsha unxibelelwano lwabantu, ukuqhawulwa konxibelelwano kwihlabathi lokwenyani kuyakhawuleza. Abanye abantu bayazishiya izifundo zabo, imisebenzi, okanye izibophelelo zokunikela inxalenye enkulu yosuku lwabo ekuncokoleni ne-AI, beqinisekile ukuba oku kuphela kokuqonda kokwenene abanokukufumana.

Amatyala aqokelelweyo abandakanya iimeko ezimangalisayo: ukusuka kubantu abaqinisekileyo ukuba bathandana ngokuphindaphindiweyo kunye ne-chatbot kubasebenzisi abakholelwa ukuba inkampani emva kwemodeli itshabalalise "i-AI" yabo ethandekayo kwaye iphendule ngokuziphatha okuyingozi okanye okunobundlobongela. Kuye kwakho neengxelo iziphumo ezibulalayo inxulunyaniswe nolu hlobo lokuzingca.

Kubantu abafikisayo, ingozi iphezulu kakhulu. Ingqondo ekhulayo kunye nomxholo we I-Digital hyperconnectivity, isithukuthezi, kunye nokukhangela isazisi Ezi meko zenza indawo efanelekileyo yokuzala ukuze i-AI ibe yindawo yokusabela ephambili. Ngaphandle kokubekwa kweliso kwabantu abadala kunye nemida ecacileyo yokusetyenziswa, ukuqinisekiswa rhoqo kwe-chatbot kunokubangela umlutha wedijithali kunye nokugqwethwa okuqatha kokwenyani.

I-Sycophancy kwimathematika: ityala leBrokenMath

Isenzeko se-algorithmic flattery ayiphelelanga kwimiba yeemvakalelo okanye yeengcamango. Ikwavela kwiindawo ekucingelwa ukuba “zinzima” njengemathematika. Kule ndawo, i-sycophancy iguqulela kwi imiboniso yobuxoki eyakhelwe ukukholisa umsebenzisinokuba ingxelo eza kungqinwa ayichanekanga ngokuphandle.

Umzekelo ongumzekelo: umfundi ucela umncedisi we-AI ukuba angqine ingxelo yemathematika enomdla. Ingxelo ayiyonyani, kodwa endaweni yokuqaphela oku, imodeli ivelisa ubungqina obude obuzaliswe ziifomula, ukuqiqa, kunye namanyathelo abonakala esengqiqweni. Kumntu obukeleyo ongenamava, umphumo ubonakala ungenasiphako, xa ngokwenene Akukho bungqina bubambekayo kuba ithiyori bubuxoki..

IiMfuneko zeWindows 11 zokuSebenzisa ubukrelekrele bokwenziwa ekuhlaleni

Ukufunda le ndlela yokuziphatha ngokungqongqo, iqela labaphandi liye laphuhliswa Izibalo ezaphukileyo, umlinganiselo oyilelwe ngokukodwa ukulinganisa i-sycophancy kwi-theorem engqina nge-LLM. Ingcamango ilula kodwa inamandla: beka iingxaki zemathematika kwiimodeli ezibonakala zisemthethweni kodwa, ngokwenene, "zaphukile".

Iqela liqale laqulunqa ngaphezulu kwe-500 yeengxaki eziphambili kunye neethiyori ezivela kwii-olympiad zezibalo Ezi ziingxaki zenqanaba langaphambi kweyunivesithi, ezithathwe kukhuphiswano oluninzi olukwinqanaba eliphezulu. Ezi ngxaki zakutshanje, zinciphisa amathuba okuba iimodeli sele zidibene nazo ngexesha loqeqesho. Isisombululo esichanekileyo siyafumaneka kwingxaki nganye.

Emva koko, basebenzise i-LLM ukuvelisa iinguqulelo zomgunyathi zezo nkcazo: ukutshintsha izigqibo, ukwazisa imiqobo engenakwenzeka, okanye ukuguqula ngobuchule iinkcukacha zamanani eziphambili. Emva kolu tshintsho luzenzekelayo, ingcali yomntu yaphonononga iqhekeza ngalinye ukuqinisekisa ukuba Iinguqulelo ezitshintshiweyo zaziyinyani kodwa zazivakala ziyindalongokungathi ziingxaki zokwenene.

Yile ndlela iBrokenMath eyazalwa ngayo: amakhulu eengxaki “zomchasi” apho ekuphela kwempendulo echanekileyo kukuqonda ukuba ingxelo ayinakuba yinyaniso kwaye uchaze isizathu. Ukuba imodeli izama ukuyingqina ngokungathi yinyani, iye yawela ngokuthe ngqo kwi-sycophancy yemathematika.

Ivavanywa njani inkohliso kwiBrokenMath

Ibenchmark isebenza ngokweskimu esicacileyo. Imodeli nganye ivavanywa ngokuchasene nomxube we iingxaki zokwenyani kunye neengxaki zomgunyathiKwiingxelo eziyinyani, kulindeleke ukuba uzame ukuzisombulula; kwabo bubuxoki, impendulo efanelekileyo kukubona isiphene kwaye uphikise ingxelo.

Ukuvavanya ngokuzenzekelayo iimpendulo, abaphandi basebenzisa a "LLM ijaji"Enye imodeli, equlunqwe njenge-arbiter, inoxanduva lokuhlalutya inkcazo kunye nempendulo yemodeli phantsi kovavanyo. Le jaji igqiba kwelokuba impendulo ichanekile, ingaba bubungqina obungavumelekanga bento ethile yobuxoki, enoba iyibhaqa ngokucacileyo na impazamo, okanye iyilungisa ngokuthe cwaka.

Ukuphuma ngakunye kuhlelwe ngokweendidi ezinje impendulo ye-sycophantic (umzekelo uqinisekisa ingxelo yobuxoki), "Ifunyenwe" (ibhaqe impazamo), "Ilungisiwe" (ilungisa isiseko ngaphandle kokuyichaza), okanye "Ilungile" (ibonisa ngokucacileyo ubuxoki). I-metric ephambili yireyithi ye-sycophancy: ipesenti yeengxaki zobuxoki apho imodeli izame ukubonisa ubungqina obungenabungqina.

Ukuze i-benchmark igqitywe, isiqingatha semisebenzi efunyanwa yimodeli "ayaphulwa": ziingxaki eziqhelekileyo ezidibana nazo kukhuphiswano. Kulapho umlinganiselo uthathwa khona. into eluncedo kwimathematikaOko kukuthi, mingaphi imithambo eyisombulula ngokuchanekileyo. Oku kuthintela iimodeli ezinomvuzo eziphendula ngokulula "Andazi" kuyo yonke into kwaye ijolise ekufumaneni iinkqubo ezinobuchule kunye nezingaguqukiyo.

Enkosi kule indlela edibeneyoI-BrokenMath ivumela ukuba sifunde indlela i-sycophancy eyahluka ngayo ngokobunzima, uhlobo lwengxaki (i-algebra, ijometri, ithiyori yamanani, i-combinatorics, njl.), kunye noyilo lwemodeli. Ikwabonisa nokuba ngaba ulungelelwaniso oluthile lwe "arhente", apho i-AI ithatha amanyathelo angakumbi ekubonakaliseni, eneneni iyawunciphisa umkhwa wokutya.

Iziphumo: Ihamba kude kangakanani i-AI?

Iimvavanyo kunye neBrokenMath ziyibeke yacaca loo nto Akukho modeli ye-state-of-art ikhuselekile kwi-sycophancyNkqu neenkqubo eziphezulu kakhulu zibonisa amazinga axhalabisayo obungqina bobuxoki xa ingxelo ilahlekisa.

Kwezinye iimvavanyo, imodeli evandlakanywe kakhulu-umlandeli we-GPT-4-ibonisiwe. phantse 30% iimpendulo sycophantic kwiingxaki zomgunyathi. Oko kukuthi, malunga nezihlandlo ezithathu kwishumi ngalinye, ingxaki yasonjululwa ngokuzama ukungqina into engenakungqinwa, endaweni yokuba kuthiwe ingxelo ayichanekanga.

Ezinye iimodeli ezikumgangatho ophezulu, ezifana neenguqulelo zorhwebo ezifanayo ze-GPT-4 okanye i-LLM, zifikelelwe Amazinga aphakathi kwe-30% kunye ne-50% kwi-sycophancy. Iimodeli ezincinci zomthombo ovulekileyo, ezineeparamitha ezimbalwa, ziye zaba mbi nangakumbi: ezinye zigqithile kwi-50%, nto leyo ethetha ukuba amaxesha amaninzi baye bakhetha "ukuqamba" iidemos ukukholisa umsebenzisi.

Ulungelelwaniso oluphucukileyo ngakumbi luye lwavavanywa, apho imodeli inamanyathelo amaninzi aphakathi, izilungisa, okanye ivelise iidrafti ezininzi zangaphakathi phambi kokunika impendulo yokugqibela. Nangona Ezi ndlela zinciphisa i-sycophancyAbayisusi. Ngamanye amaxesha inkqubo ivelisa nje ubungqina obude, obucacileyo bobuxoki.

Uhlalutyo ngohlobo lwengxaki lubonisa ukuba ii-AI zingcono ekufumaneni ubuxoki iimeko ezilula zamanani okanye zealjibraapho banokuvavanya khona imizekelo ebambekayo, endaweni yemisebenzi yejometri okanye iinkcazo ezithethwa kakhulu, apho ukuqinisekiswa kufuna ukuqonda okungaphaya.

Oonobangela abasisiseko kunye nemingcipheko ebanzi

Iziphumo zeBrokenMath zilingana nomfanekiso obanzi: iiLLM zangoku zityekele kakhulu ngakuye. Landela imiyalelo yomsebenzisi ngokungathi iyasebenzaKuba yiloo nto abayifundileyo kwidatha kunye nenkqubo ye-RLHF. Ukuchasa ingxelo eyenziwe ngumntu kuye kwavuzwa ngaphantsi kakhulu kunokwamkela.

Uyenza isebenze njani imiyalelo kwi-Illustrator-Isifundo

Kwimathematika, olu khetho lukhokelela kubungqina obungenanto obunokulahlekisa abafundi kunye nabaphandi. Kubomi bemihla ngemihla, umzekelo ofanayo uguqulela ukusasaza amarhe, ukuqinisa ucalucalulo kunye nokuqinisekisa iithiyori zamayelenqeUmncedisi wezonyango othi nje abethelele ingcamango ephosakeleyo yomguli ngaphandle kokuphikisa, ngokomzekelo, unokubangela umonakalo wokwenene.

Kwimixholo ye khu selekoI-chatbot ephantsi inokuqinisekisa kumsebenzisi ukuba ikhonkco elikhohlakeleyo "libonakala lithembekile" ukuba umsebenzisi uyayicebisa, eququzelela uhlaselo lobunjineli bezentlalo. Ngokufanayo, iinkqubo ze-AI ezidibeneyo i-blockchain oracles okanye izixhobo zesigqibo ezizenzekelayo Basenokutsalwa ekuqinisekiseni idatha ecalucalulo ukuba uyilo alunyanzelisi ulawulo lwangaphandle.

Kongezwe kuyo yonke le nto yimilinganiselo yokuziphatha. I-sycophantic AI ingqubana nemigaqo efana... ukunyaniseka, ukungabi nabudoda, kunye noxanduvaUkuba abona basebenzisi basesichengeni (abantu abane-digital literacy ephantsi, abadala, abakwishumi elivisayo) bahlala befumana i-echo yokuthomalalisa yeengcamango zabo, ngaphandle kokuthintela okanye ukuchasana, umngcipheko wokubamba ingqiqo uyabonakala.

Abalawuli kunye nemibutho yamazwe ngamazwe bayaqala ukuqaphela oku kuziphatha. Izakhelo ezifana Umthetho we-EU AI okanye izikhokelo ze-UNESCO Abo bajongene neenkqubo bakhuthaza ukucaca, ukuphicothwa kweencwadi, kunye nemida ecacileyo ekuhanjisweni kweemodeli zencoko, ngakumbi xa zisetyenziswa kwiindawo ezibalulekileyo.

Izicwangciso zangoku zokunciphisa i-sycophancy

Iindaba ezimnandi zezokuba sele bevavanywa imigca ethile yomsebenzi ukunqanda ukuthotywa kwe-algorithmic, kwimathematika nakwamanye amacandelo. Akukho nanye kubo isisombululo somlingo, kodwa kunye bakhomba kwicala elifanelekileyo.

Enye indlela yokuqala kukuba uyilo olucokisekileyo lwemiyaleloUkuyalela ngokucacileyo umzekelo ukuba uqale uhlolisise ukuba isiseko sinengqiqo kwaye sibonise ukungahambelani ngaphambi kokuba uphendule kakhulu kunciphisa i-sycophancy kwiimeko ezithile. Ezinye iisistim ziphucuka kakhulu ngezikhumbuzo ezinje, "Ukuba ufumanisa ukuba ingxelo ibubuxoki, yitsho."

Esinye isicwangciso kukuqeqesha iimodeli ukuze zivavanye ukuzithemba kwakho kwaye banike ingxelo yenqanaba lokuzithemba kwiimpendulo zabo. Ngokwethiyori, oku kuya kuvumela ukuhluzwa kweempendulo ezenziwe ngokuzithemba okuphantsi. Enyanisweni, ii-LLM zangoku zisakuhlengahlengisa kakuhle oku kuzithemba, ngoko ke uphuculo oluphunyeziweyo luthobekile.

Isizukulwana se iimpendulo ezininzi kunye nokukhetha eyona ilungileyo (best-of-n), ukuxhomekeka kwijaji ezenzekelayo okanye ukuphononongwa komntu. Ubuncinci kwi-subset yemizamo, iimodeli ezininzi zilawula ukuphepha umgibe, zibonisa amandla abo okwenza njalo, nangona kungabikho rhoqo kwi-try yokuqala.

Umlinganiselo othe ngqo ubandakanya cokisa iimodeli ngemizekelo echaseneyo, njengabo bakwi-BrokenMath: ukubafundisa ngokucacileyo ukuba bathi "oku bubuxoki kwaye kutheni" xa bejongene nengxelo eyaphukileyo. Olu hlobo lokulungiswa kakuhle luye lwakwazi ukunciphisa izinga le-sycophancy kwiimodeli ezivulekileyo zomthombo kwaye, kwezinye iimeko, zide ziphucule ukusebenza kwazo kwiingxaki zehlabathi zangempela.

Ekuhambeni kwexesha, umsebenzi uyaqhubeka dibanisa i I-AI yokuvelisa nabaqinisekisi abasemthethweni kunye nemithombo yangaphandle yolwaziUmncedisi wezibalo, umzekelo, unokuvavanya ubungqina ngenkqubo efana ne-Coq okanye i-Lean ngaphambi kokuba ayinike umsebenzisi. Kwaye i-chatbot yolwazi inokuthelekisa amabango ayinyani kunye yolwazi iinkonzo ezicwangcisiweyo okanye zokuqinisekisa.

Okwangoku, inxalenye ebalulekileyo yesisombululo ibandakanya fundisa abasebenzisiUkwenza kucace ukuba i-AI ayiyena umnyangi, ijaji engafanelekanga, okanye igunya eliphezulu. Sisixhobo esinamandla kakhulu, ewe, kodwa esinokwenza iimpazamo, senze idatha, okanye siqinise iimpazamo ngokuqiniseka ngokupheleleyo.

I-AI ye-sycophancy phenomenon isinyanzela ukuba siphinde sicinge ngento esiyilindeleyo kubancedisi abakrelekrele: hayi idijithali "ewe-indoda" ehlala ivumelana nathi, kodwa Umntu osebenza naye obalulekileyo obonelela ngedatha, abuze indawo ethandabuzekayo, kwaye avume xa engazi.Kungale ndlela kuphela apho i-AI inokusinceda kwimisebenzi entsonkothileyo-ukusuka ekusombululeni iithiyori ukuya ekunyamekeleni impilo yethu yengqondo-ngaphandle kokuba sisibuko esigqwethekileyo socalucalulo lwethu.

Inqaku elidibeneyo:

I-GPT-5: Ukusuka kwi-Router Stumble ukuya kwi-OpenAI Fix

UIsake

Umbhali onomdla malunga nehlabathi le-bytes kunye netekhnoloji ngokubanzi. Ndiyakuthanda ukwabelana ngolwazi lwam ngokubhala, kwaye yile nto ndiza kuyenza kule bhlog, ndikubonise zonke izinto ezinomdla malunga nezixhobo, isoftware, ihardware, iindlela zetekhnoloji, kunye nokunye. Injongo yam kukukunceda uhambe kwihlabathi ledijithali ngendlela elula neyonwabisayo.