- Eroarea routerului model a cauzat răspunsuri inconsistente în GPT-5.
- OpenAI a rechemat modelele anterioare și a reintrodus GPT-4o în urma unor reclamații.
- Critici pentru erori specifice și un ton mai rece din partea asistentului.
- Sam Altman a recunoscut erori și a anunțat modurile și îmbunătățirile Auto/Rapid/Thinking.
Lansarea GPT-5 a venit cu erori vizibile încă din prima zi., cu rapoarte despre răspunsuri incoerente, schimbări neașteptate de ton și decizii tehnice care au derutat baza de utilizatori. Combinația dintre o prezentare excesiv de ambițioasă și o experiență de chat inegală a stârnit critici și dezbateri publice.
OpenAI a răspuns cu corecții timpurii și promisiuni de îmbunătățire.: a restabilit temporar GPT-4o pentru clienții plătitori, a recunoscut erorile din sistemul de rutare și a accelerat ajustările pentru a stabiliza comportamentul asistentului. Totuși, cizmă A lăsat îndoieli cu privire la criteriile modelului implicit și la gestionarea schimbărilor.
Ce a mers prost cu premiera GPT-5
Cel mai notabil punct a fost modelul de router, un sistem care decide automat ce variantă răspunde fiecărei interogări. În practică, acest lucru a dus la inconsecvențe: un răspuns genial putea fi urmat de unul inexact în cadrul aceleiași conversații, dând impresia unui produs neterminat.
Retragerea inițială a modelelor anterioare (inclusiv GPT-4o) a stârnit agitație în comunitate.Utilizatorii care s-au bazat pe tonul său mai uman și stabil au protestat, iar în câteva zile, OpenAI a restabilit GPT-4o pentru abonați, în timp ce a ajustat implementarea GPT-5.
OpenAI a introdus controale de utilizare și noi moduriSam Altman a anunțat trei opțiuni la X: „Auto”, „Rapid” și „Thinking”, precum și limite de 3.000 de mesaje pe săptămână pentru GPT-5 Thinking, cu capacitate suplimentară bazată pe utilizare. Intenția este de a oferi mai mult control atunci când rutarea eșuează.
Prezentarea în sine a fost criticată pentru grafica confuză. (scale și axe neclare) care au alimentat percepția unei lansări grăbite în formă și fond.
Erori raportate și nemulțumirea comunității
Exemple de greșeli banale au devenit virale: erori geografice, greșeli de ortografie și raționament matematic eronat. A existat chiar și un caz în care s-a afirmat că „căpșună” nu conține litera „r”. Acestea sunt cunoscute ca „halucinații” în IA, dar au fost surprinzătoare prin frecvența lor în primele zile.
Schimbarea tonului a generat frecareMulți utilizatori au descris GPT-5 ca fiind mai sec și mai practic. Spre deosebire de răspunsurile calde din partea GPT-4, au apărut răspunsuri laconice, cum ar fi un scurt „Am luat act”. Unii experți văd un aspect pozitiv al reducerii lingușirii, dar recunosc că unii participanți apreciază o căldură pe care acum o percep ca lipsă.
Presiunea socială s-a cristalizat în petiții și discuții de masăMii de semnături au fost adăugate petiției pentru restabilirea GPT-4o ca opțiune stabilă. Confuzia privind modelul implicit și rutarea automată a fost o plângere recurentă atât în comunitățile tehnice, cât și în cele generaliste.
OpenAI susține că GPT-5 reduce halucinațiile și îmbunătățește calibrarea., dar experiența multor oameni din prima săptămână nu a fost pe măsura acestei promisiuni. Compania atribuie o parte din comportamentul neregulat routerului și amplorii implementării.
- Inconsistențe datorate rutării dinamice între modele.
- Răspunsuri greșite la cultură generală și calcul.
- Percepția unui ton mai rece și mai puțin empatic.
- Retragerea temporară a modelelor anterioare foarte apreciate.
Răspunsul OpenAI și efectele sale asupra încrederii
Sam Altman a recunoscut că lansarea a fost defectuoasă și că au subestimat ce ar fi necesar pentru a actualiza zeci sau sute de milioane de oameni simultan. După întâlniri cu presa și clienții, compania s-a angajat să mențină active modelele mai vechi și să rafineze rutarea.
Foaia de parcurs imediată include ajustări pentru a „arăta mai inteligent”, îmbunătățiri ale sistemului decizional și implementarea modurilor Auto/Rapid/Gândire pentru a modula costul, viteza și raționamentul. Scopul declarat este de a obține consecvență fără a sacrifica utilitatea.
Reputația a fost supusă examinăriiAcest regres pune sub semnul întrebării credibilitatea în rândul utilizatorilor și investitorilor, pe o piață din ce în ce mai competitivă, unde soliditatea produsului cântărește la fel de mult ca progresul laboratorului.
Ce înseamnă pentru utilizatorul obișnuit și pentru companii
Pentru utilizarea de zi cu zi, schimbarea are suișuri și coborâșuri.Mai puțină improvizație și răspunsuri mai precaute ajută la sarcinile sensibile (documentație, pași ghidați, referințe), dar există mai puțină scânteie conversațională pentru creativitate sau contact apropiat.
În mediile corporative, calmul poate fi o virtuteMai puține divagații și mai multă rigoare facilitează procesele în mai mulți pași, planificarea și standardele reproductibile - exact acolo unde consecvența valorează timp și bani. Cheia va fi stabilizarea routerului și clarificarea modelului potrivit pentru fiecare sarcină.
Testul decisiv va fi stabilitatea în următoarele săptămâni.Cu alegeri de modele, noi moduri și promisiuni de iterație rapidă, compania are loc să redirecționeze lansarea atâta timp cât acordă prioritate consecvenței, opțiunilor clare și respectului pentru fluxurile de lucru existente.
Startup-ul GPT-5 arată că eroarea nu a fost doar tehnică.Managementul schimbărilor și așteptările contează la fel de mult ca și codul. Revenirea la GPT-4, noile moduri și îmbunătățirile anunțate demonstrează un răspuns rapid; provocarea acum este de a reconstrui încrederea cu o consecvență susținută.
Scriitor pasionat despre lumea octeților și a tehnologiei în general. Îmi place să îmi împărtășesc cunoștințele prin scriere și asta voi face în acest blog, să vă arăt toate cele mai interesante lucruri despre gadgeturi, software, hardware, tendințe tehnologice și multe altele. Scopul meu este să vă ajut să navigați în lumea digitală într-un mod simplu și distractiv.