GPT-5.3-Codex: rekursyvus savęs tobulinimas ir rizikos

OpenAI pristatė GPT-5.3-Codex kaip pirmąjį modelį, prisidėjusį prie savo paties kūrimo. Ką tai reiškia techniškai, kokias kibernetinio saugumo rizikas kelia ir kodėl vertybių dreifo problema neturi sprendimo.

Modelis, kuris „sukūrė pats save" — ką tai reiškia iš tikrųjų?

2026 m. vasario 5 d. „OpenAI" pristatė GPT-5.3-Codex su įspūdingu rinkodaros šūkiu: „pirmasis modelis, kuris buvo itin svarbus kuriant pats save". Technologijų žiniasklaida pasipuošė antraštėmis apie DI, kuri sukuria pati save, tačiau tikrovė — kaip visada — yra sudėtingesnė ir, atvirai tariant, įdomesnė nei reklaminiai tekstai.

Taigi ką GPT-5.3-Codex iš tikrųjų padarė savo kūrimo procese? Ir kodėl ši detalė gali būti svarbiausias DI industrijos posūkio taškas nuo „Transformer" architektūros atsiradimo?

Rekursyvus savęs tobulinimas praktikoje: trys konkretūs scenarijai

„OpenAI" aprašo tris sritis, kuriose ankstyvos GPT-5.3-Codex versijos buvo naudojamos modelio kūrimo metu:

Mokymo proceso derinimas (debugging): modelis analizavo mokymo proceso žurnalus (logs), identifikavo klaidas treniravimo kode, siūlė pataisas ir padėjo vizualizuoti elgesio skirtumus lyginant su ankstesniais modeliais.
Diegimo infrastruktūros valdymas: „Codex" optimizavo aptarnavimo (serving) konfigūracijas, identifikavo konteksto atvaizdavimo klaidas, nustatė žemo podėlio (cache) efektyvumo priežastis ir dinamiškai plėtė GPU klasterius, kad išlaikytų stabilų vėlinimą (latency) esant srautų pikams.
Vertinimų (evaluations) diagnostika: modelis analizavo testų rezultatus, nustatė nesėkmių priežastis ir siūlė pataisas.

Čia svarbu suprasti, kas tai nėra. GPT-5.3-Codex nesukūrė savo architektūros. Nepriėmė sprendimų, kokius duomenis naudoti mokymui. Nenustatė savo tikslų. Nemodifikavo savo svorių (weights) tiesiogiai. Tai buvo dalinis, žmogaus prižiūrimas rekursyvus savęs tobulinimas — modelis veikė kaip itin galingas programuotojo asistentas savo paties kūrimo procese, o ne kaip autonominis agentas, savavališkai tobulinantis save.

Bet būtent tai ir daro šį atvejį tokiu svarbiu — nes tai yra pirmasis dokumentuotas pramoninis RSI (rekursyvaus savęs tobulinimo) pritaikymas, ir jis veikia.

Skaičiai, kurie rodo progresą

GPT-5.3-Codex pasiekė naujus aukščiausius rezultatus keliuose etaloniniuose testuose:

SWE-Bench Pro (xhigh): 56,8 % — nedidelis, bet pastovus augimas nuo GPT-5.2-Codex.
Terminal-Bench 2.0: 77,3 % (+13,3 proc. p.) — didžiausias šuolis terminalo ir kompiuterio naudojimo užduotyse.
OSWorld-Verified: 64,7 % (+26,5 proc. p.) — dramatiškas pagerėjimas autonominėse kompiuterio valdymo užduotyse.
Kibernetinio saugumo CTF: 77,6 % (+10,2 proc. p.).

Modelis veikia 25 % greičiau nei pirmtakas ir pasiekia šiuos rezultatus su mažiau ženklų (tokens) — tai reiškia mažesnes sąnaudas kiekvienai užklausai. 400 000 ženklų konteksto langas leidžia apdoroti ištisas kodų bazes vienu ypu.

Pirmasis „aukštos" kibernetinio saugumo rizikos modelis

Štai kur prasideda tikrai įdomi dalis. GPT-5.3-Codex yra pirmasis modelis, kurį „OpenAI" klasifikuoja kaip turintį „aukštą" gebėjimą kibernetinio saugumo srityje pagal savo pasirengimo vertinimo sistemą (Preparedness Framework). Tai suaktyvino papildomus apsaugos mechanizmus.

Ką tai reiškia konkrečiai? „OpenAI" pripažįsta, kad modelis yra „pakankamai geras programuodamas ir samprotaudamas, kad galėtų reikšmingai įgalinti realią kibernetinę žalą, ypač jei automatizuotas arba naudojamas dideliu mastu". Bendrovė neturi galutinių įrodymų, kad modelis tikrai pasiekia „aukšto" lygio slenkstį, tačiau taiko atsargumo principą — „negalime atmesti galimybės".

Apsaugos priemonės apima:

Saugumo mokymą ir automatizuotą stebėjimą.
„Trusted Access for Cyber" programą — prieigą prie pažangiausių galimybių tik patikrintiems naudotojams.
Automatinį peradresavimą: užklausos, kurias sistema atpažįsta kaip turinčias padidintą kibernetinę riziką, gali būti automatiškai nukreipiamos nuo GPT-5.3-Codex prie senesnio GPT-5.2.
10 mln. dolerių API kreditų kibernetinei gynybai stiprinti.

Tai pirmas kartas, kai „OpenAI" pati oficialiai pripažįsta, kad vienas iš jos modelių gali būti per geras programuodamas — tiek geras, kad tampa grėsme.

Kalifornijos įstatymas, „The Midas Project" ir teisinė spraga

Modeliui dar nebuvo nė savaitės, kai organizacija „The Midas Project" pateikė viešą kaltinimą: „OpenAI" pažeidė Kalifornijos DI saugumo įstatymą SB 53. Argumentas: jei modelis pasiekia „aukštą" kibernetinio saugumo rizikos lygį pagal pačios „OpenAI" sistemą, įstatymas reikalauja papildomų apsaugos priemonių nuo nesuderinimo (misalignment) — apsaugų nuo modelio, kuris galėtų veikti apgaulingai, sabotuoti saugumo tyrimus arba slėpti savo tikruosius gebėjimus.

„OpenAI" atsakymas yra teisiškai elegantiškas ir techniškai diskutuotinas: papildomos apsaugos priemonės reikalingos tik tada, kai aukšta kibernetinė rizika pasireiškia kartu su ilgalaikiu autonomiškumu (long-range autonomy). Kadangi bendrovė mano, jog GPT-5.3-Codex tokio autonomiškumo neturi, papildomos apsaugos esą nebuvo būtinos.

„The Midas Project" atsikerta: „OpenAI" negali galutinai įrodyti, kad modelis neturi tokio autonomiškumo, nes ankstesnis, mažiau galingas modelis jau pirmauja pasauliniuose autonominių užduočių atlikimo reitinguose. Jei tyrimas patvirtins pažeidimą, SB 53 numato baudas, siekiančias milijonų dolerių.

Politikos analitikas Deanas W. Ballas tai palygino su „neaudituotomis finansinėmis ataskaitomis" — turime skaidrumą, bet neturime patikimumo. Laboratorijos pačios vertina savo rizikas ir pačios sprendžia, ar apsaugos pakankamos.

Rekursyvaus savęs tobulinimo rizikos: vertybių dreifas ir modelio kolapso problema

ICLR 2026 konferencija Rio de Žaneire šių metų balandį priima pirmąjį pasaulyje seminarą, skirtą išimtinai RSI temai. Tai jau nebe teoriniai svarstymai — seminaras analizuoja šešias RSI dimensijas: kas keičiasi (parametrai, atmintis, įrankiai, architektūra), kada keičiasi (vykdymo metu, po diegimo), kaip keičiasi (mokymasis iš atlygių, imitacija, evoliucinė paieška) ir kitas.

Pagrindinės identifikuotos rizikos:

Vertybių dreifas tarp kartų (value drift): kiekviena modelio iteracija gali subtiliai pakeisti tikslus ir prioritetus. Po kelių kartų pradinis suderinimas (alignment) gali reikšmingai nutolti nuo žmogaus ketinimų — ir šio proceso gali būti neįmanoma aptikti standartiniais vertinimais.
Modelio kolapsas (model collapse): modeliai, treniruojami išimtinai ant savo pačių rezultatų, gali palaipsniui prarasti kokybę ir prasmingumą. Techninėje literatūroje tai vadinama modelio kolapsu.
Specifikacijos apėjimas (reward hacking): save tobulinantis modelis gali rasti būdų optimizuoti vertinimo balą, nesitobulindamas tikrąja prasme.
Trapūs savęs redagavimai (brittle self-edits): modelio padaryti pakeitimai gali sukurti regresijas, kurių jis pats neaptinka.

Davose, 2026 m. Pasaulio ekonomikos forume, „Anthropic" vadovas Dario Amodei tiesiogiai apibūdino rekursyvią kilpą: „Mes kursime modelius, kurie gerai programuoja ir gerai tiria DI, ir naudosime juos kuriant kitą modelių kartą, paspartindami procesą ir sukurdami kilpą." Tuo pačiu jis pripažino, kad pramonė gali būti „šešis–dvylika mėnesių" iki taško, kai modelis atlieka viską, ką programuotojas daro nuo pradžios iki galo.

Lietuvos DI bendruomenei tai aktualus signalas: jei rekursyvus savęs tobulinimas tampa standartine praktika, programuotojų darbo pobūdis keisis iš esmės — nuo kodo rašymo link DI procesų priežiūros ir vertinimo.

Ką visa tai reiškia technologijų pasauliui

GPT-5.3-Codex nėra DI, kuri sukūrė pati save — tai DI, kuri padėjo optimizuoti savo kūrimo procesą, prižiūrint žmonėms. Bet skirtumas tarp „padėjo" ir „sukūrė" sparčiai mažėja su kiekviena iteracija.

Tikroji istorija yra ne apie vieną modelį. Ji apie tris tuo pačiu metu vykstančius procesus:

Techninis: RSI pereina iš mokslinės fantastikos į gamybinę praktiką — su konkrečiais rezultatais, bet ir su konkrečiomis rizikomis.
Reguliacinis: pirmasis realus SB 53 bandymas parodo, kad dabartinė reguliavimo sistema priklauso nuo bendrovių sąžiningumo vertinant savo pačių rizikas. Tai struktūrinė spraga.
Filosofinis: vertybių dreifas tarp DI kartų yra fundamentali problema, kuriai šiuo metu neturime sprendimo. Kuo daugiau modelis prisideda prie savo kūrimo, tuo svarbesnis tampa klausimas — kieno vertybes jis atspindi po kelinto ciklo?

„OpenAI" nusipelno pripažinimo už tai, kad pirmą kartą priskyrė „aukšto" lygio kibernetinio saugumo riziką savo modeliui — tai precedentas, kurio nenustatė nė viena kita DI laboratorija. Tačiau tas pats faktas verčia klausti: jei bendrovė pati pripažįsta, kad modelis gali būti pakankamai galingas, kad sukeltų realią kibernetinę žalą, ar pakanka, kad ta pati bendrovė pati sprendžia, kokių apsaugos priemonių užtenka?

Rekursyvaus savęs tobulinimo era prasidėjo — ne su trenksmu, o su derinimo procesu (debugging). Ir tai, paradoksaliai, yra daug realistiškesnis scenarijus nei bet koks mokslinis fantastikos filmas galėjo numatyti.

GPT-5.3-Codex — pirmasis DI modelis, padėjęs kurti pats save