Pereiti prie turinio
Technologijos

NVIDIA ACE: kaip dirbtinis intelektas jūsų vaizdo plokštėje paverčia žaidimų NPC tikrais komandos draugais

NVIDIA ACE technologija peržengia tech-demo ribas ir ateina į tikrus AAA žaidimus — PUBG, Total War, Naraka Bladepoint. Gilinamės į architektūrą: mažieji kalbos modeliai, veikiantys lokaliai ant RTX GPU, suvokimo-planavimo-veiksmo ciklas ir atminties sistema, leidžianti AI personažams prisiminti ankstesnes sesijas.

i

icecode.lt

2026 m. vasario 15 d.7 min
NVIDIA ACE: kaip dirbtinis intelektas jūsų vaizdo plokštėje paverčia žaidimų NPC tikrais komandos draugais

NPC revoliucija, kuri tikrai įvyko

Žaidimų industrija dešimtmečius svajojo apie NPC, kurie elgtųsi kaip tikri žmonės. Kiekviena E3 ar GDC konferencija atsinešdavo naujų pažadų, bet realybė visada buvo ta pati — iš anksto surašyti dialogų medžiai ir finite state machines, kurios sugriūdavo vos žaidėjas pasielgdavo nenumatytu būdu. 2025-aisiais NVIDIA ACE (Avatar Cloud Engine) pagaliau peržengia tech-demo ribą: AI NPC veikia tikruose, masiškai žaidžiamuose žaidimuose — PUBG: BATTLEGROUNDS, Total War: PHARAOH, NARAKA: BLADEPOINT, inZOI ir MIR5.

Tačiau dauguma portalų šią naujieną pateikia kaip vienos eilutės antraštę: „AI NPC ateina." Mes gilinamės į tai, kas iš tikrųjų vyksta po gaubtu — kokia architektūra leidžia mažiems kalbos modeliams veikti lokaliai jūsų RTX vaizdo plokštėje, kaip veikia autonominio agento suvokimo-planavimo-veiksmo ciklas ir kodėl jūsų AI komandos draugas prisimena praėjusios sesijos strategiją.

Architektūra: trys smegenų dalys vienoje GPU

NVIDIA ACE autonominiai personažai veikia pagal klasikinę, bet elegantiškai įgyvendintą Perception → Cognition → Action kilpą. Kiekviena dalis naudoja skirtingą specializuotą modelį, ir visi jie sukasi ant žaidėjo vaizdo plokštės vienu metu su grafikos atvaizdavimu.

Suvokimas (Perception)

AI personažas turi „matyti" ir „girdėti" žaidimo pasaulį. Tam NVIDIA naudoja kelis modelius:

  • NemoVision-4B-128k-Instruct — multimodalinis modelis, priimantis vaizdo ir garso įvestis, gebantis suprasti erdvinį kontekstą (kas yra šalia, kokie objektai aplinkoje).
  • NemoAudio-4B-Instruct — garso modelis, kuris analizuoja žaidimo garsų kraštovaizdį ir žaidėjo kalbą, paversdamas juos tekstiniais aprašymais.
  • Parakeet-CTC-XXL-1.1B-Multilingual — daugiakalbė kalbos atpažinimo sistema (ASR), leidžianti žaidėjui tiesiogine kalba bendrauti su AI komandos nariu.

Be to, žaidimo variklio būsenos duomenys (pozicija, inventorius, HP, priešų lokacijos) konvertuojami į tekstinę formą — vadinamasis game state transcription. Taip kalbos modelis gauna visą situacinį kontekstą kaip struktūruotą tekstą.

Mąstymas (Cognition)

Čia dirba pagrindiniai mažieji kalbos modeliai (Small Language Models, SLM). NVIDIA ACE ekosistema palaiko kelis modelius, priklausomai nuo turimos VRAM:

  • Mistral-Nemo-Minitron-8B-128k-Instruct — 8 mlrd. parametrų modelis, gautas apkarpant ir distiliuojant Mistral-NeMo 12B. Naudoja 4096 embedding dimensiją, 32 dėmesio galvas, 40 sluoksnių. Tai pagrindinis „smegenų" modelis, kurį naudoja PUBG Ally.
  • Mistral-Nemo-Minitron-4B-128k-Instruct — sumažinto pėdsako variantas.
  • Mistral-Nemo-Minitron-2B-128k-Instruct — tilpsta vos į ~1,5 GB VRAM. Tai reiškia, kad net RTX 4060 su 8 GB VRAM gali paleisti ir žaidimą, ir AI agentą.
  • Qwen3-8B — naujausia atviro kodo alternatyva, integruota per NVIGI SDK papildinį, palaikanti MultiLORA adapterius greitam fine-tuning.
  • Nemotron-Mini-4B-Instruct — NVIDIA sukurtas specialiai žaidimams, treniruotas ant ~10 000 NPC dialogų, naudoja tik ~2 GB VRAM. Optimizuotas roleplay, RAG ir function calling užduotims.

Svarbus skaičius: pagal esporto tyrimus, realistiškam sprendimų priėmimui reikia 8–13 mikro-sprendimų per sekundę. ACE SLM modeliai yra optimizuoti pasiekti būtent šį dažnį — tai ne chatbotas, laukiantis 3 sekundes atsakymo, o realaus laiko agentinis mąstymas.

Veiksmas (Action)

SLM sugeneruoja struktūruotą veiksmų planą (funkcijų iškvietimai), kuris perduodamas žaidimo varikliui: judėti į tašką X, paimti ginklą, gydyti komandos narį, vairuoti transporto priemonę. Lygiagrečiai veikia Audio2Face-3D lūpų sinchronizavimui ir Riva TTS kalbos sintezei — jei AI personažas „kalba", jo veidas juda natūraliai.

NVIGI: kaip AI ir grafika dalinasi viena GPU

Viena didžiausių techninių problemų — kaip paleisti kalbos modelio inferencę ant tos pačios GPU, kuri tuo metu renderina žaidimą 60+ FPS? Atsakymas yra NVIDIA In-Game Inferencing (NVIGI) SDK.

NVIGI yra modulinė papildinių (plugin) sistema su unifikuota API. Pagrindiniai komponentai:

  • Branduoliniai papildiniai: nvigi.plugin.asr.ggml.cuda (kalbos atpažinimas per Whisper), nvigi.plugin.gpt.ggml.cuda (dialogų generavimas per llama.cpp), nvigi.plugin.embed.ggml.* (embedding'ai RAG sistemai).
  • Pagalbiniai papildiniai: D3D12 įrenginių valdymas, gRPC tinklo komunikacija.
  • Compute-in-Graphics (CiG): raktinė technologija, leidžianti NVIGI perduoti AI užduotis į GPU, naudojant tą patį D3D12 direct queue, kurį naudoja žaidimas grafikoms. Tai leidžia efektyviai dalinti GPU resursus tarp renderinimo ir inferencės, nesukeliant frame drops.

SDK palaiko kelis inferencės backend'us: GGML (llama.cpp, whisper.cpp), ONNX Runtime ir DirectML — pastarasis leidžia veikti net ne-NVIDIA GPU, nors optimalumas, žinoma, yra su CUDA.

Atmintis: kodėl AI prisimena vakarykštį mūšį

Vienas įspūdingiausių ACE aspektų — ilgalaikė atmintis. Tradiciniai NPC neturi atminties: kiekvienas susitikimas yra „pirmas kartas." ACE tai sprendžia per Retrieval Augmented Generation (RAG) sistemą.

Kaip tai veikia techniškai:

  • Kiekviena AI personažo suvokimo, mąstymo ir veiksmo iteracija generuoja memory entries — struktūruotus tekstinius įrašus.
  • Šie įrašai konvertuojami į vektorinius embedding'us naudojant E5-Large-Unsupervised modelį.
  • Kai AI turi priimti naują sprendimą, atliekama similarity search (panašumo paieška) per sukauptą atminties bazę — randami relevantiškiausi prisiminimai.
  • Šie prisiminimai injektuojami į SLM prompt kontekstą kartu su dabartine situacija.

Praktiškai tai reiškia: PUBG Ally gali pasakyti „Paskutinį kartą Erangel žemėlapyje tu mėgai snaiperį — paimti vieną?" Tai ne triukas — tai tikra vektorinė paieška per praeitas sesijas.

ACE Agent sistemoje tai įgyvendinta per Slot mechanizmą — raktų-reikšmių poras, kurios gali būti trumpalaikės (šios sesijos kontekstas) arba ilgalaikės (žaidėjo vardas, mėgstama taktika, žaidimo stilius).

Realūs žaidimai, realūs rezultatai

PUBG Ally — pirmas CPC pasaulyje

KRAFTON sukūrė tai, ką vadina Co-Playable Character (CPC) — naują AI personažų kategoriją, kuri yra ne NPC ir ne botas, o AI komandos narys. PUBG Ally naudoja Mistral-Nemo-Minitron-8B-128k-Instruct modelį ir geba:

  • Bendrauti natūralia kalba naudojant žaidimui specifinį žargoną.
  • Teikti realaus laiko strategines rekomendacijas.
  • Rasti ir dalintis grobiu (loot sharing).
  • Vairuoti transporto priemones, gydyti ir prikelti komandos narius.
  • Priimti savarankiškus sprendimus, keičiant taktiką pagal situaciją.

Viešas testavimas prasidėjo 2026 m. pradžioje per PUBG Arcade — anglų, korėjiečių ir kinų kalbomis.

Total War: PHARAOH — AI patarėjas strategijai

Creative Assembly su NVIDIA sukūrė kontekstinį AI patarėją, kuris veikia kaip era-tinkamas NPC personažas. Žaidėjas gali užduoti klausimus natūralia kalba: „Kodėl mano gyvenvietė sukilo?" arba „Kokią strategiją pasirinkti prieš hetitus?" SLM veikia lokaliai ant žaidėjo GPU, o Creative Assembly naudojo ACE kūrimo įrankius, kad sujungtų Total War duomenų bazę su kalbos modeliu per RAG pipeline. Tikslas — padaryti strategiją prieinamesnę naujiems žaidėjams, neprarandant gilumo, kuris apibrėžia seriją jau 25 metus.

Kiti integracijos

NARAKA: BLADEPOINT (NetEase) — AI komandos nariai 40 žaidėjų kovose, gebantys rekomenduoti įrangą ir keisti ginklus. inZOI — „Smart Zoi" personažai, kurie autonomiškai gyvena simuliuotame mieste: padeda paklydusiems, siūlo maistą alkanam nepažįstamajam. MIR5 (Wemade Next) — AI bossai, kurie mokosi iš ankstesnių žaidėjų taktikų, adaptuodamiesi prie įgūdžių, gebėjimų ir įrangos — kaskart vis sunkesni.

Ką tai reiškia Lietuvos žaidėjams ir kūrėjams

Visa tai veikia ant jau esamų RTX vaizdo plokščių. Jei turite RTX 4060 ar naujesnę — jūsų GPU jau turi pakankamai VRAM paleisti 2B modelį. RTX 4070 Ti ar aukštesnė — 8B modelis su 128k konteksto langu. Tai nėra ateities technologija — tai šiandien.

Lietuvos indie kūrėjams NVIGI SDK yra atviras, o Qwen3-8B ir Nemotron-Mini-4B modeliai — taip pat. Tai reiškia, kad mažai studijai nereikia NVIDIA partnerystės sutarties: parsisiųsk SDK, integruok papildinį, parašyk personažo system prompt su backstory ir function definitions — ir tavo žaidime veikia AI NPC, kuris kalba, mąsto ir prisimena.

Žinoma, čia yra ir kita medalio pusė. ACE modeliai reikalauja VRAM, kuris kitaip būtų skirtas aukštesnei grafikos kokybei. Kol kas nėra standartizuotų benchmark'ų, rodančių tikslų FPS poveikį skirtingose konfigūracijose. Ir nors 8–13 sprendimų per sekundę skamba solidžiai, tai vis dar toli nuo žmogaus subkonceptualaus reflekso — AI NPC vis dar „mąsto" lėčiau nei patyręs žaidėjas. Bet kaip pirmas žingsnis nuo surašytų dialogų medžių — tai kvantinis šuolis.

Išvada: NPC pagaliau gavo smegenis

NVIDIA ACE nėra tik rinkodaros terminija. Tai pilna techninė platforma — nuo multimodalinio suvokimo per specializuotus SLM mąstymui iki RAG atminties ir NVIGI GPU inferencės planavimo. Pirmą kartą žaidimų istorijoje AI personažai yra autonominiai agentai, ne animuoti if-else blokai. Ir svarbiausia — visa tai vyksta lokaliai, jūsų kompiuteryje, be debesijos latentinio vėlavimo.

2026-ieji gali tapti metais, kai žaidėjai nustos sakyti „koks kvailas botas" ir pradės sakyti „geras planas, Ally."

Šaltiniai

Dalintis straipsniu