Nova generacija PCIe GPU akceleratora donosi enterprise AI u postojeću infrastrukturu – uz fokus na performanse, učinkovitost i optimizaciju troškova.
AMD je predstavio novu generaciju AI akceleratora – Instinct MI350P PCIe GPU, namijenjen organizacijama koje žele ubrzati implementaciju umjetne inteligencije bez velikih infrastrukturnih ulaganja. U trenutku kada sve više tvrtki prelazi iz faze eksperimentiranja u produkciju, ključni izazovi ostaju isti: troškovi clouda, pitanja privatnosti i kompleksnost modernizacije podatkovnih centara.
AMD ovim lansiranjem nudi alternativu – visokoučinkovit AI hardver koji se može implementirati unutar postojeće serverske infrastrukture.
AI performanse „plug-and-play“ generacije
Instinct MI350P dolazi u PCIe formatu s dvostrukim utorom, dizajniran kao „drop-in“ rješenje za standardne, zračno hlađene servere. To znači da tvrtke mogu implementirati AI inference radna opterećenja bez potrebe za promjenama u napajanju, hlađenju ili rack infrastrukturi.
Ovakav pristup posebno je relevantan za organizacije koje traže ravnotežu između performansi i ulaganja – nudeći više snage od CPU rješenja, ali bez potrebe za potpunim prelaskom na specijalizirane GPU platforme.
Prema AMD-u, sustavi mogu podržati do osam GPU akceleratora, što ih čini pogodnima za male, srednje i velike AI modele, uključujući inference i RAG pipelineove.
Fokus na ROI: više performansi uz niže troškove
Jedan od ključnih naglasaka ovog lansiranja je optimizacija povrata ulaganja (ROI). MI350P donosi niz tehničkih unapređenja koja izravno utječu na performanse i operativne troškove:
- do 4.600 TFLOPS performansi u MXFP4 preciznosti
- 144 GB HBM3E memorije s propusnošću do 4 TB/s
- podršku za niske preciznosti (MXFP6, MXFP4) za veći throughput
- optimizaciju putem sparsity tehnologije za INT8 i BF16 formate
Ove značajke omogućuju organizacijama učinkovitiju obradu AI radnih opterećenja uz smanjene zahtjeve za energijom i hlađenjem.
Otvoreni AI ekosustav kao strateška prednost
AMD nastavlja razvijati svoju strategiju otvorenog AI ekosustava. MI350P je dizajniran za rad s širokim spektrom softverskih alata i frameworka, uključujući PyTorch, Kubernetes GPU Operator i cloud-native inference servise.
Poseban naglasak stavljen je na open-source AI stack bez licencnih troškova, koji omogućuje veću transparentnost i smanjenje operativnih troškova. Postojeća radna opterećenja mogu se migrirati uz minimalne izmjene koda, čime se ubrzava prelazak u produkciju.
AI bez kompromisa: od eksperimenta do produkcije
Kako organizacije prelaze iz faze testiranja u stvarne poslovne primjene umjetne inteligencije, fleksibilnost infrastrukture postaje ključna. MI350P omogućuje implementaciju AI rješenja unutar postojećih sustava – bez potrebe za „greenfield“ investicijama.
Rezultat je mogućnost pokretanja većeg broja modela, opsluživanja više korisnika i skaliranja AI operacija unutar postojećih podatkovnih centara.
Snažna podrška industrije
AMD-ov novi GPU već ima snažnu podršku ključnih partnera iz IT industrije. Tvrtke poput Dell Technologies, HPE-a, Cisca, Lenova i Supermicroa ističu kako MI350P omogućuje bržu implementaciju AI infrastrukture uz visoku razinu učinkovitosti i skalabilnosti.
Istodobno, softverski partneri poput Red Hata, VMwarea (Broadcom), Akamaija i Nutanixa naglašavaju važnost otvorene i hibridne AI arhitekture koja olakšava prijelaz iz eksperimentalne faze u produkcijsko okruženje.
Zaključak
S modelom Instinct MI350P, AMD jasno cilja jednu od najvećih prepreka u enterprise AI transformaciji – infrastrukturnu kompleksnost. Kombinacijom visokih performansi, PCIe fleksibilnosti i otvorenog softverskog ekosustava, kompanija nastoji učiniti AI dostupnijim i isplativijim za širi krug organizacija.
U eri u kojoj umjetna inteligencija postaje ključna poslovna komponenta, rješenja poput MI350P mogla bi imati važnu ulogu u ubrzavanju prijelaza s pilot-projekata na stvarne, skalabilne implementacije.

















