NVIDIA GTC 2024 összefoglaló: Áttörés az AI és GPU technológia világában

Az idei évben ismét összegyűltek az iparág vezetői, kutatói és fejlesztői az NVIDIA GPU Technology Conference (GTC) keretein belül, hogy megoszthassák legújabb eredményeiket és betekintést nyújthassanak a jövő technológiai trendjeibe. Az NVIDIA GTC nem csupán egy konferencia, hanem egy olyan fórum, ahol az innováció és a fejlődés középpontjában álló világ minden szegmensének képviselői összeérnek, így meglehetősen nagy érdeklődés övezte idén is.

Az idei GTC-n az NVIDIA olyan fejlesztéseket és technológiai áttöréseket mutatott be, amelyek forradalmasíthatják az iparágak működését és a mindennapi életünket.  

Cikkünkben áttekintjük az esemény során bemutatott talán legfontosabb bejelentéseket:

Itt az NVIDIA Blackwell

Kétségkívül a konferencia legkimagaslóbb pontja az volt, hogy  – a számítástechnika új korszakát elindítva – az NVIDIA bejelentette új platformját, az NVIDIA Blackwell-t, amely lehetővé teszi a vállalatok számára, hogy valós időben, nagy hatékonysággal működő generatív mesterséges intelligenciát építsenek és futtassák azokat billió paraméteres nagy nyelvi modelleken, elődjénél akár 30-szor nagyobb teljesítmény, 4-szer gyorsabb AI-betanítás, 25-ször alacsonyabb energiafogyasztás és 25-ször alacsonyabb teljes tulajdonlási költség (TCO) mellett.

További fontos információk:

A Blackwell GPU architektúra szédületes képességei révén elősegítheti az áttöréseket az adatfeldolgozás, a mérnöki szimuláció, a tervezés automatizálás, a számítógéppel segített gyógyszertervezés, a kvantumszámítás és a generatív mesterséges intelligencia területén is.

Várható megjelenés: 2024 év folyamán

Komplett NVIDIA minősített megoldások

 A Blackwell GPU-kra építve a gyártó természetesen frissítette, mondhatni szuperszámítógép termékportfólióját is, melyek egy teljesen új szintet hoznak el a hétköznapi halandók számára is elérhető számítási teljesítmény terén.

GB200 NVL72

A GB200 NVL72 egy több csomópontból álló, folyadékhűtéses, rack-méretű rendszer, a hatalmas számításigényű feladatokhoz. 36db GB200 Grace Blackwell Superchip rejlik benne, egyenként két Blackwell GPU-val, amelyek egy Grace CPU-hoz csatlakoznak, ami így összesen 72 Blackwell GPU-t jelent egyetlen NVLink tartományban. A platform tehát „egyetlen GPU-ként működik”. 1,4 exaflop AI teljesítményével és akár 30 TB villámgyors memóriával az újonnan bejelentett DGX SuperPOD alapköve.

Várható megjelenés: 2024 év folyamán

HGX B200 & HGX B100

A HGX B200 és HGX B100 x86 alapon működő skálázható platformok, amelyeket a legteljesítményigényesebb generatív mesterséges intelligencia, adatelemzési és nagy teljesítményű számítástechnikai (HPC) munkaterhelésekhez terveztek. Viszonyításképp: a HGX B200 15-ször nagyobb AI teljesítmény nyújt a 2 éve megjelent – amúgy nem csekély teljesítményű – HGX H100-hoz képest, 12-szer kedvezőbb teljes tulajdonlási költség (TCO) mellett.

Várható megjelenés: 2024 év folyamán

NVIDIA DGX B200

Az NVIDIA legendás DGX rendszereinek legújabb iterációját, az NVIDIA DGX B200-at is a forradalmi NVIDIA Blackwell GPU-k hajtják. A DGX B200 olyan vállalkozások számára optimális választás, akik egy egységes mesterségesintelligencia-platformot keresnek – nem akarnak a hosszas beüzemeléssel és akár hetekben, hónapokban mérhető finomhangolásokkal bajlódni – hisz ez idő alatt már a konkrét feladataikra is koncentrálhatnak. Az NVIDIA DGX B200 8db GPU-val, összesen 1440 GB-nyi GPU memóriával van szerelve. Egy előző generációs DGX H100-hoz képest akár 15-ször nagyobb AI teljesítményt érhetünk el segítségével. A DGX B200 rendszerek a következő generációs NVIDIA DGX POD és NVIDIA DGX SuperPOD alapkövei. Jó tudni, hogy a termék ára az Enterprise Business Standard támogatást is tartalmazza.

Várható megjelenés: A DGX B200 2024 végén kerül kiszállításra

NVIDIA Quantum-X800 InfiniBand & Spectrum-X800

A Quantum-X800 és a Spectrum-X800 az NVIDIA hálózati platformjai a Blackwell számítási architektúrán alapuló, következő generációs mesterséges intelligencia rendszerek számára.

Az NVIDIA Quantum-X800 InfiniBandet a legnagyobb teljesítményű, mesterséges intelligencia által dedikált infrastruktúrákhoz ajánlják, ahol kulcsfontosságú az alacsony késleltetés, a nagy effektív sávszélesség.

Az NVIDIA Spectrum-X800 hálózati megoldást pedig a mesterséges intelligencia által optimalizált hálózatokhoz ajánlják, minden olyan adatközponthoz és más környezethez, mint például a multi-tenant mesterséges intelligencia-felhők vagy épp a nagyvállalati hiperskálázható rendszerek.

Várható megjelenés: Várhatólag 2024 végén

NVIDIA AI Enterprise 5.0

Az NVIDIA AI Enterprise egy sokak által már használt teljeskörű, felhőalapú szoftverplatform, amely minden vállalkozás számára elérhető közelségbe hozta a generatív AI-t, a legmagasabb teljesítmény és leghatékonyabb működés mellett. A most bejelentett NVIDIA 5.0-s verziója könnyen használható mikroszolgáltatásokat tartalmaz vállalati szintű biztonsággal, támogatással és stabilitással.

Várható megjelenés: Már megjelent!

NVIDIA NeMo Retriever for Retrieval-Augmented Generation

Az NVIDIA AI Enterprise olyan eszközöket is biztosít, amelyek lehetővé teszik a vállalkozások számára, hogy a kísérleti szakasztól a termelésig könnyedén juttassák el visszajelzésekkel kiegészített mesterséges intelligencia (RAG) alkalmazásaikat. Az NVIDIA NeMo Retriever olyan generatív mesterséges intelligencia mikroszolgáltatások gyűjteménye, amely révén a cégek zökkenőmentesen összekapcsolhatják az egyéni modelljeiket a különféle üzleti adatokkal, így rendkívül pontos válaszokat kaphatnak. A NeMo Retriever a generatív mesterséges intelligencia alkalmazásokat vállalati szintű RAG képességekkel bővíti, amelyek bárhol csatlakozhatnak az üzleti adatokhoz.

Várható megjelenés: A felhasználók már igényelhetnek korai hozzáférést

NVIDIA NeMo Development Microservices

Az NVIDIA NeMo egy nyílt forráskódú keretrendszer a fejlesztők számára, a legkorszerűbb társalgási mesterséges intelligencia modellek, egyedi generatív AI-k fejlesztéséhez. Az egyedi generatív mesterséges intelligencia egyszerűbb elkészítése érdekében a gyártó korai hozzáférési programot hirdetett meg a NeMo Curator, NeMo Customizer és NeMo Evaluator mikroszolgáltatásokhoz – amelyek minden fejlesztési szakaszt lefednek, az adatok feldolgozásától és testreszabásától az értékelésig.

Várható megjelenés: A felhasználók már igényelhetnek korai hozzáférést

NVIDIA Maxine

Az NVIDIA Maxine már egy pár éve létező megoldás a valós idejű videókommunikációhoz: mesterséges intelligencia segítségével ténylegesen valós időben fordítja a videóhívásban résztvevő külföldi partner mondatait – nem csak szövegesen, hanem hanganyagban is. Ez a fejlesztés kapott most jelentős frissítést, melyben hatékonyabb lehet a háttérzaj eltávolítás, immár stúdió minőségű a hang, jobb a szemkövetés funkció és sok más újdonsághoz férhetünk hozzá.

Várható megjelenés: Egyes funkciók már elérhetőek

NVIDIA Riva

Az NVIDIA Riva-t már a vállalatok éve óta használhatják testre szabható, valós idejű társalgási AI-folyamatok létrehozásához. A Riva magában foglalja az automatikus beszédfelismerést (ASR), a szövegfelolvasást (TTS) és a neurális gépi fordítást (NMT). A Riva segítségével a cégek LLM-mel támogatott beszéd- és fordítófelületeket adhatnak hozzá a chatbothoz, így lebilincselő, valósághűbb, többnyelven beszélni képes asszisztenseket vagy épp avatárokat létrehozva.

A most bejelentett frissítésben a Riva számos frissítést kapott. Továbbfejlesztették az automatikus beszédfelismerést, mely mostantól tartalmazza a HuggingFace Open ASR ranglista élén álló leggyorsabb és legpontosabb modelleket – többek közt a Canary többnyelvű (angol, francia, német és spanyol) és többfeladatos ASR és kétirányú fordítási modellt és angol átírási modellt a Parakeet ASR családból.

A megújult TTS modul képes egy akár 3 másodperces hangmintából egy egyedi modellt létrehozni, amely ezután valósághűn tudja felolvasni mintázója hangjával a szövegeket. Női és férfi hangot is képes modellezni, 5 nyelven (angolul, németül, olaszul, mandarinul, spanyolul) tud beszélni, és hangját képes érzelmekkel fűszerezni (boldog, nyugodt, semleges, szomorú, ijedt, dühös) a kontextushoz igazodva.

Várható megjelenés: Már megjelent!

NVIDIA Metropolis

Az NVIDIA Metropolis alkalmazás segítségével kombinálni lehet a szokásos videokamerákat és érzékelőket mesterséges intelligencia-kompatibilis videóelemzéssel. Ez javítja a működési hatékonyságot és különböző felhasználási lehetőségeket teremt az iparágak széles körében: többek között a városi forgalomirányítást, a repülőtéri műveleteket és az automatizált gyári ellenőrzéseket is reformálhatja.

Az NVIDIA most bemutatta, hogyan használhatják a fejlesztők a szoftvert és a generatív mesterséges intelligenciát a digitális ikrek és a valós idejű szimulációk egyesítésére, megkönnyítve a robotok tesztelését és finomhangolását, valamint ipari környezetben való interakcióikat. A fejlesztői platformok, például az NVIDIA Omniverse, a Metropolis, az Isaac és a cuOpt kombinálásával a felhasználók létrehozhatnak egy „AI gym” környezetet a NIM-ek felhasználásával készült AI-k tanításához, segítve a robotokat és az embereket a kiszámíthatatlan forgatókönyvekhez való alkalmazkodásban és az összetett környezetben való navigálásban.

Az NVIDIA emellett bejelentette a Visual Insight Agent (VIA) munkafolyamat gyűjteményét is, amely olyan mesterséges intelligenciák létrehozására szolgál, amely képesek nagy mennyiségű élő vagy archivált videó és kép feldolgozására Vision-Language Models (VLM) segítségével.

Várható megjelenés: A felhasználók már igényelhetnek korai hozzáférést

NVIDIA Omniverse frissítések

Az NVIDIA Omniverse platfom megannyi előnyéről már hosszasan értekeztünk egy korábbi cikkünkben. Aki nem ismerné a gyártó ezen megoldását, érdemes azt tudnia, hogy az NVIDIA Omniverse lehetővé teszi, hogy egy megosztott virtuális térben összekapcsolhassuk a tartalomkészítő szoftvereket és a felhasználókat. Ez az együttműködési platform, egy sokszínű és interaktív virtuális fejlesztési felület, mely a mesterséges intelligencia-alapú szoftvereszközök széles választékát is tartalmazza. Az egyénektől a nagyvállalatokig mindenki, másokkal együttműködve, olyan egyedi virtuális világokat építhet, amelyek a fizikai világhoz hasonlóan néznek ki, érzékelnek és viselkednek.

A gyártó a most bejelentettek szerint sokkal kedvezőbb (GPU alapú) árazást, több támogatást és új funkciókat, illetve további kedvezményeket (diákoknak, startupoknak) hirdetett meg.

Várható megjelenés: Már megjelent!

Earth-2

Az NVIDIA Earth-2 egy nyílt, komplett, technológiai programcsomag, amelyet felhőszolgáltatásként kínálnak. Segítségével felgyorsíthatók a nagy felbontású éghajlati és időjárási szimulációk, éghajlat- és időjárás-előrejelzések, kiegészíthetjük ezeket mesterséges intelligencia modellekkel, és a több adatforrásból származó adatokat interaktívan jeleníthetjük meg. Tartalmazza a numerikus időjárási modelleket (például az ICON és az IFS fizikai CUDA gyorsított szimulációját), gépi tanulási időjárás-előrejelzési modelleket (például a FourCastNet, a GraphCast és a Deep Learning Weather Prediction (DLWP) keresztül), valamint képes az adatok összevonására és megjelenítésére az NVIDIA Omniverse segítségével. Az NVIDIA DGX GH200, HGX H100 és OVX szuperszámítógépeken futó Earth-2 utat kínál a globális légkör példátlan sebességű és léptékű szimulálásához és megjelenítéséhez.

Várható megjelenés: A felhasználók már igényelhetnek korai hozzáférést

NVIDIA Clara

Az NVIDIA CLARA egy egészségügyi keretrendszer mesterséges intelligencia-alapú képalkotáshoz, genomikához. Segítségével az orvosok teljesen új alapra helyezhetik kutatásaikat. Használatával nem csupán az életmentő gyógyszerek kerülhetnek hamarabb piacra, hanem a betegek ellátásának és a kórházak működésének hatékonysága is javítható.

Az NVIDIA Clara immár egy mikroszolgáltatás-csomagot is kínál, amely felgyorsíthatja az alkalmazások építését a számítógéppel támogatott gyógyszerkutatást, az orvostechnika és a digitális egészségügy területén:

BioNeMo

A BioNeMo révén a kutatók generatív mesterséges intelligenciával bővíthetik ki platformjukat a gyorsabb piacra jutás, és hatékonyabb kutatások érdekében.

Elérhetőek például olyan modellek, amelyek képesek elemezni a DNS-szekvenciákat és „megjósolni”, hogy a fehérjék hogyan fognak kölcsönhatásba lépni a gyógyszermolekulákkal, és hamarosan megjelenik egy olyan modell is, amely egyetlen sejt működését határozza meg az RNS-e alapján.

Parabricks 4.3

A Parabricks 4.3 új eszközök és munkafolyamatok bevezetésével bővíti a gyártó genomikaelemző szoftvercsomagját, amelyek teljesítménynövekedést és a legújabb mesterséges intelligencia technikákat biztosítanak több omikai adattípushoz.

Holoscan 1.0

Az NVIDIA Holoscan egy olyan mesterséges intelligencia számítástechnikai platform, amely a peremen vagy a felhőben futó adatfolyamok méretezhető, szoftveresen definiált és valós idejű feldolgozásához szükséges full-stack infrastruktúrát biztosítja.

Az NVIDIA Holoscan 1.0 segítségével a fejlesztők könnyebben készíthetnek gyártásra kész alkalmazásokat a multimodális, valós idejű mesterséges intelligencia szenzor adatok feldolgozásával.

A platform lehetővé teszi például az orvostechnikai eszközök iparágában tevékenykedő vállalatok számára, hogy új mesterséges intelligencia által vezérelt lehetőségeket fedezzenek fel, felgyorsítsák a piacra kerülést, és csökkentsék az orvosi minőségű eszközök fejlesztési és karbantartási költségeit.

Összegzés

Az NVIDIA GTC 2024 kivételes lehetőséget kínált az iparág szereplőinek, hogy megoszthassák legújabb fejlesztéseiket és trendjeiket. Az eseményen bemutatott technológiai áttörések, új távlatokat nyitnak az iparágakban és mindennapi életünkben egyaránt. A konferencia összességében meggyőzően bizonyította, hogy az NVIDIA továbbra is az innováció éllovasa és iránytűje a technológiai fejlődésnek.