Az idei évben ismét összegyűltek az iparág vezetői, kutatói és fejlesztői az NVIDIA GPU Technology Conference (GTC) keretein belül, hogy megoszthassák legújabb eredményeiket és betekintést nyújthassanak a jövő technológiai trendjeibe. Az NVIDIA GTC nem csupán egy konferencia, hanem egy olyan fórum, ahol az innováció és a fejlődés középpontjában álló világ minden szegmensének képviselői összeérnek, így meglehetősen nagy érdeklődés övezte idén is.
Az idei GTC-n az NVIDIA olyan fejlesztéseket és technológiai áttöréseket mutatott be, amelyek forradalmasíthatják az iparágak működését és a mindennapi életünket.
Cikkünkben áttekintjük az esemény során bemutatott talán legfontosabb bejelentéseket:
Itt az NVIDIA Blackwell
Kétségkívül a konferencia legkimagaslóbb pontja az volt, hogy – a számítástechnika új korszakát elindítva – az NVIDIA bejelentette új platformját, az NVIDIA Blackwell-t, amely lehetővé teszi a vállalatok számára, hogy valós időben, nagy hatékonysággal működő generatív mesterséges intelligenciát építsenek és futtassák azokat billió paraméteres nagy nyelvi modelleken, elődjénél akár 30-szor nagyobb teljesítmény, 4-szer gyorsabb AI-betanítás, 25-ször alacsonyabb energiafogyasztás és 25-ször alacsonyabb teljes tulajdonlási költség (TCO) mellett.
További fontos információk:
- A Blackwell GPU-k három rendszerkonfigurációban állnak rendelkezésre: GB200 NVL72 és HGX B200 és HGX B100
- 208 milliárd tranzisztorra épül ez a brutális teljesítményű AI Chip
- FP4/FP6 Tensor Core - a dupla akkora teljesítmény érdekében
- az 5. generációs NVLink segítségével akár 576 GPU-t kapcsolhatunk össze, egyetlen gigantikus méretű számítási egységgé
- RAS-motor: 100%-os rendszeren belüli önteszt a GPU megbízhatósága érdekében
- Nagyteljesítményű titkosítás és TEE, a kompromisszumok nélküli adatbiztonságért
- Dekompressziós motor: gigászi, 800 GB/másodperces teljesítmény a tömörített adatokon való számítás során, CPU dekompressziós idő nélkül
A Blackwell GPU architektúra szédületes képességei révén elősegítheti az áttöréseket az adatfeldolgozás, a mérnöki szimuláció, a tervezés automatizálás, a számítógéppel segített gyógyszertervezés, a kvantumszámítás és a generatív mesterséges intelligencia területén is.
Várható megjelenés: 2024 év folyamán
Komplett NVIDIA minősített megoldások
A Blackwell GPU-kra építve a gyártó természetesen frissítette, mondhatni szuperszámítógép termékportfólióját is, melyek egy teljesen új szintet hoznak el a hétköznapi halandók számára is elérhető számítási teljesítmény terén.
GB200 NVL72
A GB200 NVL72 egy több csomópontból álló, folyadékhűtéses, rack-méretű rendszer, a hatalmas számításigényű feladatokhoz. 36db GB200 Grace Blackwell Superchip rejlik benne, egyenként két Blackwell GPU-val, amelyek egy Grace CPU-hoz csatlakoznak, ami így összesen 72 Blackwell GPU-t jelent egyetlen NVLink tartományban. A platform tehát „egyetlen GPU-ként működik”. 1,4 exaflop AI teljesítményével és akár 30 TB villámgyors memóriával az újonnan bejelentett DGX SuperPOD alapköve.
Várható megjelenés: 2024 év folyamán
HGX B200 & HGX B100
A HGX B200 és HGX B100 x86 alapon működő skálázható platformok, amelyeket a legteljesítményigényesebb generatív mesterséges intelligencia, adatelemzési és nagy teljesítményű számítástechnikai (HPC) munkaterhelésekhez terveztek. Viszonyításképp: a HGX B200 15-ször nagyobb AI teljesítmény nyújt a 2 éve megjelent – amúgy nem csekély teljesítményű – HGX H100-hoz képest, 12-szer kedvezőbb teljes tulajdonlási költség (TCO) mellett.
Várható megjelenés: 2024 év folyamán
NVIDIA DGX B200
Az NVIDIA legendás DGX rendszereinek legújabb iterációját, az NVIDIA DGX B200-at is a forradalmi NVIDIA Blackwell GPU-k hajtják. A DGX B200 olyan vállalkozások számára optimális választás, akik egy egységes mesterségesintelligencia-platformot keresnek – nem akarnak a hosszas beüzemeléssel és akár hetekben, hónapokban mérhető finomhangolásokkal bajlódni – hisz ez idő alatt már a konkrét feladataikra is koncentrálhatnak. Az NVIDIA DGX B200 8db GPU-val, összesen 1440 GB-nyi GPU memóriával van szerelve. Egy előző generációs DGX H100-hoz képest akár 15-ször nagyobb AI teljesítményt érhetünk el segítségével. A DGX B200 rendszerek a következő generációs NVIDIA DGX POD és NVIDIA DGX SuperPOD alapkövei. Jó tudni, hogy a termék ára az Enterprise Business Standard támogatást is tartalmazza.
Várható megjelenés: A DGX B200 2024 végén kerül kiszállításra
NVIDIA Quantum-X800 InfiniBand & Spectrum-X800
A Quantum-X800 és a Spectrum-X800 az NVIDIA hálózati platformjai a Blackwell számítási architektúrán alapuló, következő generációs mesterséges intelligencia rendszerek számára.
Az NVIDIA Quantum-X800 InfiniBandet a legnagyobb teljesítményű, mesterséges intelligencia által dedikált infrastruktúrákhoz ajánlják, ahol kulcsfontosságú az alacsony késleltetés, a nagy effektív sávszélesség.
Az NVIDIA Spectrum-X800 hálózati megoldást pedig a mesterséges intelligencia által optimalizált hálózatokhoz ajánlják, minden olyan adatközponthoz és más környezethez, mint például a multi-tenant mesterséges intelligencia-felhők vagy épp a nagyvállalati hiperskálázható rendszerek.
Várható megjelenés: Várhatólag 2024 végén
NVIDIA AI Enterprise 5.0
Az NVIDIA AI Enterprise egy sokak által már használt teljeskörű, felhőalapú szoftverplatform, amely minden vállalkozás számára elérhető közelségbe hozta a generatív AI-t, a legmagasabb teljesítmény és leghatékonyabb működés mellett. A most bejelentett NVIDIA 5.0-s verziója könnyen használható mikroszolgáltatásokat tartalmaz vállalati szintű biztonsággal, támogatással és stabilitással.
- Az NVIDIA NIM - mely kizárólag az NVIDIA AI Enterprise-ban elérhető - könnyen használható mikroszolgáltatások készlete, amelyek célja a generatív mesterségesintelligencia-modellek felhőben, adatközpontokban és munkaállomásokon történő telepítésének felgyorsítása. A mesterséges intelligencia modellek széles skáláját támogatja, beleértve az NVIDIA AI Foundationt és az egyedi modelleket is. Zökkenőmentes, méretezhető AI platformot biztosít a helyszínen vagy a felhőben, kihasználva az ipari szabvány API-kat.
- NVIDIA cuOpt, egy olyan mikroszolgáltatás, amely felgyorsítja a logisztikai feladatokat és az ellátási lánc optimalizálását, hogy időt takaríthassunk meg és csökkenthessük az infrastruktúra költségeit.
- Az NVIDIA API katalógus gyors hozzáférést biztosít a vállalati fejlesztők számára a NIM által hajtott NVIDIA-optimalizált alapmodellekkel való kísérletezéséhez és teszteléséhez, mindezt kezdeti költség nélkül. Amikor készen állnak a megoldásuk piacra vezetésére, a fejlesztők exportálhatják a vállalati használatra kész API-t érvényes NVIDIA AI Enterprise licenccel, és bárhol futtathatják egy saját üzemeltetésű rendszeren.
- Az NVIDIA AI Workbench egyszerű GPU-munkaállomás-beállítást tesz lehetővé, és a fejlesztők segítéségével heterogén platformokon dolgozhatnak és működhetnek együtt könnyebben – tudásszinttől függetlenül.
- Az Infra 5.0 az infrastruktúra szoftver legújabb fejlesztéseit és az új hardver támogatását tartalmazza. Immár támogatottak a Red Hat OpenStack Platform, a Canonical Charmed Kubernetes, a heterogén vGPU profilok, az NVIDIA GH 200 96GB, GH200 144GB, HGX H100, HGX H200, és az RTX 5880 Ada is.
Várható megjelenés: Már megjelent!
GTC előadások:
- Overcome the Complexities of Generative AI with a Secure, Scalable AI Foundry [S62953]
- What’s Next in Generative AI [S62430]
- An AI Revolution in Insurance Claim Process [S62284]
- Unlock AI’s Potential: Best Practices for Business-Led Digital Roadmaps and Implementation Challenges [S62432]
- Building an End-to-End Solution for Enterprise-Ready Generative [S62620]
- Unlock the Power of Generative AI in a Multi-Cloud Environment [S62013]
- A Guide to Building Safe Generative AI Copilots that Improve Productivity and Protect Company Data [S62954]
NVIDIA NeMo Retriever for Retrieval-Augmented Generation
Az NVIDIA AI Enterprise olyan eszközöket is biztosít, amelyek lehetővé teszik a vállalkozások számára, hogy a kísérleti szakasztól a termelésig könnyedén juttassák el visszajelzésekkel kiegészített mesterséges intelligencia (RAG) alkalmazásaikat. Az NVIDIA NeMo Retriever olyan generatív mesterséges intelligencia mikroszolgáltatások gyűjteménye, amely révén a cégek zökkenőmentesen összekapcsolhatják az egyéni modelljeiket a különféle üzleti adatokkal, így rendkívül pontos válaszokat kaphatnak. A NeMo Retriever a generatív mesterséges intelligencia alkalmazásokat vállalati szintű RAG képességekkel bővíti, amelyek bárhol csatlakozhatnak az üzleti adatokhoz.
Várható megjelenés: A felhasználók már igényelhetnek korai hozzáférést
NeMo Retriever Tech Blog, 4 Steps for Taking your RAG Application from Pilot to Production Tech Blog, Generative AI Microservices Press Release, RAG Networking Tech Blog, Intro to Multimodal RAG TechBlog
GTC előadások:
- Connect With the Experts: Building Generative AI Applications With Retrieval Augmented Generation [CWE62682]
- Streamlining Enterprise Data Operations with Multimodal RAG and LangChain [DLIT61342]
- Beyond RAG Basics: Building Agents, Co-Pilots, Assistants, and More! [S62533]
- Build a RAG-Powered Application With a Human Voice Interface [SE62869]
- Accelerating Enterprise: Tools and Techniques for Next-Generation AI Deployment [S63432]
- RAG Targeted Agenda
NVIDIA NeMo Development Microservices
Az NVIDIA NeMo egy nyílt forráskódú keretrendszer a fejlesztők számára, a legkorszerűbb társalgási mesterséges intelligencia modellek, egyedi generatív AI-k fejlesztéséhez. Az egyedi generatív mesterséges intelligencia egyszerűbb elkészítése érdekében a gyártó korai hozzáférési programot hirdetett meg a NeMo Curator, NeMo Customizer és NeMo Evaluator mikroszolgáltatásokhoz – amelyek minden fejlesztési szakaszt lefednek, az adatok feldolgozásától és testreszabásától az értékelésig.
- A CUDA-X mikroszolgáltatások részét képező NeMo API-végpontok az NVIDIA-könyvtárakra épülnek, így biztosítva a vállalkozások számára a legegyszerűbb utat az egyedi generatív mesterségesintelligencia létrehozásához.
- A NeMo Curator egy méretezhető és GPU-gyorsítású adatkurátori mikroszolgáltatás, amely kiváló minőségű adatkészleteket készít elő betanításhoz és a generatív AI-modellek testre szabásához.
- A NeMo Customizer egy nagy teljesítményű, méretezhető mikroszolgáltatás, amely leegyszerűsíti az LLM-ek finomhangolását és összehangolását a tartomány-specifikus felhasználási esetekben.
- A NeMo Evaluator mikroszolgáltatás lehetővé teszi az egyéni generatív mesterséges intelligencia modellek automatikus értékelését különféle tudományos és egyéni benchmarkokon keresztül bármely felhőben vagy adatközpontban.
Várható megjelenés: A felhasználók már igényelhetnek korai hozzáférést
NVIDIA Maxine
Az NVIDIA Maxine már egy pár éve létező megoldás a valós idejű videókommunikációhoz: mesterséges intelligencia segítségével ténylegesen valós időben fordítja a videóhívásban résztvevő külföldi partner mondatait – nem csak szövegesen, hanem hanganyagban is. Ez a fejlesztés kapott most jelentős frissítést, melyben hatékonyabb lehet a háttérzaj eltávolítás, immár stúdió minőségű a hang, jobb a szemkövetés funkció és sok más újdonsághoz férhetünk hozzá.
Várható megjelenés: Egyes funkciók már elérhetőek
NVIDIA Riva
Az NVIDIA Riva-t már a vállalatok éve óta használhatják testre szabható, valós idejű társalgási AI-folyamatok létrehozásához. A Riva magában foglalja az automatikus beszédfelismerést (ASR), a szövegfelolvasást (TTS) és a neurális gépi fordítást (NMT). A Riva segítségével a cégek LLM-mel támogatott beszéd- és fordítófelületeket adhatnak hozzá a chatbothoz, így lebilincselő, valósághűbb, többnyelven beszélni képes asszisztenseket vagy épp avatárokat létrehozva.
A most bejelentett frissítésben a Riva számos frissítést kapott. Továbbfejlesztették az automatikus beszédfelismerést, mely mostantól tartalmazza a HuggingFace Open ASR ranglista élén álló leggyorsabb és legpontosabb modelleket – többek közt a Canary többnyelvű (angol, francia, német és spanyol) és többfeladatos ASR és kétirányú fordítási modellt és angol átírási modellt a Parakeet ASR családból.
A megújult TTS modul képes egy akár 3 másodperces hangmintából egy egyedi modellt létrehozni, amely ezután valósághűn tudja felolvasni mintázója hangjával a szövegeket. Női és férfi hangot is képes modellezni, 5 nyelven (angolul, németül, olaszul, mandarinul, spanyolul) tud beszélni, és hangját képes érzelmekkel fűszerezni (boldog, nyugodt, semleges, szomorú, ijedt, dühös) a kontextushoz igazodva.
Várható megjelenés: Már megjelent!
NVIDIA AI Enterprise Customer Deck, NVIDIA Riva Webpage, Audio Transcription Webpage, Intelligent Virtual Assistant Webpage
GTC előadások:
- Speaking in Every Language: A Quick Start Guide to TTS Models for Accented, Multilingual Communication [S62517]
- Adapting Conformer-Based ASR Models for Conversations Over the Phone [S62441]
- Secure AI-Driven Translation in Video Conferencing [S61718]
- Multi-Speaker ASR with NVIDIA NeMo Toolkit —Training & Inference [CWE62255]
- Mastering Speech for Multilingual Multimedia Transformation [S62549] & [S62549a]
- Talk to Your Data in Your Native Language [DLI61469]
- Behind the Scenes of Running a Conversational Character in a 3D Scene [S62570]
- Build Speech AI for Multilingual Multimedia Transformation [SE62869]
- Speech AI Demystified [S61523]
NVIDIA Metropolis
Az NVIDIA Metropolis alkalmazás segítségével kombinálni lehet a szokásos videokamerákat és érzékelőket mesterséges intelligencia-kompatibilis videóelemzéssel. Ez javítja a működési hatékonyságot és különböző felhasználási lehetőségeket teremt az iparágak széles körében: többek között a városi forgalomirányítást, a repülőtéri műveleteket és az automatizált gyári ellenőrzéseket is reformálhatja.
Az NVIDIA most bemutatta, hogyan használhatják a fejlesztők a szoftvert és a generatív mesterséges intelligenciát a digitális ikrek és a valós idejű szimulációk egyesítésére, megkönnyítve a robotok tesztelését és finomhangolását, valamint ipari környezetben való interakcióikat. A fejlesztői platformok, például az NVIDIA Omniverse, a Metropolis, az Isaac és a cuOpt kombinálásával a felhasználók létrehozhatnak egy „AI gym” környezetet a NIM-ek felhasználásával készült AI-k tanításához, segítve a robotokat és az embereket a kiszámíthatatlan forgatókönyvekhez való alkalmazkodásban és az összetett környezetben való navigálásban.
Az NVIDIA emellett bejelentette a Visual Insight Agent (VIA) munkafolyamat gyűjteményét is, amely olyan mesterséges intelligenciák létrehozására szolgál, amely képesek nagy mennyiségű élő vagy archivált videó és kép feldolgozására Vision-Language Models (VLM) segítségével.
Várható megjelenés: A felhasználók már igényelhetnek korai hozzáférést
Staying in Sync: NVIDIA Combines Digital Twins With Real-Time AI for Industrial Automation, Metropolis Corporate Page, Metropolis Developer Page, VIA Product Page, VIA Early Access Program Page
GTC előadások:
- Harnessing Generative AI and Large Language Model With Vision AI Agents [S62384]
- Augmenting Vision AI With Large Language Model Interfaces to Improve Productivity [S62394]
- A New Class of Cloud-Native Applications at the Far Edge With Generative AI [S62387]
- Harnessing Generative AI and Large Language Model With Vision AI Agents [S62384]
- Leveraging Microservices for Building Complex and Large-Scale Vision AI Apps [S62395]
NVIDIA Omniverse frissítések
Az NVIDIA Omniverse platfom megannyi előnyéről már hosszasan értekeztünk egy korábbi cikkünkben. Aki nem ismerné a gyártó ezen megoldását, érdemes azt tudnia, hogy az NVIDIA Omniverse lehetővé teszi, hogy egy megosztott virtuális térben összekapcsolhassuk a tartalomkészítő szoftvereket és a felhasználókat. Ez az együttműködési platform, egy sokszínű és interaktív virtuális fejlesztési felület, mely a mesterséges intelligencia-alapú szoftvereszközök széles választékát is tartalmazza. Az egyénektől a nagyvállalatokig mindenki, másokkal együttműködve, olyan egyedi virtuális világokat építhet, amelyek a fizikai világhoz hasonlóan néznek ki, érzékelnek és viselkednek.
A gyártó a most bejelentettek szerint sokkal kedvezőbb (GPU alapú) árazást, több támogatást és új funkciókat, illetve további kedvezményeket (diákoknak, startupoknak) hirdetett meg.
Várható megjelenés: Már megjelent!
Earth-2
Az NVIDIA Earth-2 egy nyílt, komplett, technológiai programcsomag, amelyet felhőszolgáltatásként kínálnak. Segítségével felgyorsíthatók a nagy felbontású éghajlati és időjárási szimulációk, éghajlat- és időjárás-előrejelzések, kiegészíthetjük ezeket mesterséges intelligencia modellekkel, és a több adatforrásból származó adatokat interaktívan jeleníthetjük meg. Tartalmazza a numerikus időjárási modelleket (például az ICON és az IFS fizikai CUDA gyorsított szimulációját), gépi tanulási időjárás-előrejelzési modelleket (például a FourCastNet, a GraphCast és a Deep Learning Weather Prediction (DLWP) keresztül), valamint képes az adatok összevonására és megjelenítésére az NVIDIA Omniverse segítségével. Az NVIDIA DGX GH200, HGX H100 és OVX szuperszámítógépeken futó Earth-2 utat kínál a globális légkör példátlan sebességű és léptékű szimulálásához és megjelenítéséhez.
Várható megjelenés: A felhasználók már igényelhetnek korai hozzáférést
NVIDIA Clara
Az NVIDIA CLARA egy egészségügyi keretrendszer mesterséges intelligencia-alapú képalkotáshoz, genomikához. Segítségével az orvosok teljesen új alapra helyezhetik kutatásaikat. Használatával nem csupán az életmentő gyógyszerek kerülhetnek hamarabb piacra, hanem a betegek ellátásának és a kórházak működésének hatékonysága is javítható.
Az NVIDIA Clara immár egy mikroszolgáltatás-csomagot is kínál, amely felgyorsíthatja az alkalmazások építését a számítógéppel támogatott gyógyszerkutatást, az orvostechnika és a digitális egészségügy területén:
BioNeMo
A BioNeMo révén a kutatók generatív mesterséges intelligenciával bővíthetik ki platformjukat a gyorsabb piacra jutás, és hatékonyabb kutatások érdekében.
Elérhetőek például olyan modellek, amelyek képesek elemezni a DNS-szekvenciákat és „megjósolni”, hogy a fehérjék hogyan fognak kölcsönhatásba lépni a gyógyszermolekulákkal, és hamarosan megjelenik egy olyan modell is, amely egyetlen sejt működését határozza meg az RNS-e alapján.
Parabricks 4.3
A Parabricks 4.3 új eszközök és munkafolyamatok bevezetésével bővíti a gyártó genomikaelemző szoftvercsomagját, amelyek teljesítménynövekedést és a legújabb mesterséges intelligencia technikákat biztosítanak több omikai adattípushoz.
Holoscan 1.0
Az NVIDIA Holoscan egy olyan mesterséges intelligencia számítástechnikai platform, amely a peremen vagy a felhőben futó adatfolyamok méretezhető, szoftveresen definiált és valós idejű feldolgozásához szükséges full-stack infrastruktúrát biztosítja.
Az NVIDIA Holoscan 1.0 segítségével a fejlesztők könnyebben készíthetnek gyártásra kész alkalmazásokat a multimodális, valós idejű mesterséges intelligencia szenzor adatok feldolgozásával.
A platform lehetővé teszi például az orvostechnikai eszközök iparágában tevékenykedő vállalatok számára, hogy új mesterséges intelligencia által vezérelt lehetőségeket fedezzenek fel, felgyorsítsák a piacra kerülést, és csökkentsék az orvosi minőségű eszközök fejlesztési és karbantartási költségeit.
Holoscan 1.0 Dev Blog, Johnson and Johnson Corporate Blog, NVIDIA Holoscan Webpage
GTC előadások:
- NVIDIA Holoscan, the AI Sensor Processing Platform, from Surgery to Satellites [S62323]
- Charting the Future of AI in MedTech [S62680]
- Realizing Augmented Reality’s Benefits in Surgery through Real-Time Edge AI [S61354]
- Accelerating Development of Surgical Robotics with AI through NVIDIA’s Ecosystem [S62318]
Összegzés
Az NVIDIA GTC 2024 kivételes lehetőséget kínált az iparág szereplőinek, hogy megoszthassák legújabb fejlesztéseiket és trendjeiket. Az eseményen bemutatott technológiai áttörések, új távlatokat nyitnak az iparágakban és mindennapi életünkben egyaránt. A konferencia összességében meggyőzően bizonyította, hogy az NVIDIA továbbra is az innováció éllovasa és iránytűje a technológiai fejlődésnek.