Oracle Cloud Infrastructure (OCI) GPU Scanner is een speciale oplossing die waarneembaarheid, statuscontroles en prestatiemonitoring biedt voor GPU-workloads.
Mis het niet: onze exclusieve live demo op 30 oktober, waar we de implementatie van Llama op OCI laten zien. Bekijk de nieuwste generatieve AI-technologieën in actie, verken gebruiksscenario's uit de praktijk en leer hoe u stap voor stap slimmere, meer geautomatiseerde workflows kunt bouwen.
De toparchitecten van OCI onthullen hoe clusternetwerken schaalbare GenAI mogelijk maken, van enkele GPU's tot een Zettascale OCI-supercluster met 131.072 NVIDIA Blackwell GPU's.
De Oracle AI-infrastructuur is overal schaalbaar, krachtig en implementeerbaar. Ontdek hoe we ons onderscheiden met toonaangevende schaalbaarheid, bare metal GPU-instances en meer.
Ontdek wat analisten vinden van de OCI AI-infrastructuur met AMD GPU's en hoe deze combinatie de productiviteit kan verbeteren, de terugverdientijd kan verkorten en de energiekosten kan verlagen.
OCI GPU Scanner is een gecentraliseerde, beheerde oplossing voor GPU-prestatiemonitoring waarmee handmatig onderzoek en scripting worden geëlimineerd, waardoor het benchmarkingproces wordt vereenvoudigd.
OCI GPU Scanner minimaliseert downtime en vals-positieve waarden via uitgebreide statuscontroles, basisvergelijkingen en geautomatiseerde diagnostiek.
OCI GPU Scanner biedt aanpasbare, tenantbrede zichtbaarheid en teamspecifieke inzichten waarmee het delen van resources en kostenbeheer voor GPU-clusters op ondernemingsniveau kan worden geoptimaliseerd.
Een beheerde, gecentraliseerde oplossing die het handmatig uitvoeren van scripts en compatibiliteitsonderzoek tussen alle regio's in een tenancy elimineert. Maakt sharding-zichtbaarheid mogelijk voor teams die grote clusters delen.
Gedetailleerde statuscontroles voor dag nul (basislijn), dag één (actieve monitoring) en dag twee en verder (doorlopende diagnose), inclusief diagnose op node, multinode en geavanceerde diagnose met historische vergelijkingen om problemen aan te wijzen.
Ondersteunt NVIDIA en AMD GPU's, met plannen om ondersteuning uit te breiden naar toekomstige chipmakers en next-gen architecturen.
Hiermee worden GPU-resources in alle regio's gecontroleerd zonder dat installaties per regio nodig zijn, met ondersteuning voor Oracle Cloud Infrastructure Kubernetes Engine clusters, high-performance computing clusters, bare metal-systemen en virtuele machines.
Compatibel met populaire open source-tools, zoals Grafana en Prometheus, voor aanpasbare dashboards en naadloze gegevensopslag/-export voor gebruiksscenario's van klanten.
Biedt aanbevolen herstelacties (bijvoorbeeld opnieuw opstarten voor GPU-off-busfouten) en automatiseert statuscontroles via API of portal, waardoor de uitvaltijd van klanten en vals-positieve waarden worden verminderd.
Krijg hulp bij het bouwen van uw volgende AI-oplossing of het implementeren van een workload op een OCI GPU Scanner.
Stap in een nieuw tijdperk van productiviteit met generatieve AI-oplossingen voor uw bedrijf. Ontdek hoe Oracle klanten helpt gebruik te maken van AI in hun volledige technologiestack.
Meer informatie over RDMA-clusternetwerken, GPU-instances, bare metal-servers en meer.
De prijsbepaling voor Oracle Cloud is eenvoudig, met wereldwijd consistente lage prijzen, met ondersteuning voor een breed scala aan gebruiksdoelen. Ga naar de kostencalculator voor een schatting van uw lage tarief en kies en configureer de services die u nodig hebt.
Live demodag: Oracle-, Meta- en NVIDIA-experts implementeren Llama op OCI
Eerste principes: Zettascale OCI-superclusters
AI-workloads versnellen met OCI (PDF)
Enterprise Strategy Group op AMD Instinct MI300X