Germany – Computer equipment and supplies – Lieferung, Installation und Inbetriebnahme einer GPU-Erweiterung
🇩🇪Helmut-Schmidt-Universität/Universität der Bundeswehr Hamburg (HSU)·Germany
Full Description
Auftragsgegenstand ist die Lieferung, Installation und Inbetriebnahme einer GPU-Erweiterung für das CBRZ. Darüber hinaus muss der Auftragnehmer Instandhaltungs-, Service- und Supportleistungen für die GPU-Erweiterung erbringen. Die GPU-Erweiterung muss folgende Hardware-Komponenten umfassen: - Ein oder mehrere GPU-Knoten für HSUper mit jeweils folgenden Eigenschaften pro Knoten: - Identische Ausstattung mit CPUs wie die vorhandenen Rechenknoten im CBRZ (für ein möglichst homogenes Gesamtsystem): zwei Intel Xeon Scalable Platinum 8360Y Prozessoren. D.h. jedes Mainboard muss über mindestens zwei entsprechende Prozessorsockel verfügen und einen Chipsatz haben, der 3rd Gen. Intel Xeon Scalable unterstützt, wie bspw. Intel C621A oder gleichwertig. - Mindestens 1024 GB RAM, mit ECC, mindestens DDR4 3200 MHz oder schneller - Redundante Netzteile bzw. Stromversorgung - Inkl. Einbaumaterial / Rail Kit für 19-Zoll-Serverrack - Storage für OS: Mindestens 960 GB oder mehr, als NVMe SSD, 2 Stück für RAID-1 - Storage als Node-lokalen Scratch-Speicher (bspw. für ML/AI Trainings- datensätze): Mindestens 1,92 TB oder mehr, als NVMe SSD, 2 Stück für RAID-1 - Für die Anbindung an das Hochgeschwindigkeitsnetzwerk ein Single- Port InfiniBand HCA Adapter (QSFP28 / QSFP56) mit mindestens HDR100, möglichst HDR200, und entsprechendes optisches Kabel, 15m - Gigabit-Ethernet LAN bzw. RJ45-Anschluss inkl. Kupferkabel - 1x IPMI 2.0 Baseboard Management Controller, mit dediziertem LAN- Port (RJ45) inkl. Kupferkabel - Eine maximale Anzahl CUDA-kompatibler baugleicher GPUs, Summe aller GPUs pro Knoten mindestens: o 160 GB RAM o 100 TFLOPS FP32 Peak Rechenleistung o 4 TB/s Speicherbandbreite - Diese GPUs können, falls möglich, an die vorhandene Warmwasserkühlung angeschlossen werden - Für die ISCC ein GPU-Knoten, identische Konfiguration wie der oben angegebene GPU-Knoten für HSUper, mit folgenden Abweichungen: o Ohne GPUs, denn dieser Knoten dient der Aufnahme vorhandener NVIDIA A30 GPUs. o Geeignet für die Integration von 8 double-width PCIe GPUs; insbesondere kompatibel mit 8x NVIDIA A30 (luftgekühlt) o Mindestens 2048 GB RAM (für mehr virtuelle Maschinen bzw. mehr RAM pro VM) o Netzwerkadapter für 100 GbE statt IB HDR100 / HDR200, inkl. Break- out-Kupferkabel; 100 Gb/s QSFP28 zu 2 x 50 Gb/s QSFP28 für Anschluss an Ethernet-Switch - Für die ISCC weitere CUDA-kompatible GPUs, zum Einbau in vorhandenen GPU-Host: o Max. 8 baugleiche GPUs; PCIe, jeweils max 2-slot / double-width FHFL (full height, full length), luftgekühlt o Summe der Leistungswerte aller max 8 GPUs: Minimalwerte wie oben pro GPU-Knoten für HSUper o Müssen (anders als oben) 3D-Grafikbeschleunigung für Rendering-Auf- gaben unterstützen (bspw: DLSS, RT Cores und NVENC Encoder oder gleichwertig) 2. Die GPU-Erweiterung muss folgende Softwarekomponenten umfassen: - Für alle neuen HSUper GPU-Knoten: Vorinstalliertes Betriebssystem: Rocky Linux 8.x (genaue Version entsprechend Konfiguration des Gesamtsystems zum Lieferzeitpunkt, aktuell 8.6), inkl. Konfiguration der SSDs als SW-RAID-1. - Die HSUper GPU-Knoten müssen von remote administrierbar und überwachbar sein und in das Management- sowie Hochgeschwindigkeitsnetzwerk eingebunden sein - Für den oben angegebenen ISCC-GPU-Knoten eine VMware vSphere Standard Lizenz als 3-Year Prepaid Commit - Für Speed Select Konfiguration mit 32 Cores / CPU, d.h. für 64 Cores - Für bis zu 10 VMs mit Grafik-Beschleunigung: 10x NVIDIA vWS CCU Perpetual Lizenz inkl. je 5 JahreNVIDIA Support, Upgrade und Maintenance - Integration der neuen Knoten in das Gesamtsystem, Anbindung an parallele Dateisysteme und Slurm bzw. Einbindung als ISCC-Host in VMware vSphere, Einbindung der neuen Knoten in die vorhandene Management- und Monitoringsoftware, betriebsbereite Übergabe - Für HSUper bzw. zur Verbesserung der Nutzbarkeit der neu zu beschaffenden GPU-Knoten: o Installation und Konfiguration der Open-Source-Software "Open OnDemand" o Installation und Konfiguration auf einer Login-Node o Inkl. Anbindung ans Rechenzentrum-LDAP für User-Authentifikation o Inkl. einer Jupyter-Applikation für interaktive Python-Notebooks o Inkl. folgenden Applikationen (Lizenzen für die jeweilige kommerzielle Software sind vorhanden): Ansys, Comsol, Matlab, Paraview, RStudio o Inkl. Persistierung der Installation in das xcat-Image der Login-Node IV. Weitere Leistungen Der Auftragnehmer muss die GPU-Erweiterung vor Ort auf dem Gelände der HSU aufbauen und anschließen. Weitere nicht explizit aufgeführte Komponenten, die zusätzlich benötigt werden, um die GPU-Erweiterung ins vorhandene CBRZ integrieren zu können oder die für den Betrieb zusätzlich benötigt werden, müssen ggf. ebenfalls angeboten werden. Die GPU-Erweiterung muss über eine Hardwaregarantie für mindestens 3 Jahre verfügen. Dies umfasst die Hardwarewartung, -gewährleistung und Instandhaltung über 36 Monate Betriebszeit.. Service und Support (inkl. Remote-Support, schneller Austausch einfach zu wechselnder defekter Komponenten wie bspw. SSDs, Netzteile, Speicherriegel entweder durch vor-Ort Ersatzteilstock mit unmittelbarem Zugriff durch HSU-Systemadministrator-Personal - ausreichende Lagerkapazitäten sind vorhanden - oder durch Ersatzteil-Service des Auftragnehmers mit vor Ort Lieferung ab Meldung innerhalb max. 24h an Arbeitstagen (Montag bis Freitag, mit Ausnahme von Feiertagen)) muss beinhaltet sein. Support und Updates für die Software muss für 3 Jahre im Angebot enthalten sein. Angebote, die nicht alle Mindestanforderungen des Leistungsverzeichnisses erfüllen, schließt die HSU/UniBw H vom Vergabeverfahren aus. Einzelheiten der Leistung und die technischen Anforderungen ergeben sich aus dem Leistungsverzeichnis (Anlage 1 des Vertrages).