کارت گرافیک NVIDIA H100 NVL جدیدترین محصول انویدیا برای استنتاج هوش مصنوعی در مقیاس بالا است. این GPU قدرتمند بر پایه معماری Hopper ساخته شده و با بهرهگیری از NVLink و حافظهی HBM3، عملکردی بیرقیب در اجرای مدلهای یادگیری ماشین و شبکههای عصبی بزرگ ارائه میدهد.
در این مقاله به بررسی ویژگیها، توان پردازشی و تفاوتهای H100 NVL با نسخههای دیگر مانند H100 SXM5 میپردازیم.
معرفی NVIDIA H100 NVL
کارت NVIDIA H100 NVL شاید در ظاهر شبیه محصولات قبلی به نظر برسد، اما یک تفاوت مهم دارد. طبق گفتهی انویدیا، این کارت از دید سیستمعامل بهصورت دو GPU مستقل شناخته میشود، اما به لطف NVLink کل ظرفیت حافظه ۱۸۸ گیگابایت بهصورت یکپارچه در اختیار سیستم قرار میگیرد.
ویژگیها و مشخصات فنی
کارت جدید NVIDIA H100 NVL با اتصال دو کارت NVIDIA H100 PCIe از طریق NVLink عرضه شده است. در این نسخه، هر GPU به ۹۴ گیگابایت حافظه HBM3 مجهز است که در مجموع ۱۸۸ گیگابایت حافظه در اختیار قرار میدهد.
به احتمال زیاد این به معنای فعالسازی پشته ششم ۱۶ گیگابایتی است، اما تنها ۱۴ گیگابایت آن در دسترس قرار دارد و ظرفیت هر GPU به ۹۴ گیگابایت (از مجموع ۹۶ گیگابایت) محدود میشود.
توان مصرفی و TDP
یکی از نکات برجسته در H100 NVL توان حرارتی طراحیشده (TDP) آن است. کارتهای PCIe سری H100 NVL دارای TDP بین ۳۵۰ تا ۴۰۰ وات هستند.
این در حالی است که معمولاً حداکثر توان در کارتهای PCIe دیگر تولیدکنندگان ۳۰۰ وات است، زیرا بسیاری از سرورها توان پشتیبانی از ۴۰۰ وات در قالب PCIe را ندارند.
این موضوع یکی از دلایل اصلی گرایش به سمت فرمفاکتورهای قدرتمندتر مانند OAM / SXM محسوب میشود.
مقایسه با H100 SXM5
بر اساس مشخصات، اگر توان مصرفی کارت NVIDIA H100 NVL را ۴۰۰ وات در نظر بگیریم، نسخههای PCIe آن از بسیاری جهات برتر از نسخههای H100 SXM5 هستند.
البته SXM5 دارای رابطهای NVLink با پهنایباند بالاتر ۹۰۰ گیگابایت بر ثانیه است که در NVL وجود ندارد.
از نظر توان پردازشی، NVL تقریباً ۲ برابر H100 SXM قدرت دارد. همچنین NVL از حافظه بیشتر و پهنایباند بالاتر حافظه برخوردار است و با مصرف توانی مشابه، کارایی بهتری ارائه میدهد.
سخن آخر
کارت NVIDIA H100 NVL با ترکیب توان پردازشی دو GPU و حافظهی یکپارچهی ۱۸۸ گیگابایتی HBM3، یکی از قدرتمندترین گزینهها برای اجرای مدلهای هوش مصنوعی و پردازشهای سنگین است.
اگرچه مصرف توان بالای ۴۰۰ وات و قیمت این کارت چالشبرانگیز است، اما کارایی آن در مقایسه با نسلهای قبلی مانند DGX A100 میتواند تا ۱۰ برابر بهرهوری بیشتر ارائه دهد.