シリーズ・コラム(第三回)LIQID CDIユースケース #2:タイムシェアでGPU数を半減

シリーズ・コラム第三回。
これまでの二回では、以下の主題のもとLIQID CDIの製品コンセプトと実際のユースケースを紹介した。
「サーバー間でGPUをネットワーク共有できる」
「1台のサーバーに20台のGPUを接続する」
今回は「タイムシェアでGPU数を半減」できたユースケースの紹介である。GPU数を半減できたことに加えて、GPU使用率が倍増したので投資としては4倍効率化したことになる。
LIQID社の分析によると、データセンターに設置されているコンピュータ機器の使用率は思ったよりも低く、この改善のためにLIQID CDIを活用できるというマーケティング仮説がある。誰が何をどれくらい使用しているかは個別の話なのでこれ以上一般化を試みることは避けるが、導入したサーバーやGPUの使用率が思ったほど高くなく、折角の投資をもっと有効に活用したい、そのような課題をお持ちの方には一見に値するソリューションではないだろうか。
参考にしていただくユースケースはあるM&E企業(メディア&エンターテインメント企業、映像・放送業界)におけるTCO削減事例である。
ある部門がオンプレミスのサーバーシステムを保有していた。近接する部門も同じようなオンプレミスのサーバーシステムを保有しており、この二つの部門はサーバーのモデルや仕様こそ異なるが同じGPUを使用していた。全社レベルでの投資判断はなかったのだろうか?と思わなくはないが、ここまでならよくある話として終わりそうだ。しかし、この事例には続きがある。このGPU、実はそれぞれの部門が使用する時間帯が重ならないのである。そうであるならば、同じGPUを二重に持つことを避けてそれぞれの部門サーバーで共用することが考えられないか?と検討が進み、最終的には下図に示すように、サーバーはそれぞれの部門で継続保有するがGPUは共有してタイムシェアすることになった。
もちろん、一つの部門の業務終業時間になったらGPUを別の部門のサーバーに物理的に移設して、などということは行わない。LIQID CDIシステムを導入し、GPUを集約(プール化)した拡張シャーシと両部門のサーバーをネットワーク接続することで共有化し、ジョブ管理ソフトによって自動的かつ瞬時にGPUの接続先が切り替わるようになっているのである(このGPUのネットワーク共有のコンセプトについては第一回のコラムを是非参照いただきたい)。
ここでは他の細かな周辺情報は省くが、もちろん、両部門での運用の調整は必要であっただろうし、LIQID CDI製品の提供価値がここまでフィットするユースケースは珍しいかもしれない。ただ、伝えたかったことは、LIQID CDIの登場により、このようにコンピュータ機器の使用率を改善し、ひいては投資効率を改善する方法を考案することが可能になっているということである。
その観点で、もう一つユースケースを紹介したい。多くのユーザーに採用されてきているブレードサーバーだが、残念ながらこのフォームファクターの制約のため直接GPUを搭載できないモデルが多い。しかし、ある医療機関では、下図のようにLIQID CDIを導入することでブレードがGPUを使用できるようになり、また総数20台のGPUをブレード間で共有することが可能になった。このシステムの実現のためには、各ブレードにHBA(ホストバスアダプターカード)を導入し、PCIeファブリック・ネットワーク経由でLIQID CDIシステムに接続するだけである。ブレード側に導入するHBAにはデバイスドライバーも不要である。これにより、既存のブレードサーバーを有効活用することができるようになり、新規サーバー調達コストを始め大幅にTCOを節減できることとなった。
今回のコラムでは、GPUを部門間でタイムシェアしているユースケース、GPU搭載不可のブレードサーバーにGPUを外部接続して使用しているユースケースの二つを紹介した。いずれもLIQID CDIが可能にしたシステム・トポロジーである。
次回(第四回)のコラムでは、典型的なGPUオンデマンドのユースケースを紹介し、またLIQID CDIのマルチベンダーGPUサポートについても触れておきたい。
(MF)