単一ホスト接続におけるディスク アレイ ストレージ システムのパフォーマンス

一般に、ディスクまたはディスク アレイは、単一ホスト接続シナリオで最高のパフォーマンスを発揮します。ほとんどのオペレーティング システムは排他的なファイル システムに基づいています。つまり、ファイル システムは 1 つのオペレーティング システムのみが所有できます。その結果、オペレーティング システムとアプリケーション ソフトウェアの両方が、ディスク ストレージ システムの特性に基づいてデータの読み取りおよび書き込みを最適化します。この最適化の目的は、物理シーク時間を短縮し、ディスクの機械的応答時間を短縮することです。各プログラム プロセスからのデータ要求はオペレーティング システムによって処理され、その結果、ディスクまたはディスク アレイに対する最適化された順序どおりのデータ読み取りおよび書き込み要求が行われます。これにより、このセットアップではストレージ システムのパフォーマンスが最高になります。

ディスク アレイの場合、オペレーティング システムと個々のディスク ドライブの間に RAID コントローラが追加されますが、現在の RAID コントローラは主にディスク フォールト トレランス動作を管理および検証します。データ要求のマージ、並べ替え、または最適化は実行されません。 RAID コントローラーは、データ要求が単一のホストから送信され、オペレーティング システムによってすでに最適化および並べ替えられているという前提に基づいて設計されています。コントローラーのキャッシュは、最適化のためにデータをキューに入れることなく、直接的な計算バッファリング機能のみを提供します。キャッシュがすぐにいっぱいになると、速度はすぐに実際のディスク操作の速度まで低下します。

RAID コントローラの主な機能は、複数のディスクから 1 つ以上の大規模なフォールト トレラント ディスクを作成し、各ディスクのキャッシュ機能を使用して全体的なデータの読み取りおよび書き込み速度を向上させることです。 RAID コントローラの読み取りキャッシュは、同じデータが短時間内に読み取られる場合のディスク アレイの読み取りパフォーマンスを大幅に向上させます。ディスク アレイ全体の実際の最大読み取りおよび書き込み速度は、ホスト チャネル帯域幅、コントローラ CPU の検証計算およびシステム制御機能 (RAID エンジン)、ディスク チャネル帯域幅、およびディスク パフォーマンス (実際のパフォーマンスの合計) のうちの最も低い値によって制限されます。すべてのディスク)。さらに、I/O リクエストのブロック サイズが RAID セグメント サイズと一致しないなど、オペレーティング システムのデータ リクエストの最適化基準と RAID フォーマットの間の不一致は、ディスク アレイのパフォーマンスに大きな影響を与える可能性があります。

マルチホストアクセスにおける従来のディスクアレイストレージシステムのパフォーマンスの変動

複数のホスト アクセスのシナリオでは、単一ホスト接続に比べてディスク アレイのパフォーマンスが低下します。小規模ディスク アレイ ストレージ システムでは、通常、ディスク アレイ コントローラの単一または冗長ペアと、限られた数の接続されたディスクがあり、パフォーマンスはさまざまなホストからの順序付けされていないデータ フローの影響を受けます。これにより、ディスクのシーク時間、データ セグメントのヘッダーと末尾の情報、読み取り、マージ、検証計算、および再書き込みプロセスにおけるデータの断片化が増加します。したがって、接続するホストの数が増えると、ストレージのパフォーマンスが低下します。

大規模ディスクアレイストレージシステムでは、小規模ディスクアレイとは性能の低下が異なります。これらの大規模システムは、バス構造またはクロスポイント スイッチング構造を使用して複数のストレージ サブシステム (ディスク アレイ) を接続し、バスまたはスイッチング内にさらに多くのホストを接続するための大容量キャッシュとホスト接続モジュール (チャネル ハブまたはスイッチと同様) を備えています。構造。パフォーマンスはトランザクション処理アプリケーションのキャッシュに大きく依存しますが、マルチメディア データ シナリオでは効果が限られています。これらの大規模システムでは、内部のディスクアレイサブシステムは比較的独立して動作しますが、単一の論理ユニットは単一のディスクサブシステム内にのみ構築されます。したがって、単一の論理ユニットのパフォーマンスは低いままです。

結論として、小規模のディスク アレイでは順序のないデータ フローが原因でパフォーマンスが低下しますが、複数の独立したディスク アレイ サブシステムを備えた大規模なディスク アレイでは、より多くのホストをサポートできますが、マルチメディア データ アプリケーションには依然として制限があります。一方、従来の RAID テクノロジーをベースにし、NFS および CIFS プロトコルを使用してイーサネット接続を通じて外部ユーザーとストレージを共有する NAS ストレージ システムは、複数のホスト アクセス環境でのパフォーマンスの低下が少なくなります。 NAS ストレージ システムは、複数の並列 TCP/IP 転送を使用してデータ送信を最適化し、単一の NAS ストレージ システムで約 60 MB/秒の最大共有速度を実現します。イーサネット接続を使用すると、シン サーバーのオペレーティング システムまたはデータ管理ソフトウェアによる管理および並べ替え後に、データをディスク システムに最適に書き込むことができます。したがって、ディスク システム自体のパフォーマンスが大幅に低下することはなく、NAS ストレージはデータ共有が必要なアプリケーションに適しています。


投稿日時: 2023 年 7 月 17 日