Car-tech

Oracleエンジニアがヒート・マップによるレイテンシの謎を明らかにする

株式会社博展 - 東芝実績動画

株式会社博展 - 東芝実績動画
Anonim

データセンターの管理者は、ヒートマップを長年使用してラックのサーバと冷却装置の最適位置を特定するのに役立ちましたが、システムの待ち時間をよりよく理解するためには、この視覚化モードも便利です。

「レイテンシをヒートマップとして提示することは、見逃される可能性のある微妙な特性を識別するのに効果的な方法です」とOracleのプリンシパルソフトウェアエンジニアであるブレンダングレッグは、「システムレイテンシの可視化」の記事で述べています。

Greggはまた、このような視覚化は何が起こっているのかをより深く理解することができますが、必ずしも観察されている挙動に答えるものではないと警告しました。それでも、ヒートマップは、次世代のデータセンターレイテンシー問題に対処するための洞察を提供します。

[さらに読む:メディアストリーミングとバックアップのためのベストNASボックス]

システムの低速の原因を特定することは、データセンター管理者とシステム管理者。 Sun Microsystemsは長年、Solarisオペレーティングシステム用に1つのツールを提供してきましたが、このツールを使用してネットワークパフォーマンスを視覚化することはできませんでした。 DTraceと呼ばれ、システムのさまざまな部分の遅延を2秒ごとに評価することができます。しかし、それが生み出すことができる圧倒的なデータは、まだ分かりやすい形になっている必要があります。

Greggのヒートマップに入ります。ヒートマップは、2次元グラフ上で異なる値が異なる色で表される単純な視覚化手法です。

ヒートグラフは、ほとんどのネットワーク解析ツールで折れ線グラフより多くを表示できます。レイテンシは、時間の経過と共に検査されるべきであるが、そのレイテンシの実際の構成または分布は、提供されれば、最大値を超えて識別することはできない」と彼は書いている。

この記事では、Gregg氏は、Oracle Analyticsビジュアライゼーション・ソフトウェアを使用して、DTraceによって収集されたデータを視覚的にレンダリングする、さまざまな異常な作業負荷状況をプロットしました。彼は、時間を表すためにX軸を設定し、待ち時間を表すY軸を設定しました。ほとんどの場合、最も暗い色が最も入出力を表していました。多くの場合、単純な作業負荷では複雑な、時には説明できないさまざまなパターンが生成されることがわかりました。あるケースでは、少量のデータディスクのプールに書き込まれます。 Greggはランダムなレイテンシを示す「ホワイトノイズ」しか出現しないと予想していました。代わりに、ヒートマップは、何らかの未知の理由により、異なるパターンでレイテンシのレベルが上昇したり下がったりすることを示しました。 「このようにレイテンシを視覚化すると、答えが出るよりも疑問がはっきりと分かる」と彼は言いました。

もう一つのパターンも同様に不思議でした。このテストでは、44個のディスクにデータストリームを送信する必要がありました。まず、44台のディスクすべてがデータを受信するまで、データは1つのディスクに、次に2つのディスクに送信されます。

Greggは、システムバスがデータで飽和状態になるとディスク待ち時間が直線的に増加すると予想していました。

このパターンは、ヒートグラフがカラフルな飛行恐竜の輪郭に似ているという点で、このパターンをレインボープテロダクチルと呼んだ。

レインボープテロダクチル:正確性はほとんど知られておらず、より多くの調査が必要とされているが、これは単純な視覚化がどの程度深くできるかを示している」とグレッグ氏はヒートマップを使用して、グレッグが数年前にYouTubeで実演した現象をサーバー上に持っています。

これらのヒートマップは、ネットワークファイルストレージ(NFS)プロトコル上で実行されているZFS(Zettabyte File System)上で実行されるシステムで実行されましたが、このアプローチは、他のファイルシステムやCPU、グレイグ氏は書いています。

ジョエル・ジャクソンは、

IDG News Service

のエンタープライズソフトウェアと一般的な技術ニュースを扱っています。 @Joab_JacksonでTwitterのJoabに従ってください。 Joabの電子メールアドレスは[email protected]です。