新しいKubernetes Dashboardsでクラスターに隠された謎を解き明かす

By 清水 孝郎 - MAY 10, 2021

SHARE:

本文の内容は、2021年5月6日にJesus Ángel Samitierが投稿したブログ(https://sysdig.com/blog/kubernetes-outofthebox-dashboards)を元に日本語に翻訳・再構成した内容となっております。

Kubernetesのダッシュボードを作成する際に直面する最大の課題は、クラスターの全体像を把握することです。Kubernetesは、コンテナオーケストレーションのデファクトスタンダードですが、学習曲線が非常に険しいのも事実です。

Sysdigチームは、自らKubernetesを使用し、毎日何百人ものお客様のクラスターをサポートしています。Kubernetes Dashboardsにおいて、そのような専門知識を皆様と共有できることを嬉しく思います。適切なダッシュボードがあれば、クラスターのトラブルシューティングや最適化のために専門家である必要はありません。

Kubernetes Dashboardsはトラブルシューティングの場面で便利なだけではありません。また、キャパシティプランニングを行う際にも非常に便利なリソースとなります。プラットフォームのリソースを過剰に割り当てたために余分なコストが発生していないかどうかを確認するのに役立ちます。また、プラットフォームが新しいワークロードをサポートできるかどうかを確認することができます。

この記事では、Sysdig Monitorの新しいKubernetes Dashboardsを紹介します。そして、Kubernetesクラスターの状態をよりよく理解するのに役立てていただければと幸いです。新しいKubernetes Dashboardsは、膨大なダッシュボードのコレクションを提供するだけでなく、それらをガイドすることで、さまざまな状況のトラブルシューティングを容易にします。

screenshot of the 'underutilization of allocated resources' dashboard that shows the percentage of resources used vs requested使用されたリソースと要求されたリソースの割合を示す「割り当てリソースの活用不足」ダッシュボードのスクリーンショット
「Underutilization of Allocated Resources」ダッシュボードでは、使用されていないCPUやメモリがあるかどうかを確認できます。

より直感的な方法でクラスターを監視する

Sysdig MonitorのKubernetesダッシュボードは、単にパネルに表示されたメトリクスの束ではなく、ユースケースオリエンテッドで構成されています。このようにして、Kubernetesクラスターの中で、よく構造化された、独創的なガイドが構築されています。

Sysdig MonitorがKubernetes Dashboardsで提供するヒントを読むことで、問題のトラブルシューティングを迅速に行い、問題が発生した理由を理解し、根本的な原因をすぐに突き止めることができます。

Kubernetes Dashboardsを使えば、Kubernetesの専門家でなくても、クラスターのパフォーマンスと可用性を高めることができます。

screenshot of the Kubernetes Cluster Capacity dashboard, showing the nodes and namespaces capacityKubernetes Cluster Capacityダッシュボードのスクリーンショット(ノードとネームスペースのキャパシティを表示)
「Kubernetes Cluster Capacity」ダッシュボードでは、リソースが枯渇してペンディング状態に陥ったポッドのトラブルシューティングに役立ちます。

トラブルシューティングを次のレベルへ

Sysdig MonitorのKubernetesダッシュボードは完全にKubernetesネイティブです。すぐに使い始め、カスタマイズすることができます。

あなたのチームの誰かがイメージを変更してアップデートしたとします。突然、いくつかのポッドがCrashLoopBackOffエラーでループして再起動し始めました。すぐにKubernetes Resources/Deploymentsダッシュボードに行き、いくつかのポッドが準備できていないことを確認できます。

In this animation, the user is troubleshooting a CrashLoopBackOff situation caused by a broken image deployedこのアニメーションでは、ユーザーは、デプロイされた壊れたイメージによって引き起こされるCrashLoopBackOffの状況をトラブルシューティングしています。

そして、同じワークロード内のいくつかのコンテナが、異なるイメージを使用していることを知ります:

  • Sysdigがダッシュボードで案内しているすべての情報
  • イベントオーバーレイは、問題を解決するためのイベントベースのコンテキストをグラフィカルに表示します。

screenshot of showing the modal window that appeared after clicking the stream of events, showing all the events that happened in the cluster, sorted by date and timeKubernetesダッシュボードでのイベントオーバーレイ
イベントのストリームをクリックした後に表示されたモーダル・ウィンドウを示すスクリーンショットで、クラスタで発生したすべてのイベントが日時順に表示されています。

干し草の中の針を見つける

異なるクラスター内の異なるコンテナの動作を比較することは、Kubernetes Dashboardsの上部フィルタバーでマウスをクリックするだけで簡単にできます。マルチリージョンやマルチプロバイダーを使用しているかどうかは関係ありません。

Screenshot of the filter bar where you can filter the results by team, cluster, namespace, pod and container.
チーム、クラスター、ネームスペース、ポッド、コンテナで結果をフィルタリングできるフィルターバーのスクリーンショット
このように、Kubernetes Dashboardsでは、1つのアプリがインフラ全体でうまく機能しているかどうかを確認することができます。また、ダッシュボードでは、クラスターから特定のコンテナへとドリルダウンすることで、潜在的な問題をトラブルシューティングすることができます。

リソースの最適化と割り当てをサポートします

DevOpsエンジニアがKubernetesダッシュボードをチェックする必要がある状況は、クリティカルな状況だけではありません。ダッシュボードを使ってクラスターの構成を改善することは、すべてのSREがたまにはやるべきことです。

SysdigはKubernetesのエキスパートです。クラスターのトラブルシューティングだけでなく、インフラを最大限に活用するための設定についても、私たちにお任せください。

Capacity Optimizerダッシュボードでは、提案されたベストプラクティスと有意義なヒントを表示することで、CPUとメモリの最適なリソースリクエストとリミットを設定することができ、熟慮した上でコンテナのためのより良い値を設定することができます。

Capacity Optimizerダッシュボードを使用することで、インフラでの余分なコストを回避し、クラスターにおいて安全にリソースを割り当てることができます。

in this animation, the user is navigating through thee Capacity Optimizer dashboard to learn what's the appropriate value for CPU and Memory requests.このアニメーションでは、ユーザーがCapacity Optimizerダッシュボードを操作して、CPUとメモリのリクエストに対する適切な値を確認しています。

Capacity Optimizerは、インフラストラクチャー内の類似したコンテナに基づいて値を提案することで、リクエストとリミットを決定するのに役立ちます。

新しいワークロードを作成するとき、クラスターの状態がどうなっているか、ポッドが収まるかどうかはわからないでしょう。要求可能なCPUとメモリを調べるだけでなく、各ノードのCPUとメモリの空き容量も調べる必要があります。

クラスター全体には空きがあっても、各ノードには空きがないことがあります。各ノードの状態を確認することで、ワークロードを事前に準備し、デプロイする前に正しいサイズであることを確認することができます。

screenshot of the Capacity - New Resources Allocator dashboard showing a guide of how to allocate resourcesCapacity – New Resources Allocatorダッシュボードのスクリーンショットで、リソースの割り当て方法のガイドが表示されています。

New Resources Allocatorダッシュボードは、すべての新しいリソースがうまく適合するように、そのプロセスをガイドしてくれます。

重要なことに集中する

これらのダッシュボードは、ホスティングされたSaaSサービスの最新リリースに含まれており、利用を始めるとすぐにKubernetesクラスターで動作します。

Sysdig Monitorは、クラスターのダッシュボードを設定するだけでなく、すべてのプロセスをガイドすることで、何が起きているのか、なぜ起きているのかを理解するのに役立ちます。

この機能は、Sysdig US-Eastリージョンから既存のお客様に提供され、今後数週間で他のリージョンにも展開される予定です。また、ServiceVision for Prometheusが実際に動作している様子は、Supercharging Kubernetes Labels and Metrics Webinarでご覧いただけます!