本文の内容は、2023年4月25日に VICTOR HERNANDO が投稿したブログ(https://sysdig.com/blog/managed-service-prometheus)を元に日本語に翻訳・再構成した内容となっております。
Prometheusのマネージドサービスを利用しているが、コストが高すぎると感じている方はいらっしゃいませんか?あるいは、Prometheusのメトリクスの取り込み、処理、管理の委託を検討していて、その費用についてもっと知りたいと考えていますか?
現在、多くの企業が自社でOSSのPrometheusモニタリングバンドルを維持する代わりに、Prometheusのマネージドサービスを選択しています。このアプローチは、企業が運用やインフラ監視の支出を減らし、負担を軽減することができるため、ますます一般的になってきています。
Prometheusのマネージドサービスを評価し、最終的に選択する場合、考慮すべき要素は数多くありますが、中でも価格は最も重要な要素の1つです。予期せぬ高額請求という不愉快な驚きを避けるためには、事前に計画を立て、コストの算出方法を理解することが重要です。
この記事では、主要なマネージド Prometheus サービスプロバイダーのサービス料金について、最も高額なオプションと最も手頃なオプションに焦点を当て、洞察を提供します。
Prometheusのマネージドサービス価格
免責事項:本記事では、このブログ記事が書かれた時点(2023年4月)に対応する価格を掲載しています。現在の価格については、各ベンダーの公開価格情報をご確認ください。
AWS
現在のAmazon managed service for Prometheusの価格は、こちらでご確認いただけます。また、Amazonは請求額を見積もるための独自の価格計算機も提供しています。
Amazonは、メトリクスインジェスト費用、ストレージ、クエリーなど、Amazon managed service for Prometheus内のさまざまなサービスに対して課金しています。メトリクス・インジェストレーションは、サンプルごとに課金されます。
Metrics ingestion | Cost ($/10M samples) |
First 2 billion samples | $0.90 |
Next 250 billion samples | $0.35 |
Over 252 billion samples | $0.16 |
Other costs | |
Metrics storage | $0.03/Gb-Mo |
Query Samples Processed (QSP) | $0.10/B samples processed |
Google Cloud
Google Cloudのモニタリングの価格は、同社のウェブサイトで確認できます。Googleは独自の価格計算機も用意しており、「Cloud operations (Logging, Monitoring, Trace, Managed Prometheus)」を選択し、請求額を見積もるだけです。
Google Cloudでは、サンプルごとにメトリクス・インジェストを課金しています。以下の表は、Google Cloudのモニタリングの価格設定です。
Metrics ingestion | Cost ($/1M samples) |
First 50 billion (B) samples | $0.15 |
Next 50B-250B samples | $0.12 |
Next 250B-500B samples | $0.09 |
> 500B samples | $0.06 |
その他、「モニタリングAPIコール」の利用や「モニタリングアップタイムチェックの実行」など、1ヶ月間の利用状況に応じて課金される場合とされない場合があります。
Azure
Azure Monitorの価格はこちらでご確認ください。Azure Monitorの請求額を見積もりたい場合は、価格計算機をご利用ください。Azureは、メトリクス・インジェストメントをサンプルごとに課金します。
Metrics ingestion | Cost ($/10M samples) |
Any number of samples | $0.16 |
Queries | Cost ($/1B samples) |
Metrics queries | $0.10 |
Azureは、メールやプッシュ通知、Webフックなど、アラートや通知にも課金されます。
Grafana Labs
Grafana Cloudの価格モデルを確認したい場合は、そのウェブサイトをご覧ください。価格設定ページでは、請求額の概算を計算することもできます。Grafana Labsでは、時系列(TS)ごとにメトリックス・インジェストメントを課金しています。
Metrics ingestion | Cost ($/1000 time series) |
First 20K TS | Included in monthly usage subscription |
Next 1K TS | $8 |
Grafana Labsは、アクティブなシリーズに基づいて課金されるため、メトリクスの使用状況によって請求額が異なる場合があります。一方、アラートとQSPは含まれているため、余分なコストは発生しません。
Grafana Labsのドキュメントによると、過去15分または30分以内に新しいデータポイントが受信された場合、時系列はアクティブと見なされます。
Sysdig Monitor
Sysdig Monitorでは、メトリクスの取り込みは時系列ごとに課金されます。以下は、Sysdigのメトリクスの価格です。
Metrics ingestion | Cost ($/1000 time series) |
Node exporter, cAdvisor, and KSM metrics included | $0 |
First 2K TS included in agent subscription per node | $0 |
> 2K TS per agent | $5 |
ノードエクスポーター、KSM、およびcAdvisorの時系列メトリクスは、Sysdig Agentの価格に含まれていることに注意してください。したがって、これらの時系列は課金されません。また、アラートとQSPは含まれています、これらの機能も課金されることはありません。
1TSあたりの価格比較
サンプルに基づいて料金を請求するプロバイダーから取得した情報を推定すると、同等の時系列を取得できます。 このようにして、マネージド Prometheus サービス プロバイダー間のコストを比較できます。
サンプルからTS換算値を算出するにはどうすればいいのでしょうか?異なるインジェストサンプリング間隔からTS換算のデータを取得してみましょう。
- 60s間隔→1TS / 60s * 1時間で3,600s * 1ヶ月で744時間 = 44,640サンプル
- 30s間隔→1TS / 30s * 1時間で3,600s * 1ヶ月で744時間 = 89,280 サンプル
- 10s間隔→1TS / 10s * 1時間で3,600s * 1ヶ月で744時間 = 267,840 サンプル
これらの数値をもとに、サンプル単価を時系列単価に簡単に変換することができます。
Vendor | TS conversion | Number of samples | Price | Samples per price unit | Cost |
AWS (60s) 2B samples | 44,802.87 | 44,640.00 | $0.90 | 10,000,000.00 | 0.0040 |
AWS (60s) Next 250B samples | 5,600,358.42 | 44,640.00 | $0.35 | 10,000,000.00 | 0.0016 |
AWS (60s) over 252B samples | 47,903,493.71 | 44,640.00 | $0.16 | 10,000,000.00 | 0.0007 |
AWS (30s) 2B samples | 22,401.43 | 89,280.00 | $0.90 | 10,000,000.00 | 0.0080 |
AWS (30s) Next 250B samples | 2,800,179.21 | 89,280.00 | $0.35 | 10,000,000.00 | 0.0031 |
AWS (30s) over 252B samples | 50,726,074.35 | 89,280.00 | $0.16 | 10,000,000.00 | 0.0014 |
AWS (10s) 2B samples | 7,467.14 | 267,840.00 | $0.90 | 10,000,000.00 | 0.0241 |
AWS (10s) Next 250B samples | 933,393.07 | 267,840.00 | $0.35 | 10,000,000.00 | 0.0094 |
AWS (10s) over 252B samples | 52,607,794.78 | 267,840.00 | $0.16 | 10,000,000.00 | 0.0043 |
GCP (60s) First 50B samples | 1,120,071.68 | 44,640.00 | $0.15 | 1,000,000.00 | 0.0067 |
GCP (60s) Next 50B-250B samples | 4,480,286.74 | 44,640.00 | $0.12 | 1,000,000.00 | 0.0054 |
GCP (60s) Next 250B-500B samples | 5,600,358.42 | 44,640.00 | $0.09 | 1,000,000.00 | 0.0040 |
GCP (60s) >500B samples | 42,347,938.15 | 44,640.00 | $0.06 | 1,000,000.00 | 0.0027 |
GCP (30s) First 50B samples | 560,035.84 | 89,280.00 | $0.15 | 1,000,000.00 | 0.0134 |
GCP (30s) Next 50B-250B samples | 2,240,143.37 | 89,280.00 | $0.12 | 1,000,000.00 | 0.0107 |
GCP (30s) Next 250B-500B samples | 2,800,179.21 | 89,280.00 | $0.09 | 1,000,000.00 | 0.0080 |
GCP (30s) >500B samples | 47,948,296.58 | 89,280.00 | $0.06 | 1,000,000.00 | 0.0054 |
GCP (10s) First 50B samples | 186,678.61 | 267,840.00 | $0.15 | 1,000,000.00 | 0.0402 |
GCP (10s) Next 50B-250B samples | 746,714.46 | 267,840.00 | $0.12 | 1,000,000.00 | 0.0321 |
GCP (10s) Next 250B-500B samples | 933,393.07 | 267,840.00 | $0.09 | 1,000,000.00 | 0.0241 |
GCP (10s) >500B samples | 51,681,868.86 | 267,840.00 | $0.06 | 1,000,000.00 | 0.0161 |
Azure (60s) Any number of samples | 44,640.00 | $0.16 | 10,000,000.00 | 0.0007 | |
Azure (30s) Any number of samples | 89,280.00 | $0.16 | 10,000,000.00 | 0.0014 | |
Azure (10s) Any number of samples | 267,840.00 | $0.16 | 10,000,000.00 | 0.0043 | |
Grafana Labs (60s) First 20,000 TS | Included in subscription | ||||
Grafana Labs (60s) > 20,000 TS | 0.0080 | ||||
Sysdig (10s) node exporter, cAdvisor, KSM TS | Included in subscription | ||||
Sysdig (10s) First 2,000 TS per node | Included in subscription | ||||
Sysdig (10s) > 2,000 TS per node | 0.0050 |
K8sシングルクラスターの使用例
Prometheusインスタンスで持つことができる時系列の数は、大きく変化する可能性があり、アーキテクチャーに依存することに注意してください。クラスター内のアプリケーションや、再デプロイ、作成、削除、スケーリングなどの運用タスクが多ければ多いほど、より多くの時系列を生成することになります。PodやKubernetesオブジェクトの揮発性によっては、カーディナリティの爆発が発生し、深刻なトラブルに発展する可能性があります。時系列が増えれば増えるほど、必要なストレージも増え、スケーラビリティやパフォーマンスの問題が発生しやすくなり、多くのコストがかかります。
ベンダーごとにPrometheusのマネージドサービスのコストを見積もるための基礎となるサンプルアーキテクチャをモックアップしてみましょう。
今回のユースケースでは、Kubernetesのインフラについて以下のような情報を入手しています:
- 1つのKubernetesクラスター
- 25ノード
次に、数日後のPrometheusインスタンスに登録された時系列の総数をご覧ください。このKubernetesクラスターは、重いワークロードやユーザー活動のピークによってストレスを受けることなく、通常の負荷で実行されていました。最小限のアプリケーションライフサイクルと可能性の高いアプリケーションライフサイクルをエミュレートするために、毎日いくつかのアプリケーションを再デプロイしています。これらは、ジョブによって生成された時系列の数です:
- kubernetes-apiservers: 73,713 TS
- kubernetes-pods: 275,421 TS
- kubernetes-nodes-cadvisor: 257,649 TS
- kubernetes-service-endpoints (node exporter + KSM): 144,202 TS
- kubernetes-nodes: 42,166 TS
- kube-dnsです: 370 TS
- etcd 4399 TS
- prometheus:1068TS
- felix_metrics: 4008 TS
- kube_controller_metrics: 63 TS
- Time series TOTAL: 803,059
クエリー処理とユーザーアクティビティに関して、まず以下のような前提で考えてみます:
- 10人の異なるユーザーがPrometheusにアクセスし、それぞれのプロジェクトのデータを報告するダッシュボードとグラフを持つ。
- 1ユーザーあたり平均8つのグラフがデータをクエリーしている。
- 各グラフの更新間隔が10秒である。1ユーザー、1日平均2時間と仮定すると、720回のクエリーに相当する。5,760は、1日・1ユーザーあたり8つのグラフに対するクエリーの総数です。
- データは平均して3時間の時間枠で表示されています。
- この環境で3時間処理したサンプル数の最高値は 867,303,720.
- 1つのクエリーにつき平均30万サンプルと仮定します。
- クエリー処理のモニタリング ~525,657,600,000 (1)
- アラートクエリー処理 ~5,256,000,000~ (2)
(1) 監視クエリー処理量は、監視ユーザー10人、ユーザー1日あたり5,760クエリー、月30日、1クエリー(3時間)あたり平均300,000サンプルで計算。
(2) アラートクエリー処理は、2実行/分 * 200アラート * 60分/時 * 730時間/月 * 300,000アラートルールあたりの平均サンプル数から計算されています。
すべてのデータが揃ったところで、いくつかの計算をしてみましょう!
まず、この数字に基づいて、取り込まれたサンプル数を計算する必要があります。
803,059 TS / 10収集間隔(秒) * 3600秒 * 1ヶ月の744時間 = 215,091,322,560 -> ~2,150億サンプル。
ストレージコストが課金されるサービスでは、そのボリュームのメトリクスに当初必要なストレージは、~12GBとします。
クエリーの処理量については、これまでの計算から、クエリーの総量は~5兆781億クエリー/月と仮定します。この数字は大きすぎると思うかもしれませんが、逆に、1つのクエリに対して何百万ものサンプルをクエリする可能性があることを考慮すると、小さすぎるかもしれません。
総サンプル数の算出には、10秒のサンプリング間隔が使用されていることに注意してください。Grafana Labsのようなベンダーは、デフォルトで60秒のサンプリング間隔を実装しています。
免責事項:以下では、各ベンダーのPrometheusのマネージドサービスのコストを簡単に計算したものをご覧いただけます。これは概算であり、コストは監視プラットフォームの使用状況に応じて変動する可能性があることに留意してください。
AWS
では、各サービスが請求する費用はどのようになるのでしょうか。
Service | Cost |
TS first 2B samples | 2B samples * $0.90 /10M = $180 |
TS next 250B samples | 213,091,322,560 samples * $0.35/10M = $7,458.19 |
Storage | $0.03 * 12.92GB * 365 days = $141.52 / month |
Query Samples Processed (QSP) | $0.10/ B * 5,781 B queries = $578.1 / month |
Total cost | $180 + $7,458.19 + $141.52 + $578.1 = $8,357.81 / month |
つまり、先に定義したアーキテクチャーに属する監視データを処理するために、PrometheusのAmazonマネージドサービスを所有すると、月々 $8,357 程度の出費となります。
GCP
ここで、Google Cloudモニタリングの価格について分析します。
Service | Cost |
TS first 50B samples | 50B samples * $0.15 /1M = $7,500 |
Next 50B-250B samples | 165,091,322,560 samples * $0.12/1M = $19,810.95 |
Total cost | $7,500 + $19,810.95 = $27,310.95 |
同じデータを処理するためにGoogle Cloud monitoringのインスタンスを所有する場合、月々約 $27,310 の支払いとなります。
Azure
Prometheusのメトリクスをモニタリングし、インジェストするためにAzureが提供するサービスを分析してみましょう。
Service | Cost |
TS | 215,091,322,560 * $0.16 /10M = $3,441.46 |
Query processing | $0.10/ B * 5,781 B queries = $578.1 |
Total cost | $3,441.46 + $578.1 = $4,019.56 / month |
この具体的なユースケースでAzureを使用すると、月額 $4,019 ほどかかり、さらにアラートや通知に関するコストも考慮する必要があり、これは余分な資産として請求されることになります。
Grafana Labs
これは、Grafana LabsのGrafana Cloud製品で、サンプリング間隔が10秒の場合のコストです。
コストはアクティブなメトリクスによって変わるため、ここではすべてのメトリクス(100%)がアクティブであると仮定します。
Service | Cost |
Service fee | $299 / month |
TS first 20k | included in subscription |
TS > 20k | 803,059-20k = 783,059 * $8 / 1,000 = $6,264.4 |
Total cost | $299 + $6,264.4 = $6,563.4 |
Grafana Labsを利用すると、トータルコストは月 $6,563 程度になります。
Sysdig Monitor
Sysdig Monitor は、デフォルトで 10 秒のサンプリング間隔を実装しており、その結果、次に見るように、競合他社と比較して最大 6 倍のメトリクスを、低コストで得ることができます。
まず、現在の数値から、ノードエクスポーター、cAdvisor、KSMのメトリクスを抜き出す必要があります。簡単のため、以下のジョブを時系列の総数から引いてみましょう:
- kubernetes-nodes-cadvisor: 257,649 TS
- kubernetes-service-endpoints (node exporter + KSM): 144,202 TS
- kubernetes-nodes: 42,166 TS
新しい時系列数のTOTALは 803,059 – 257,649 – 144,202 – 42,166 = 359,042 TS. 請求される時系列の数は、約55%減少しました!
Service | Cost |
Agent cost | $30 * 25 nodes = $750 |
Metrics included in agent subscription | 2,000 * 25 nodes = 50,000 TS included free of charge |
Metrics ingestion | Next 309,042 * $5 / 1,000 = $1,545.21 / month |
Total cost | $750 + 1,545.21 = $2,295.21 / month |
prometheusのマネージドサービスとしてSysdig Monitorを利用する場合、月額 $2,295 程度になります。
価格比較
すべての計算を終えたら、いよいよ各サービスのコストを集計します。今回は、インジェスト間隔(60秒、30秒、10秒)を変えた場合の価格をTSで算出しています。
TS calculator | AWS First ~44,800/22,400/7,500 TS | AWS Next ~933,393 TS | GCP First ~1,120,071/ 560,035/186,678 TS | GCP Next ~746,714 TS | Azure – any number of TS | Grafana Labs & Sysdig | QSP | Disk | TOTAL |
AWS (60s) | $180.00 | $1,184.70 | $578.17 | $141.52 | $2,084.38 | ||||
AWS (30s) | $180.00 | $2,439.40 | $578.17 | $141.52 | $3,339.08 | ||||
AWS (10s) | $180.00 | $7,458.20 | $578.17 | $141.52 | $8,357.88 | ||||
GCP (60s) | $5,377.28 | $5,377.28 | |||||||
GCP (30s) | $7,500.00 | $2,603.65 | $10,103.65 | ||||||
GCP (10s) | $7,500.00 | $19,810.96 | $27,310.96 | ||||||
Azure (60s) | $573.58 | $578.17 | $1,151.74 | ||||||
Azure (30s) | $1,147.15 | $578.17 | $1,725.32 | ||||||
Azure (10s) | $3,441.46 | $578.17 | $4,019.63 | ||||||
Grafana Labs (60s) | $6,563.47 | $6,563.47 | |||||||
Sysdig (10s) | $2,295.21 | $2,295.21 |
Prometheus のマネージドサービスのコストを比較する場合、メトリクスインターバルサンプリングによるコストに注意する必要があります。Sysdigのメトリクス間隔のサンプリングはデフォルトで10秒ですが、DIY Prometheus、GCP、Grafanaは60秒ごとにメトリクスをプルします。いくつかの競合他社よりも6倍のデータを収集しているにもかかわらず、Sysdigは最も安いオプションです。Sysdigでは、ストレージやクエリーのサンプル処理に追加料金はかかりません。これらのサービスは、請求額を劇的に増加させる可能性があり、さらにQSP数の予測は複雑で、ユーザーの使用量に依存するものであることを念頭に置いています。
この記事で分析したPrometheusのマネージドサービスの価格を、10秒間のメトリクス・インジェストのスコープで比較すると、ベンダー間で大きな差があることがわかります:
AWS: AWS: ~$8,357 / 月
GCP:~$27,310/月
Azure ~$4,019/月
Grafana Labs: ~$6,563/月
Sysdigです: ~$2,295/月
AzureはSysdigの2倍近く、AWSは4倍近く、GCPは12倍以上のコストです。
K8sマルチクラスターのユースケース
「K8sシングルクラスター」のユースケースを読み飛ばした方は、そのセクションの最初のパラグラフをご覧ください。TSがどのように生成されるのか、そしてユースケースごとに数値がいかに変動的でダイナミックなものになるのかを理解することが重要です。
今回は、より大きなシナリオでコストを分析します。このアーキテクチャーは、5つのK8sクラスター、各クラスター50ノードで構成されています。
- 5つのKubernetesクラスター
- 50ノード/クラスター
時系列の総数は、ストレスや高負荷の平均的なピークがない、通常の負荷の下で計算されています。簡略化のため、テストサイクル中に、いくつかのデプロイメントを再デプロイ/スケールダウン/スケールアップしました。そうすることで、実際のアプリケーションのライフサイクルをエミュレートすることができます。以下、このK8sクラスター群で生成された時系列のジョブ別の数をご覧ください:
- kubernetes-apiservers: 368,565 TS
- kubernetes-pods: 4,131,315 TS
- kubernetes-nodes-cadvisor: 3,607,086 TS
- kubernetes-service-endpoints (node exporter + KSM): 2,018,828 TS
- kubernetes-nodes: 505,992 TS
- kube-dnsです: 1,850 TS
- etcd 21,995 TS
- prometheus:5,340TS
- felix_metrics: 20,040 TS
- kube_controller_metricsです: 315 TS
- Time series TOTAL: 10,681,326
クエリー処理とユーザーアクティビティに関して、まず以下のような前提で考えてみます:
- 50人の異なるユーザーがPrometheusにアクセスし、それぞれのプロジェクトのデータを報告するダッシュボードやグラフを持つ。
- 1ユーザーあたり平均8つのグラフがデータをクエリーしている。
- 各グラフの更新間隔が10秒である。1ユーザー、1日平均2時間と仮定すると、720回のクエリーに相当する。5,760は1日、1ユーザーあたりのクエリー総数です。
- データは平均3時間の時間枠で表示されています。
- この環境で3時間処理したサンプル数の最高値は 11,535,832,080.
- 1クエリーあたり平均300,000サンプルと仮定します。
- クエリ処理のモニタリング ~2,628,288,000,000~ (1)
- アラート・クエリー処理 ~26,280,000,000~ (2)
(1) 監視クエリ処理量は、監視ユーザー50人、ユーザー1日あたり5,760クエリー、月30日、クエリー(3時間)あたり平均300,000サンプルから算出されます。
(2) アラートクエリー処理は、2回/分 * 200アラート/クラスター * 60分/時 * 730時間/月 * 300,000アラートルールあたりの平均サンプル数から計算されています。
免責事項:以下は、各ベンダーのPrometheusのマネージドサービスのコストを簡単に計算したものです。これは概算であり、コストは監視プラットフォームの使用状況によって変動する可能性があることに留意してください。
今回は、前項で得たTS単価をもとに、各プロバイダーのコストを算出します。
価格比較
各サービスの10秒メトリクスのインジェスト価格を比較してみましょう。
TS calculator | AWS First ~44,800/22,400/7,500 TS | AWS Next ~5,600,358/2,800,179/933,393 TS | AWS over 252B samples | GCP First ~1,120,071/ 560,035/186,678 TS | GCP Next ~4,480,286/2,240,143/746,714 TS | GCP Next ~5,600,358/2,800,179/933,393 TS | GCP over 500B samples | Azure – any number of TS | Grafana Labs & Sysdig | QSP | Disk | TOTAL |
AWS (60s) | $180.00 | $8,750.00 | $3,597.03 | $2,890.83 | $1,882.28 | $17,300.13 | ||||||
AWS (30s) | $180.00 | $8,750.00 | $11,226.06 | $2,890.83 | $1,882.28 | $24,929.16 | ||||||
AWS (10s) | $180.00 | $8,750.00 | $41,742.18 | $2,890.83 | $1,882.28 | $55,445.29 | ||||||
GCP (60s) | $7,500.00 | $24,000.00 | $20,413.30 | $0.00 | $51,913.30 | |||||||
GCP (30s) | $7,500.00 | $24,000.00 | $22,500.00 | $27,217.73 | $81,217.73 | |||||||
GCP (10s) | $7,500.00 | $24,000.00 | $22,500.00 | $141,653.18 | $195,653.18 | |||||||
Azure (60s) | $7,629.03 | $2,890.83 | $10,519.86 | |||||||||
Azure (30s) | $15,258.06 | $2,890.83 | $18,148.89 | |||||||||
Azure (10s) | $45,774.18 | $2,890.83 | $48,665.01 | |||||||||
Grafana Labs (60s) | $85,589.61 | $85,589.61 | ||||||||||
Sysdig (10s) |
まとめると、各サービスが10秒間隔で〜1,100万メトリクスをインジェストした場合のコストとなります。
- AWSの場合 ~$55,445/月
- GCP:~$195,653/月
- Azure ~$48,665/月
- Grafana Labs: ~$85,589/月
- Sysdig ~$27,747/月
時系列ボリュームが~1,100万件の場合、SysdigのPrometheus向けマネージドサービスは、競合他社に比べて圧倒的に安価です。GCPはAWSとAzureのほぼ4倍のコストです。Grafana Labsはコストを大幅に上昇させ、2番目に高価なオプションとなりました。これに対し、Sysdigは最も費用対効果の高いソリューションを提供しています。
SysdigのPrometheus向けマネージドサービスのメリット
SysdigのPrometheus向けマネージドサービスは、GCPやAWSなどの他のクラウドプロバイダーと比較して大幅なコスト削減が可能であり、市場で最も手頃なオプションとして際立っています。
OSSのPrometheusユーザーで、Prometheusのメトリクス取り込みと管理の委託をお考えの方は、大幅なコスト削減のメリットを享受することができます。SysdigのPrometheus向けマネージドサービスでは、メトリクスのメンテナンス、スケーラビリティ、ストレージ、パフォーマンス、問題解決などを請け負うことで、運用コストの削減を実現します。
すでにPrometheusのマネージドプロバイダーにメトリクスの処理や委託をしている場合でも、コストを削減し、さらに多くの機能を安価に手に入れることができることを念頭に置いています。クエリーサンプル処理(QSP)の料金は、同時ユーザー数、グラフ、ダッシュボード、更新間隔、インフラ規模など、様々な要因に依存するため、特に計算が難しい場合があります。
Sysdigのエージェントの取り込み間隔時間は、デフォルトで10秒に設定されていますが、60秒まで長い間隔を選択する人もいます。この間隔を短くすると、場合によってはパフォーマンスや信頼性に悪影響を及ぼし、ユーザーエクスペリエンスが低下することがあります。SysdigのPrometheus向けマネージドサービスを選択することで、パフォーマンス、安定性、信頼性を犠牲にすることなく、メトリクス取り込みの時間間隔を短縮し、低価格でメリットを得ることができます!
履歴データのクエリーや分析には、パフォーマンスが重要です。prometheusのマネージドサービスでは、タイムリーにデータを提供することができないため、運用に支障をきたし、多くの損害を与える可能性があります。Sysdig Monitorは、時間の経過とともにヒストリカルデータをロールアップしていきます。これは、Sysdig Monitorが競合他社よりもはるかに速くQSPを行うための重要な機能(1)です。
KSM、node exporter、cAdvisorのメトリクスを無料で含むほか、独自のカスタムメトリクスやプラットフォームメトリクスを含むSysdigが収集したすべてのメトリクスを利用できるため、Sysdigは、アウトオブボックスのメトリクスエンリッチメントの恩恵を受けられます。Sysdigを利用することで、PrometheusのメトリクスはクラウドやKubernetesのコンテキストを得ることができるようになりました!
Sysdigは、メトリクスを取り込み、保存し、データを分析するための監視ツール以上のものです。メトリクスエンリッチメント、eBPFインストルメンテーション、トラブルシューティングのためのSysdig Advisor、K8sやクラウドのコストを削減するCost Advisor、アウトオブボックスのダッシュボード、アラート、統合などは、Sysdig Monitorがもたらす利点の一部です。この記事では、これらの機能をはじめ、より多くの機能をご紹介します。
(1) Sysdig Monitorがデータをどのようにロールアップするかをカスタマイズしたい場合は、Sysdigのサポート担当者にご連絡ください。
運用コストとインフラ関連コストを削減
Prometheusのモニタリングに関連するコストは、他にも特筆すべきものがあります。Prometheusのメトリクスコスト、管理する時系列の数、QSPのボリュームだけが、コストを削減できるテーマではありません。Prometheusのマネージドサービスは、Prometheusのメトリクスを自動的に取り込み処理することで、お客様の負担の大半を軽減し、すべてのデータを利用できるようにします。
企業は、Prometheusの監視インフラの維持、エスカレーション、サポートに苦労しているかもしれません。このタスクは、特にカーディナリティが爆発的に増加した場合に、困難で痛みを伴うことがあります。時系列が指数関数的に増加し、安定性、スケーラビリティ、コストに深刻な問題が発生します。
監視インフラの規模が適切かどうか、タイムリーに環境をスケールアップできるかどうか、メトリクスの利用を妨げる大きな頭痛の種となっている問題などについて、もう心配する必要はありません。Sysdig Monitorに頼って、Prometheusのメトリクスと可観測なプラットフォームを取り込み、処理し、管理することで、運用コストとインフラコストを劇的に削減することができます。
Kubernetesとクラウドのコストに関しては、Sysdigはコスト削減のためにもっと多くのことを支援することができます。SysdigのCost Advisorは、Sysdig Monitorに含まれるツールで、どの領域で経費がかかりすぎているかを特定するのに役立ちます。インフラ全体をドリルダウンして詳細な情報を得ることができ、最終的にはSysdigの提案に基づいてワークロードを適正化することで、無駄な支出を削減することができます。もっと詳しく知りたいですか?Cost Advisorがどのように無駄な支出を平均40%削減するのに役立っているかをご覧ください!
まとめ
本記事で分析したベンダーは、Prometheusの同様のマネージドサービスを提供していますが、その関連コストは異なる場合があります。ベンダーによっては、QSPやストレージにも課金されるため、請求額が飛躍的に増加する可能性があり、使用量に連動するため、コストの制限や管理が難しくなっています。データのクエリー、検査、監視を行うユーザーが多ければ多いほど、請求額は高くなります。
SysdigのPrometheus向けマネージドサービスは、10秒ごとにメトリクスをインジェストする場合でも、競合他社より大幅に安価です。QSPとストレージは料金に含まれているため、請求書が届いたときに驚くことはありません。
SysdigのPrometheus向けマネージドサービスによるコスト削減の詳細については、Sysdig Monitorのトライアルページにアクセスし、30日間の無料アカウントをリクエストしてください。数分で運用を開始することができます!