Top Banner
クラウドへの移行 datadog.com Datadog ソリューションの概要 クラウドへの移行 何千人ものユーザーに愛され信頼される Datadog Datadog で遅延や インシデントのない クラウド移行を 実現 クラウドへの移行は、エンジニア部門にとって、困難で時間がかかり大きなストレスとなる場合があります。新 たなクラウドアーキテクチャーで使用するクラウドネイティブツールの選定から、切り替え時には予測できない 設定の問題への対応まで、クラウドへの移行作業では遅延、チームの意思疎通の問題、パフォーマンスの問題が 頻繁に発生します。このような状況は、製品リリースの遅延、エンドユーザーに影響を及ぼすパフォーマンスイ ンシデント、サービスの停止といったビジネスに多大な影響を及ぼす原因につながりかねません。 Datadog は、クラウド移行の問題を軽減するために、幅広い機能を提供しています。数分でインストール可能 な 250 種類を超えるベンダーインテグレーションや、動的な環境やマイクロサービスに「クラウドネイティブ」 で対応できる機能など、Datadog はオンプレミスとクラウド環境全体を可視化し、同じプラットフォームでサ ポートするツールを提供します。Datadog プラットフォームでは、次の機能が提供されています。
37

Datadog ソリューションの概要 クラウドへの移行 ·...

Oct 04, 2020

Download

Documents

dariahiddleston
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

クラウドへの移行 datadog.com

Datadog ソリューションの概要

クラウドへの移行

何千人ものユーザーに愛され信頼される Datadog

Datadog で遅延やインシデントのないクラウド移行を実現

クラウドへの移行は、エンジニア部門にとって、困難で時間がかかり大きなストレスとなる場合があります。新たなクラウドアーキテクチャーで使用するクラウドネイティブツールの選定から、切り替え時には予測できない設定の問題への対応まで、クラウドへの移行作業では遅延、チームの意思疎通の問題、パフォーマンスの問題が頻繁に発生します。このような状況は、製品リリースの遅延、エンドユーザーに影響を及ぼすパフォーマンスインシデント、サービスの停止といったビジネスに多大な影響を及ぼす原因につながりかねません。

Datadog は、クラウド移行の問題を軽減するために、幅広い機能を提供しています。数分でインストール可能な 250 種類を超えるベンダーインテグレーションや、動的な環境やマイクロサービスに「クラウドネイティブ」で対応できる機能など、Datadog はオンプレミスとクラウド環境全体を可視化し、同じプラットフォームでサポートするツールを提供します。Datadog プラットフォームでは、次の機能が提供されています。

Page 2: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

クラウドへの移行 datadog.com

- 移行中、レガシー環境と新しいクラウド環境をエンドツーエンドに可視化します。

- AI ベースのアラート通知で、潜在的な問題を即座に通知します。

- SLA の達成状況と KPI をエンジニアチーム、エグゼクティブ、社外ステークホルダーに通知します。-

問題が発生した場合、迅速に優先順位を付けて問題を把握することで、修正にかかる時間を短縮します。

Datadog があれば、アマゾン ウェブ サービス ( AWS ) などのクラウドへの移行作業を、大きな問題なくス

ケジュール通りに完了できます。

新旧の環境を 同時に監視移行中の オンプレミス環境とクラウド環境

オンプレミスからクラウドに移行する場合や、パブリッククラウドから別のクラウドに移行する場合には、レガシーインフラストラクチャーでのアプリケーションパフォーマンスを理解してから、新しいクラウドプラットフォームでのパフォーマンスを把握することが極めて重要です。これにより、リアルタイムでの調整が可能になり、移行を成功させ期待通りの成果を達成できます。Datadog では、オンプレミスやパブリッククラウドで稼働するサーバーとコンテナに関して、一貫したレベルのインサイトを取得できます。Datadog の高度なデータ可視化 / 分析機能は、アプリケーションのパフォーマンス、インフラストラクチャとそれをサポートするツールのパフォーマンスを同時かつ一元的に監視します。また、アプリケーションの移行が完了すると、アラートとダッシュボードが自動調整され、新たな環境のパフォーマンスデータとログが表示されます。

AWS LOCAL EAST DATACENTER

Page 3: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

クラウドへの移行 datadog.com

サービスベースの動的なアプリケーションインフラストラクチャに最適なサポート

パブリッククラウド(さらに、多くのプライベートクラウド)環境は、従来のベアメタル / 仮想オンプレミスインフラストラクチャとは、動作や設計が大きく異なります。クラウドインフラストラクチャの設計には、次のような特徴があります。

- 動的:ホストやコンテナを自動生成(または削除)することで、ワークロードの変化にも柔軟に対応します。

- サービスベース:複数のホストやコンテナが同じタスクを分散型で処理します。これにより、処理時間は短縮され、環境の拡張に伴いほぼ無限の帯域幅を利用できます。マイクロサービスの場合には、複数のサービスが協業することで、複数のステップを含むプロセス全体を完了します。

このようなアーキテクチャーの変更により、これまでとは異なる評価方法が求められています。オンプレミス環境では個々のホストが重視されますが、クラウド環境では、個々のホストやコンテナを評価しても、アプリケーション全体のパフォーマンスを把握できません。パフォーマンスの評価には、複数のホストやコンテナで構成されるサービスを評価する必要があります。たとえば、1 つのホストで深刻なパフォーマンス低下が発生していても、サービス内にある他の 20 のホストは正常稼働し、問題のあるホストを補完しているため、サービスのパフォーマンスには影響が出ない場合があります。

Datadog は、「クラウドの時代に登場した」の新たに構築された監視プラットフォームであり、IT 環境をサービスレベルで表示、アラート通知、評価するソリューションです。すべてのアラート通知とダッシュボード表示はサービスレベルで行われ、サービスに追加 / 削除されたホストやコンテナの変更は自動的に反映されます。また、ホスト / コンテナ別のレポートにも対応しているので、オンプレミス環境の監視を実行しながら、パフォーマンスデータポイントを新しいクラウドインフラストラクチャのデータと比較することが可能です。

Page 4: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

クラウドへの移行 datadog.com

設定AI ベースの アラートで問題をすばやく捕捉

運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。クラウドへの移行中は数多くの変更が発生するため、予期しない問題が発生する可能性は大幅に増大します。Datadog は、機械学習による異常値 / 外れ値の検知など幅広いアラート機能を備えており、通常とは異なる状況の早期通知を可能にします。異常を放置すればサービス障害やパフォーマンスの問題へとつながりかねませんが、早く対処することで回避できます。アラートは、複数のシステムやグループに送信する設定や、ユーザーが定義したパラメーターに基づいてアクションを自動実行する設定が可能です。

オンプレミス /クラウドサポートツールキットのデータを 1 つのプラットフォームに統合

250 種類を超えるインテグレーション(SNMP、WMI、StatsD、JMX など、幅広いメトリクスレポートを標準でサポート)が提供されているため、Datadog の設定はわずか数分で完了し、レガシー環境と新たなクラウド環境の両方にあるすべてのインフラストラクチャからパフォーマンスメトリクス、ログ、離散事象を取り込むことができます。1 つのツールの問題や構成ミスがエンドユーザーのパフォーマンス低下につながる可能性があるため、アプリケーションをサポートする個々のコンポーネントをエンドツーエンドに可視化する機能は極めて重要です。インテグレーションは 250 種類以上用意されており、ほぼすべての組織のニーズに対応しています。インテグレーションは、プラグアンドプレイ対応であり、重要なデータソースをすぐに取り込み、分析やアラート通知に利用することが可能です。その結果、社内で実装を行う場合よりも、作業時間を数日から数週間短縮で、余ったリソースを他のタスクに投入することで、スケジュール通りに移行を進めることができます。

ANSIBLE CHEF CISCO

JIRA

CLOUDHEALTH

KUBERNETES

VSPHERE

CONSUL

ORACLEGITLAB JENKINS

SERVICENOWPUPPET SNMP WMI

Page 5: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

クラウドへの移行 datadog.com

クラウドパフォーマンスをオンプレミスのベンチマークと比較

移行前後でのアプリケーションパフォーマンスの比較は、クラウドへの移行後に必ずと言っていいほど聞かれる質問です。そして、問題が発生した場合、最初に非難の的になるのは新しいテクノロジーです。Datadog は、非常に精度の高いパフォーマンスデータの履歴を 15 カ月間保持しているので、アプリケーションやそれをサポートするインフラストラクチャの過去の状態と比較することが可能です。同様に、最適化イニシアティブと SLA の達成状況を、インフラストラクチャのさまざまな時点で比較することにより、質問への答えを探し、アプリケーションとその環境が拡張する過程を理解できます。

移行の進捗、 SLA 達成状況、 KPI の情報を 社外ステーク ホルダーにリアルタイムで提供

クラウドへの移行は、他から孤立した作業ではありません。アプリケーションの責任者、サポートチーム、経営幹部、IT 部門以外のステークホルダーなど、さまざまなグループがパフォーマンスの状態や移行の進捗を把握する必要があります。また、特に基盤となるプラットフォームが完全に異なるものへと切り替わった場合には、IT 環境の変更からパフォーマンスの問題が発生し、ビジネスに多大な影響を及ぼしかねません。

堅牢な可視化機能を備える Datadog では、ウィジェットをドラッグアンドドロップするだけでダッシュボードを簡単に作成でき、表示データをきめ細かくコントロールできます。外部のビジネスインテリジェンスシステムの使用や、アホドックなダッシュボードを手作業で作成する必要はありません。クラウドへの移行中の企業は、SLA KPI や移行の進捗など、IT 関連情報の伝達に Datadog のダッシュボードを活用しています。Datadog のダッシュボードは、必要に応じて社外のステークホルダーにも提供できます。ステークホルダーは、クラウド環境やオンプレミス環境の現状をリアルタイムで把握できます。

Page 6: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

監視の統合 datadog.com

Datadog ソリューションの概要

監視の統合

何千人ものユーザーに愛され信頼される Datadog

分散した 監視イニシアティブを統合し、 状況を把握する

新規プロジェクトの開始、インフラストラクチャコンポーネントの追加、買収による部門の設立などが発生すると、エンジニア部門はミッションクリティカルな領域を的確に把握できなくなります。そのギャップを埋めるために監視ツールを追加すると、ツールの学習に時間がかかるだけでなく、継続的な保守も必要になります。また、監視プラットフォームには、過去にインストールされたコンポーネントが存在する可能性もあります。その結果、プラットフォーム全体の可視性は損なわれ、新たなコンポーネントを追加しても十分にサポートされなくなる恐れもあります。監視ツールを追加するたびにアラートの通知件数は増大します。そこには誤検知も含まれているため、複数の矛盾したデータソースを使ってトラブルシューティングを行わなければなりません。

つぎはぎだらけの監視ソリューションは、重大な影響を及ぼす可能性があります。また複雑化したシステムからはデータの取得でさえ高度なスキルが必要とされるため、問題解決に時間がかかり、膨大なアラートの管理が難しくなり、結果ユーザの満足度を下げることになります。また、利用できるデータに制限があるため、ユーザーの不満は増大します。

Page 7: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

監視の統合 datadog.com

さらに、データには偏りや矛盾が発生します。これは、監視の盲点になるだけでなく、データの誤解にもつながる恐れがあり、プラットフォームの安全性とエンドユーザーエクスペリエンスの低下を招きます。複数の監視システムを管理する負担は増大し、システムを稼働するために専任のスタッフが必要になります。やがて多くの企業が、「このようなシステムを維持する価値があるのか」という疑問に直面し、「管理システムをあれこれ設置したにもかかわらず、監視ニーズが満たされていないのではないか」と考えるようになります。Datadog は、分散した監視を統合するプラットフォームを提供します。

- ログ、インフラストラクチャメトリクス、アプリケーションパフォーマンスデータを 1 つの統合システムで管理:Datadog は、ベンダー 3 社が提供する 3 つの中核的な監視製品を 1 つに統合したプラットフォームを提供します。「3 つの柱」を基盤にする Datadog を使用することで、ユーザーはツール間の切り替え、ログ / インフラストラクチャ / アプリケーションを条件に基づいて評価する複合アラートの作成、各種ソースから取得したデータのダッシュボードでの比較を実行できます。

- 複数の部門にある IT コンポーネントからデータを収集し分析:280 種類を超えるベンダーインテグレーションを提供し、カスタムデータ / 独自仕様データを幅広い方法で収集する Datadog は、IT 環境で稼働するほぼすべてのアプリケーションやシステムとの互換性を確保しています。

- 複数の監視ツールデータを統合:280 種類を超えるインテグレーションには、よく使用される商用/オープンソースの監視ツールが含まれます。したがって、すべてのツールを Datadog に統合し、共通の時間スケールとユニバーサルなメタデータを使って収集データを正規化することが可能です。集計、相関、比較を行い、ダッシュボード表示、アラート通知にすべてのデータを使用できます。

- エンジニア部門全体を単一の監視プラットフォームに移行:Datadog は、すべてのユーザーに一貫したデータアクセスを提供します。また、直感的な UI が採用されているため、システム操作の学習に時間がかからず、IT 環境全体のデータアクセスや、ダッシュボードおよびアラートの操作をセルフサービスで実行できます。さらに Datadog では、親子のアカウントフェデレーションを採用しています。中央の IT 部門とサポート部門は社内にあるデータ全体にアクセスできるだけでなく、各部門はそれぞれのニーズに合わせたインスタンスで業務を行うことができます。

Page 8: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

監視の統合 datadog.com

ログ、インフラ ストラクチャ メトリクス、 アプリケーショントレースを 1 つのプラットフォームに 統合

エンジニア部門はこれまで、3 つ(またはそれ以上)の独立したシステムを使用して、アプリケーション、IT 基盤インフラストラクチャ、ログを監視してきました。3 つのデータソースにはアプリケーションの稼働状態に関する知見が含まれているため、それぞれのデータソースの可視化はプロダクション環境のアプリケーションの運用上、不可欠です。Datadog は、インフラストラクチャ、APM、ログという 3 つの製品を 1 つのプラットフォームに統合しています。各製品で監視する環境やアプリケーションコンポーネントは、ユーザーが選択します。月次ベースで選択を変更することにより、コストとカバレッジのバランス調整が可能です。

3 つ(またはそれ以上)のツールが持つそれぞれのメリットを、1 つのソリューション(請求も一元化)で実現することができます。この 3 つのツールは同じプラットフォーム上で構築されており、メタデータベースの分類を共有します。集計したログ、アプリケーショントレース、インフラストラクチャメトリクスは比較や相関が行われ、ダッシュボードでの表示やアラート通知に使用されます。この 3 つのデータソースにはほかにも統合ポイントがいくつかあり、追加機能や、Datadog の APM、ログ、インフラストラクチャ間の可視化など、ソリューション単体では得られないメリットが実現されます。このように、Datadog の統合プラットフォームは、個々のシステムを合計を上回る価値を提供します。

メトリクス可視化の3 つの柱

トレース

全社規模の 監視標準を 確立

チームや部門に専用スタックの使用を許可してきた企業や、買収のたびに新たな部門を設立してきた企業では、チームごとに異なる監視ソリューションが使用され、システムはパッチワークになっています。その結果、他の部門からのメンバーオンボーディングが困難になり、チーム間でコラボレーションしようとすれば監視ソリューションの接続を交渉しなければならず(または、唯一の信頼できるデータソースがない)、サポートチームは複数のアプリケーションを担当する必要があるため、通常はアクセスしない監視システムやよく知らない監視システムのサポートチケットへの対応を余儀なくされます。このような状況では、エンジニアイニシアティブが失速してしまいます。

Datadog では、複数のチームが同じプラットフォームを使用し、その上で個々のニーズに合わせたカスタマイズを行うことができます。280 種類以上のベンダーインテグレーションと、独自仕様のデータ収集を可能にするさまざまな方法を使用すれば、システム統合はわずか数分で完了します。すべてのチームのデータを共有できるようになり、アップストリームやダウンストリームのシステムからデータを取得することで可視性が高まります。また、ダッシュボードとアラートは非常に柔軟な設定と共有に対応しており、編集中のオブジェクトはロックされます。さらに、Datadog では親子アカウントのフェデレーションを採用しているため、IT 部門など中央の部門が他の部門用のサブアカウントを個別に設定できます。親アカウントは子アカウントを監視し、子アカウントが収集するデータを取得できます。これにより、アラートやダッシュボード表示の連携という、中央の IT 部門やサポート部門にとって不可欠なニーズを満たすことができます。

Page 9: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

監視の統合 datadog.com

オープンソースツールと商用監視ツールから収集したデータを接続

多くのエンジニア部門では、幅広い監視ツールや管理ツールが導入され、特定のインフラストラクチャー/アプリケーション領域やワークフロー向けにカスタマイズされています。このようなシステムは、各タスクのニーズに十分に応え、ダウンストリーム/アップストリームシステムのデータ接続を通じて、さらに包括的な可視性を実現します。

高い堅牢性を備えたインテグレーションと幅広いデータ収集機能を備えた Datadog は、外部の監視ツールから重要な情報を取得して相互に関連付けることにより、可視性と価値を実現します。収集されたデータは、共通のメタデータで分類されます。これを、外部システムのデータや、APM/ ログ / インフラストラクチャの監視データと組み合わせることで、可視化やアラート通知に役立てることができます。Datadog は、アプリケーションで生成されたデータの収集、クエリ、可視化、アラート通知をすべて 1 つのプラットフォームに統合します。

Prometheus Nagios Cacti Splunk

Catchpoint AWSCloudWatch

Papertrail PagerdutyPingdom

OpsGenie VictorOps Collectd Fluentd

StatsD

New Relic Sumologic

ビジネス メトリクスやカスタマイズされたインフラストラクチャメトリクスを収集、格納、可視化、 アラート通知

一般的なアプリケーションは、実行タスクのパフォーマンスを報告するために、その分野固有のメトリクスをいくつか生成します。生成されるメトリクスは、ビジネス関連のメトリクス(カート内のアイテム、成立したクレジットカード取引、チェックイン、表示された広告など)から、インフラストラクチャ関連のメトリクス(生成されたドメイン数、外部 Web サービスに対するコール数など)まで、多岐にわたります。このデータは、アプリケーションを正常稼働する上で非常に重要な役割を果たし、社内データベースやさらに堅牢なソリューションを実装する際にも必要になります。Datadog が備える堅固なデータ収集機能では、収集したカスタム情報をそのままグラフ表示やアラート通知に利用したり、他のインフラストラクチャやアプリケーションデータと組み合わせて複合メトリクス、グラフ、アラートを作成することができます。これまで収集不能だったデータや、サポートが煩雑なポイントソリューションで収集しなければならなかったデータを、Datadog に送信することが可能になります。

Page 10: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

監視の統合 datadog.com

柔軟なデータ収集 /共有機能で ワークフローのギャップを埋める

Datadog は、優れた堅牢性を発揮するデータ収集標準を提供しています。インフラストラクチャメトリクス、ログ、離散事象、アプリケーショントレースを収集する 250 種類以上のベンダーインテグレーションに加えて、API、SNMP、WMI、JMX、StatsD、FluentD、CollectD を介したデータ収集にも対応しています。その結果、ほぼすべてのアプリケーション関連データの収集が可能になります。収集されたデータは、Datadog が提供する幅広いウィジェットを使ったグラフ表示や、アラートトリガーで発生する条件に基づいた通知設定に使用することができます。アプリケーションデータを創造的な方法で処理する Datadog の機能は、これまで可視化やシステム接続が不可能だったために発生していたワークフローのギャップを埋め、さまざまなユースケースへの対応を可能にします。Datadog は、従来の IT では想定されていなかった領域の「モニタリング」を実現するソリューションを提供します。

Datadog は、社外のステークホルダーにも知見とデータを提供できる優れた機能セットを備えています。読み取り専用のダッシュボードにパブリック URL からアクセスできる機能や、カスタマイズ可能なアラート通知パスと Web フックを統合し、事前定義された自動アクションをトリガーする機能など、柔軟なデータ共有と、組織の規定に沿ったアクセス制御を両立します。

Page 11: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

DevOps datadog.com

Datadog ソリューションの概要

DevOps

何千人ものユーザーに愛され信頼される Datadog

パフォーマンスをおとすことなく 導入作業を加速

DevOps のカルチャーを牽引する要素の 1 つに、イノベーション推進と市場競争力の強化に向けた開発サイクルの短縮があります。開発サイクルを短縮するためには、変更がエコシステムに与える影響を的確に把握する必要がありますが、エコシステムでは複数のマシン、ツール、サービスが相互に関連しており、ますます複雑になっています。変化を続ける複雑な環境において、円滑かつ信頼できる方法で実装を可能にするのが、Datadog の統合監視プラットフォームです。

- あらゆるインフラストラクチャを一元的に可視化:Datadog では、アプリケーション、データベース、ホスト、その他のサポートシステムから収集されるパフォーマンスデータが正規化されます。エンジニアチームは、インフラストラクチャの負荷テストを行うことで、インタラクションの動作を把握して必要な変更を行い、導入作業に備えることができます。

- エンドツーエンドのシステムの可視化:相互接続されたシステム間のボトルネックを検出する機能として、Datadog はアップストリームからダウンストリームへのシステム入出力を可視化します。サービスの遅延など、さまざまな指標に関してアラート通知を行うことにより、リソースの制限や特定が難しい構成上の問題を切り分けます。

Page 12: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

DevOps datadog.com

- プロアクティブなキャパシティプランニング:Datadog の予測アルゴリズムは、複数のシステムを対象に、次の四半期以降にワークロードがどの程度増大するかを予測します。エンジニアチームは、豊富なデータ に基づいて、サービスやアプリケーションをサポートするサブシステムのキャパシティ拡張を計画できます。

単一プラットフォーム内で調整

綿密なアプリケーション設計には、さまざまなタイプのユーザー(プログラマー、プロジェクトマネージャー、バックエンドオペレーション、設計者、マネジメントなど)の協力が必要です。コラボレーションと使いやすさを重視する Datadog は、複数のチーム間やチーム内でのリアルタイム情報共有を可能にします。

- すべてのチームが主要メトリクスを共有:Datadog は、アプリケーション遅延時間、ログに記録されたエラー、システムレベルの CPU 負荷、サーバー稼働時間など、幅広いイベント、ログ、メトリクスのデータをチャート化し、接続の問題を素早く特定します。

- 既存ツールと簡単に統合:Slack、Pagerduty、GitHub、Jenkins といった人気のワークプレースツールとの統合に対応し、既存プラットフォーム内のワークフローを妨げることはありません。

- あらゆるステークホルダーに共有できるダッシュボード:ダッシュボードは、パブリック URL で共有することが可能です。マネジメントや社外のステークホルダーなどのグループは、プラットフォームに参加しなくても重要な情報をリアルタイムで参照できます。

Page 13: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

DevOps datadog.com

先進的なクラウドテクノロジーへの移行をサポート

プラットフォーム、サービス、インフラストラクチャが拡大し複雑化する環境においても、テクノロジーの変化に後れを取ることなく、問題解決に最適なツールを導入することは、DevOps の重要な側面の 1 つです。Datadog は、最新テクノロジーへのスムーズな移行をサポートします。

- スタックのあらゆるレイヤーをサポート:250 種類を超えるインテグレーションは、データベース、プログラミング言語、CI/CD ツール、主要なクラウドプロバイダーを網羅しています。最新テクノロジーへのスムーズな移行を可能にし、既存のスタックに依存しません。

- コンテナとサーバーレス:Datadog は、コンテナ化された環境を可視化します。新たなコンテナを自動検出することで、盲点をなくします。また、Lambda や Fargate といった最先端サービスとの緊密な統合により、古いテクノロジーからの移行を容易にします。

- スムーズな移行:マイクロサービス、コンテナ、サーバーレスなど、新たなアプローチを使ったテクノロジーへの移行は困難なものです。Datadog は、スタック全体をシームレスに可視化するため、大規模な変更の前後を比較するパフォーマンスベンチマーキングが容易になり、トラブルシューティングの盲点を排除し ます。

AWS AWS LAMBDA DOCKER KUBERNETES CHEF CLOUD FOUNDRY

GITHUB PAGERDUTY NGINX KAFKA POSTGRES PYTHON

開発 / 運用部門 向けの モニタリング機能を組み込み、 解決までの時間を短縮

DevOps には、解決時間の短縮やインシデント発生率の低下といったメリットがあります。ただし、このようなメリットを実現するには、開発部門と運用部門が同じビューでスタックを把握できる機能が必要になります。Datadog は、複数のモニタリングルールを 1 つのプラットフォームに融合することで、チーム間のコミュニケーションを推進します。

- 症状と根本原因を関連付ける:1 つのシステム内でメトリクスとイベントを重ね合わせ、パフォーマンスの問題とログ / トレースの切り替えをすばやく行うことで、トラブルシューティングにかかる時間を短縮します。

- プラットフォーム内のチャットとアノテーション:問題が検出されたら、開発チームと運用チームはアノテーション(注釈)を付け、メッセージを投稿します。これにより、プラットフォーム内の誰もが状況を把握できるようになります。

- 本格的な統合製品:単一エージェントのインストール、プラットフォーム全体で統合されたタグ構造、シングルクリックによる画面操作などを特徴とする Datadog は、メトリクス、ログ、トレースの統合によって完全な可視化を実現します。

Page 14: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

IoT datadog.com

Datadog ソリューションの概要

IoT

何千人ものユーザーに愛され信頼される Datadog

IoT デバイス フリートのパフォーマンスと信頼性を確保

IoT デバイスでは、管理、信頼性、パフォーマンスを監視することが求められます。IoT デバイスは、大量のデータを送信します。特に、物理的に分散したさまざまな場所に多数の IoT デバイスが設置されている場合、送信されるデータは膨大な量になります。さらに、IoT デバイスは常に流動的です。アップデート、オフライン化、そしてオンライン化が予告なく頻繁に発生するのが一般的です。その結果、このようなエンドポイントからすべてのデータを収集し、正規化して分析可能な状態にまで処理することは、技術的に非常に難しい課題です。

さらに、デバイスは中央の Web アプリケーションと連携しています。したがって、システム全体の稼働状況を把握するには、デバイスのパフォーマンスと Web アプリケーションメトリクスに関連付ける必要があります。Datadog は、1 つの統合プラットフォーム上で、Web アプリケーションとデバイスフリートの両方からメトリクス、ログ、アプリケーショントレースを取り込み、使用可能な状態にします。データはすべて、共通のメタデータ定義をもとに相互に関連付けられているため、比較や相関を簡単に実行できます。IoT デバイスを稼働するエンジニアリングチームは、次の機能を実行できます。

Page 15: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

IoT datadog.com

- 分析用にあらゆるパフォーマンスデータを収集する:Datadog は、デバイスのオペレーティングシステムに依存することなく、デバイスからデータを収集できます。また、デバイスが転送するカスタムデータや独自仕様のデータの収集にも対応します。

- デバイスのサブグループを比較および関連付ける:デバイスをグループ化またはサブグループに分割することで、地域、デバイスのバージョン、顧客ごとのパフォーマンスを把握します。任意の数のメタデータ属性の組み合わせや除外にも対応しているため、非常に高い精度でのデータ収集が可能です。

- きめ細かいデバイス粒度でアラート通知と調査を実行:Datadog の堅牢性に優れたアラート機能では、デバイスのサブグループはもちろん、Web アプリケーションとデバイス間のトリガーや状態を組み合わせることができます。

Android、Linux、ARM、SNMP などをサポート

IoT デバイスのコンピューティングハードウェアでは、非常に幅広いオペレーティングシステムが使用されています。Datadog は、幅広い IoT デバイスのサポートとデータ収集に対応しています。Android、Linux、ARM デバイスにインストールでき、SNMP、StatsD、JMX、WMI、API を介したデータ収集が可能です。Datadog エージェントは、オペレーティングシステムに依存することなく、ほぼすべての OS 環境に簡単にインストールでき、あらゆるデバイスからデータを収集します。

Android ARM Linux

デバイスと Web アプリケーションから収集したメトリクスを分析、比較、集計

IoT デバイスは単独では機能しません。IoT デバイスの制御やデバイスの挙動に応答する Web アプリケーションと連携し、データを送受信します。Datadog は、Web アプリケーションとデバイスから収集したデータを 1 つのプラットフォームに格納し、共通のメタデータ群に基づいてデータセットを関連付けます。Webアプリケーションとデバイスのメトリクス、ログ、アプリケーショントレース、離散事象はすべて同じプラットフォーム上で収集されるため、分析や比較はもちろん、集計して複合的なグラフ、メトリクス、アラートを作成することも可能です。

Page 16: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

IoT datadog.com

カスタムデータと独自仕様データを収集

多くの IoT デバイスは、ユーザーの要件に基づいて設計されています。したがって、特定のデバイスやデバイスクラスに合わせて変更やカスタマイズが行われている場合があります。Datadog は、デバイスのカスタムデータフィールドを収集するカスタムメトリクスを、無制限に作成および取り込むことができます。

Datadog は、IoT デバイスフリートの稼働に使用されるクラウドサービスを標準でサポートします。IoT デバイスフリートの稼働に必要なパブリッククラウドサービスと、IoT デバイスが通信する Web アプリケーション向けにベンダーがサポートするインテグレーションに加えて、Datadog は AWS とのインテグレーションを提供しています。

AWS IoT Core

デバイス フリートから収集したデータを集計、分割、分析

一般的に IoT デバイスは、デバイスフリート全体としての評価が必要になります。また、複数のデバイスが 1 つのタスクで協力し、分散システムとして機能することもあります。さらに、バージョン、OS、顧客や地理的な場所ごとにデバイスをグループ化し、パフォーマンスの相互比較が必要になる場合もあります。IoT デバイスは無数に実装されることが多く、デバイスから送信されるパフォーマンスデータの量も膨大になるため、その処理には大規模なシステムが必要になります。また、すべてのデータを、カーディナリティの高いメタデータと関連付けなければなりません。したがって、複数のデバイスから収集したデータを集計し、素早く評価する作業は非常に困難です。Datadog の設計では、デバイスデータ量とカーディナリティが無限に増加することが想定されています。取り込まれたデータは、次のような用途に使用できます。

- 集計データの分析:複数のデバイスが連携して 1 つのタスクを実行する場合、複数のデバイスのデータを集計することで、サービスの全体像を把握します。

- 無制限のメタデータ属性に基づいた分割:複数のメタデータ属性に基づいてアラートとグラフを定義し、精度の高いデータセットを作成します。データのサブセットを除外することも可能です。

- グループ間の相互比較:複数のデバイスのグループを制限なく作成し、相互に比較することが可能です。たとえば、地域ごとのデバイスパフォーマンスを比較し、1 つのグラフにまとめて表示できます。

- 全体を包括的に評価:Datadog では、数万単位のデバイスが送信したパフォーマンスメトリクスを 1 つの画面で評価し、デバイスフリート全体を概観できます。この画面から、特定のデバイスで発生している問題をすぐに識別できます。

Page 17: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

IoT datadog.com

デバイスに影響を与える問題を きめ細かい粒度でアラート通知

デバイスが分散した環境に設置されている場合、難しい課題はアラート通知です。膨大な数のデバイスでアラートと通知の条件を設定しなければならず、アラートでは適切な条件を設定する必要があります。条件が緩すぎると誤検知が大量に発生し、深刻な問題が埋もれてしまい、識別できなくなります。また、監視するデバイスの数も課題の 1 つです。複数のデバイスが連携する環境では、複数のデバイスの障害が絡み合って問題が発生する場合、アラート設定は非常に難しくなります。堅牢性に優れた Datadog のアラート機能では、デバイスのサブセットに対してアラート条件をきめ細かく設定できます。次のような設定が可能です。

-「送信データなし」をアラートで通知:デバイスの障害や接続不良が原因でデバイスからのデータ送信が停止した場合でも、Datadog はアラートを通知できます。

- 機械学習をベースにしたアラート通知:Datadog は、機械学習アルゴリズムをベースにしたアラートを実装しています。拡張を続ける大量のデバイスフリートを監視し、人間の目では識別が難しい問題や識別不能な問題を検出します。6 カ月間の履歴データに基づいて、デバイスフリートの外れ値と異常値を検知します。また、最新の履歴データから今後のパフォーマンスメトリクスを予測し、しきい値に基づいてアラートを設定します。

- デバイスグループまたは個々のデバイスの状態に基づいてアラート通知:Datadog では、個々のデバイスの状態、または複数のデバイスの集計データに条件を適用し、アラートを送信する設定が可能です。また、複数のメタデータ属性に基づいて、デバイス単位またはグループ単位で集計から除外することも可能なので、アラートの適用対象を正確に定義できます。

- デバイスをアラートに自動追加:デバイスを Datadog に接続すると、メタデータで定義した条件に基づいて、適切なアラートが自動的に適用されます。デバイスの数が増大する環境でも、無理なくアラートを運用できます。

- 条件付きロジックやトリガータイプを使った複合アラートに対応:Datadog では、特殊な条件に対応する複合アラートで作成できます。複合アラートでは、トリガータイプを条件付きロジックで指定し、複数のトリガーをまとめて評価できます。すべての条件に合致した場合のみ、アラートが通知されます。トリガータイプには、メトリクスのしきい値、イベント、ログ、ネットワーク、プロセス、機械学習による外れ値 / 異常値 / 予測値があります。

アプリケーションプロセスに関与したデバイスを特定

問題の調査やアプリケーションの動作確認では、アプリケーションの処理に関与するコンポーネントを個々に見極めることが重要です。というのは、問題の根本原因は、アプリケーションスタックにあることが多いためです。ところが、アプリケーションプロセスにどのデバイスが関与したかを特定する作業は、非常に難しくなります。 無数のデバイス上で稼働する Web アプリケーションがデータを送受信していることがあり、すべてのアプリケーションプロセスで監査証跡が作成されているとは限りません。

Page 18: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

IoT datadog.com

また、デバイスのログが収集されないケースや、収集されたとしてもサーバー側のパフォーマンスデータとのマージは難しくなります。 Datadog のログ機能は、アプリケーションが生成したログをすべて取り込みます。インデックス付けの対象になっていない場合はアーカイブを行い、アーカイブ後に必要に応じてインデックス付けできます。これにより、アプリケーションの操作に関与した特定のデバイスの処理が記録され、アプリケーションプロセスを分析することですばやく特定することが可能になります。

IoT フリート全体を リーズナブルにサポート

Datadog は、サーバーと IoT デバイスの違いを重視しており、IoT デバイスフリート全体を Datadog でサポートできる料金プランを提供しています。

Page 19: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

AIOps datadog.com

Datadog ソリューションの概要

AIOps

何千人ものユーザーに愛され信頼される Datadog

大規模拡張を 容易にする 機械学習

プライベートクラウド、パブリッククラウド、ハイブリッドクラウド上でホスティングされているアプリケーションは、非常に動的な特徴を持っています。ワークロード要件に応じて、常にスケールアップ / スケールダウンが行われます。それに伴い、ホスト、コンテナ、エンドポイントなど、モニタリングが必要なコンポーネントが継続的に追加され、その数は爆発的に増加するケースもあります。短期的には、新たなコンポーネントを管理およびモニタリングするときに多くの時間はかからないかもしれませんが、クラウド環境は拡大を続け、ますます複雑になっていきます。このような環境を的確にモニタリングするために、Datadog は機械学習をベースにしたモニタリング機能を提供しています。個々のアプリケーションコンポーネントとその基盤となるインフラストラクチャを 24 時間連続でモニタリングでき、人間には識別できない問題を未然に検出します。

- アプリケーション全体の問題を自動検出:Datadog は、ダッシュボードやアラート設定の有無に関係なく、あらゆるアプリケーションメトリクスをモニタリングし、潜在的な問題が検出されると即座に通知を行います。

Page 20: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

AIOps datadog.com

- 手動では見逃してしまう異常値や外れ値を特定:環境の拡大に伴い、分析が必要なデータ量も急増します。膨大なデータが収集されると、異常を示すメトリクスや他のコンポーネントから逸脱したメトリクスがあったとしても、埋もれてしまう可能性があります。Datadog の機械学習機能は、不要な情報を排除し、問題を的確に識別します。

- 将来の予測:Datadog は、メトリクスの将来的な増加や挙動を予測します。季節的な要因を考慮し、キャパシティ不足の可能性がある場合や、最近の履歴とは異なるトレンドの兆候が検出された場合には、アラートで通知します。

問題を自動検出 過去何十年にわたり、ダッシュボードのチェックやアラート設定は問題検出の方法として使用されてきました。ところが、発生する可能性のあるすべての問題にアラートを設定することは不可能です。特に、動的に自動拡張するクラウド環境では、アプリケーションやインフラストラクチャ内の思いも寄らない領域から問題が発生することがあります。潜在的な問題を確実に検出する機能として、Datadog が提供するのが Watchdog です。これは、機械学習を活用してアプリケーションパフォーマンスの問題を自動検出するエンジンであり、手動によるセットアップや構成は必要ありません。検出された異常や潜在的な問題はすべてストーリーラインに表示され、アプリケーション領域には警告アイコンが示されます。これにより、エンジニアは対応が必要な領域を簡単に見極めることができます。

- アプリケーションのあらゆる側面を 24 時間 365 日モニタリングする:Watchdog は、マイクロサービスでの遅延時間の急増、エンドポイントでのエラー率の上昇、クラウドプロバイダーのゾーン内で発生したネットワーク障害など、データから問題を自動的に検出します。

- 状況をわかりやすく説明:Watchdog は、影響を受けるリソース、リソースの場所、影響の継続時間を表示します。

- 潜在的な問題をドリルダウン:Watchdog イベントでは、各メトリクスの最新トレンドと、影響を受けたサービスやエンドポイントに関するパフォーマンスメトリクスのスナップショットが表示されます。ストーリーには、サービス、エンドポイント、SQL クエリ、可用性ゾーンについて、その時点での詳細情報を示すページへのリンクが設置されています。詳細ページでは、各サービスやリソースのパフォーマンス統計データ(スループット、エラー、遅延など)が自動的に集計されます。

Page 21: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

AIOps datadog.com

高度な予測機能でキャパシティの問題を回避

パフォーマンスの問題をはじめとするインシデントの大部分は、アプリケーションやインフラストラクチャがワークロードの増加に対応できなかったことが原因で発生します。このような問題は、構成変更やキャパシティ拡張によって簡単に回避できます。ところが、問題がいつ発生するのかを予測することは難しく、成長の速度が変化している環境やサービスの挙動が以前とは大きく異なる環境での予測はさらに困難になります。キャパシティの問題を事前に通知するために、Datadog は予測アルゴリズムを採用しています。このアルゴリズムは、機械学習によってメトリクスの変化を継続的に評価し、将来的なメトリクス値を予測します。メトリクス値が急変すると、アルゴリズムは最新の挙動を自動的に解析し、信頼度の高い予測を行います。

- 予測トレンドをビジュアル表示:Datadog の機械学習アルゴリズムが予測したメトリクス値と、潜在的な変動幅が表示されます。

- 予測された問題をアラート通知:潜在的な問題の通知では、どの程度事前に通知を行うかを指定できます。

- シーズナリティのある要因を考慮:メトリクスの予測では、季節的な要因が考慮されます。アルゴリズムは、時刻や曜日によるメトリクスの変動パターンを考慮して予測を行います。

機械学習で 外れ値と異常値を検出

最新のクラウド環境やアプリケーションには動的な特徴があり、メトリクスの数も常に変化しています。その結果、異常な挙動を示したり、類似したメトリクスから大きく外れたメトリクスがあったりしても、人間の目では捕捉できない場合が多々あります。Datadog では、異常値と外れ値の両方を検出することが可能です。パフォーマンスの履歴データをもとに、メトリクスの現在の挙動の変化を識別し、個々のメトリクスや集計値が他と異なる場合には外れ値として検出します。この 2 つの検出機能では、機械学習を搭載することで、時として急激に拡張するクラウド環境で発生するメトリクスの問題の識別を可能にし、これまで手動で行ってきたメトリクス管理の手間と時間を省くことができます。Datadog の異常値 / 外れ値検出機能には、次のような特徴があります。

- シーズナリティのある要因を考慮:異常値検知では、過去 6 週間のパフォーマンスを学習し、メトリクスの季節的な変動も考慮されます。このアルゴリズムは、時刻や曜日によるメトリクスの変動パターンを識別します。

- アラート通知とダッシュボードに対応:外れ値と異常値の検出は、ダッシュボードとアラート通知に対応しています。ダッシュボードに追加することで、「正常値」の範囲を簡単に確認できます。また、外れ値や異常値が検出された時点でアラートを送信することも可能です。

- メトリクスごとにパラメーターを微調整:Datadog の異常値 / 外れ値検知では、使用するアルゴリズムをユーザーが選択できます。また、メトリクスで使用するアルゴリズムごとにパラメーターを設定することも可能なので、検出方法をメトリクスごとに調整できます。

Page 22: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

ビジネスアナリティクス datadog.com

Datadog ソリューションの概要

ビジネスアナリティクス

何千人ものユーザーに愛され信頼される Datadog

アプリケーションベースのビジネスメトリクスを収集および分析し、アクションにつなげる

売り上げを生むアプリケーションには、たったいまどうなっているか、問題がおきていないかどうかを把握、 監視するために予算、時間、労力が費やされます。ビジネスインテリジェンスに投資しているにもかかわらず、精度の高い重要なビジネスアナリティクスデータをアプリケーションから取得しようとすると、死角が生じることが多くあります。たとえば、「購入」ボタンのクリック、ホテルや旅行のチェックイン、広告インプレッションを追跡するには、コードレベルのインストルメンテーションが必要になりますが、ビジネスインテリジェンスシステムにこのような機能はありません。

アプリケーションから収集されるビジネスメトリクスから、トランザクションレベルのビジネスインサイトを得ることができます。また、ビジネスメトリクスは。アプリケーションやインフラストラクチャのパフォーマンス低下の影響を受けます。したがって、IT がビジネスの問題の根本原因であるかどうかを見極めるには、ビジネスメトリクスと IT パフォーマンスデータを緊密に連携する必要があります。さらに、ビジネスに影響を及ぼす問題が発生すれば、刻々と売上損失や顧客満足度の低下が進むため、できるだけ迅速に問題を特定することが非常に重要です。

Page 23: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

ビジネスアナリティクス datadog.com

堅牢性と拡張性を備えたインサイトをアプリケーションベースのビジネスデータから取得し、ビジネス部門に提供するために、Datadog は簡単にセットアップできるコードレベルのインストルメンテーションを幅広いプログラミング言語で提供します。メトリクスは、セキュアな DR 対応のストレージに格納されます。ビジネスメトリクスのインストルメンテーションは、ユーザーによる機能拡張に対応しており、カスタムメトリクスを任意のフォーマットや頻度で収集することが可能です。カスタムメトリクスにも、アプリケーション / インフラストラクチャーデータと共通のメタデータの分類と時間スケールが適用されるため、ビジネスメトリクスと IT メトリクスを同じ基準で評価し、Datadog アカウントを使用するすべてのチームメンバーがアクセスできます。ビジネスメトリクスを収集することで、特に次のようなニーズを満たすことができます。

- アプリケーションベースのビジネスメトリクスを可視化し、分析する:Datadog が提供する幅広いダッシュボードウィジェットを、収集したカスタムメトリクスに適用できます。メタデータでタグ付けされたカスタムメトリクスは、分割、集計、除外によって明確に絞り込むことが可能です。

- 幅広い条件に基づいてリアルタイムでアラート通知:Datadog は、幅広いアラートトリガーを提供しています。これには、機械学習ベースのトリガーや、複数のアラートと条件付きロジックを組み合わせてきめ細かい条件を指定する複合アラートなどがあります。データが取得されると、アラートはリアルタイムでトリガーされ、カスタムメトリクスのデフォルト設定がわずか数秒で適用されます。

- ビジネス /IT パフォーマンスデータを比較し相関する:Datadog は、IT パフォーマンス / ビジネスメトリクスを同時に収集します。グラフやダッシュボードでの比較や根本原因分析により、一方のメトリクスに含まれるイベントが他方に影響を及ぼしているかどうかを確認できます。さらに、IT とビジネスのメトリクスを使用して複合的な KPI を作成することも可能です。

- ビジネスメトリクスのエクスポート:Datadog は、パブリックの読み取り専用ダッシュボードの作成、アカウントのフェデレーション、親アカウントでのデータ統合、API および SNMP を介したデータエクスポートに対応しています。

- 1 年にわたってビジネスメトリクスを保管し、時間ベースの比較を実行:Datadog は標準で、詳細なビジネスメトリクス(さらに、インフラストラクチャのヘルスメトリクス)を 15 カ月間保管します。保管期間をこれよりも長く設定することも可能です。

Page 24: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

ビジネスアナリティクス datadog.com

アプリケーションのコードからビジネスメトリクスのデータを収集

多くの企業が、課金処理、インベントリ管理、その他の基幹ビジネスシステムのデータ統合に特化したビジネスインテリジェンスシステムを導入しています。ビジネス部門はこのようなシステムを活用し、サプライチェーンや社内プロセス、さらには財務会計のコンテキストからインサイトを抽出しています。ところが、このようなツールでは、Web アプリケーションの売上創出につながる活動を示すメトリクスを取得できません。必要なビジネスデータを収集するには、アプリケーションのコードを操作する必要があります。たとえば、ボタンがクリックされたタイミングや、ボタンで制御したフィールド内の値のインストルメンテーションが必要になります。このようなギャップを埋めるためにさまざまなオープンソースツールが提供されていますが、ディザスターリカバリやセキュリティ保護機能が欠落しているだけでなく、手間やコストがかかり、大規模実装は困難です。

Datadog は、コードレベルのデータの取り込みを標準実装しているため、すぐにビジネスメトリクスを収集できます。この機能は簡単に設定でき、アプリケーションが送信する独自仕様のデータの収集にも柔軟に対応できます。Datadog では、メトリクス、イベント、タイムスタンプの収集が可能です。このデータは、Datadog エージェントが収集したメタデータで拡充されます。これによって、コードが稼働するホストやコンテナといった詳細情報が提供され、高度なクエリの実行が可能になります。Datadog のソリューションは無限に拡張できる特長があります。データが大量に生成され、アプリケーションの成長が爆発的に加速した結果、膨大な量のメトリクスが生成されたとしても、データを継続して収集し、精度の高いデータを 15 カ月間保存します。

ログイン

ショッピングカート内のアイテム数

ログイン回数 旅行の回数 広告収入

ビジネス メトリクスとIT パフォーマンスデータを比較、 相関、集約する

企業では、アプリケーションとインフラストラクチャの稼働状態を監視する IT システムと、ビジネスメトリクス向けのビジネスインテリジェンスツールを導入するのが一般的です。この 2 つのツールが統合されることはほとんどありません。ところが、サービス中断、想定外のリソース使用率の急増、遅延時間の延長といった ITパフォーマンスの問題は、ビジネスパフォーマンスに多大な影響を与えます。このような場合には、ビジネスメトリクスの変動がアプリケーションや基盤インフラストラクチャの問題に起因しているのか、他の原因を探る必要があるのかを見極めることが重要です。

Datadog は、アプリケーションベースのビジネスメトリクスと、幅広いパフォーマンスデータの両方をアプリケーションから収集します。簡単にインストールできる 250 種以上のベンダーインテグレーションは、インフラストラクチャのメトリクス、アプリケーショントレース、ログを収集します。次に、ビジネスメトリクスとIT パフォーマンスデータは、共通のメタデータタクソノミと時間スケールに基づいてマッピングされます。これにより、ビジネスアナリティクスのメトリクスと IT パフォーマンスメトリクスの比較はもちろん、集計も可能になります。さらに、次のような操作を実行できます。

- ビジネス /IT パフォーマンスデータを比較し相関する:エンジニアとビジネスステークホルダーは、ビジネスの原因/結果シナリオを評価することで、IT システムのパフォーマンスの変化や設定変更のすぐ後にビジネスメトリクスへの影響が発生したかどうかを識別します。Datadog のダッシュボードでは、ビジネスデータと IT パフォーマンスデータを柔軟な方法で比較することができます。

- ビジネスアナリティクスと IT パフォーマンスデータから複合アラートを作成:ビジネスメトリクスには IT 以外にもさまざまな要因が影響を与えるため、IT に関する要因であることを切り分けるには、さらなる評価方法が必要になります。Datadog の複合アラートとは、複数のデータソースのアラートトリガーと条件付きロジックと組み合わせる機能です。複合アラートを設定すると、指定したシナリオに完全一致した場合にのみアラートがトリガーされるため、誤検知を排除し、対処が必要な問題を絞り込むことができます。

Page 25: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

ビジネスアナリティクス datadog.com

- 複合 KPI メトリクスを作成:ビジネスメトリクスと IT パフォーマンスメトリクスが緊密に連携されていると、複数のメトリクスを組み合わせて複合的な KPI を作成できます。たとえば、デジタル広告プロバイダーは、表示されるインプレッション数と遅延時間から、インプレッションあたりの平均遅延時間というメトリクスを計算できます。競争の激しい市場で広告を提供し売上を創出するには、このメトリクスを所定のレベルに維持することが非常に重要です。また、複数のメトリクスの算術処理にも対応しています。作成された複合メトリクスは、Datadog の幅広いウィジェット(緑 / 黄 / 赤でのクエリ値表示、しきい値に達したことを通知するアラート設定など)と組み合わせることで、グラフ表示できます。

アプリケーションベースのビジネスメトリクスを、 リアルタイムで確実にアラート通知

アプリケーションから収集したビジネスメトリクスを活用できたとしても、数時間から数日の遅延が発生するのが一般的です。これは、ビジネスデータの処理後にデータウェアハウスに送信してから、ビジネスインテリジェンスツールでアクセス可能な状態になるまでの遅延時間です。その間、ビジネスレベルのデータから問題点を識別できない状態になります。また、データが分析可能な状態になっても、問題の識別、アラートのトリガー、アラートの送信先の識別を行う機能を備えたツールが必要になります。このようなツールがなければ、売上に影響を及ぼす問題が発生しても、顧客からの苦情や月末の決算で初めて気が付く、という状況に陥りかねません。

Datadog のアラート機能は、ビジネスメトリクスに発生した問題をリアルタイムで通知します。Datadog には、次のような特徴があります。

- 秒単位の粒度:Datadog のデータ収集間隔は、デフォルトで 15 秒です。1 秒単位の収集にも対応しています。Datadog のアラートで検知された問題は、このように高い粒度で評価された後、リアルタイムで通知されます。

- 機械学習ベースなど、幅広いアラートを提供:Datadog は、ビジネスメトリクスを処理して問題の有無を判断するために、数々のトリガーを用意しています。たとえば、メトリクスの変化率やしきい値に基づくアラート、特定イベントに基づくトリガー、複数のアラートと条件付きロジックを組み合わせた複合メトリクス、機械学習を使った外れ値 / 異常値検知(過去 6 週間のデータを「学習」して外れ値と異常値を予測)などがあります。

- 優れた堅牢性を備えるルーティング機能:Datadog では、アラートの通知先となる担当者やグループを的確に指定できます。問題の通知先として、ユーザー名とメールアドレスを入力することが可能です。また、PagerDuty、OpsGenie、VictorOps、Slack、Campfire、Zendesk、ServiceDesk、Jira といったサードパーティシステムにアラートを送信することで、ユーザーの修正作業をサポートできます。これ以外にも多彩なルーティングが可能であり、SNMP や API を介したアラート送信にも対応しています。

Page 26: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

ビジネスアナリティクス datadog.com

- 変数とテンプレートを使ったアラート説明テキスト:ビジネスメトリクスを生成するアプリケーションが稼働しているのは動的なサービスをベースにしたインフラストラクチャであるため、トラブルシューティングのきっかけになる重要なデータも常に変化しています。さらに、最新のアプリケーションは非常に複雑であり、問題の発生場所を特定する作業も困難になります。Datadog のアラートで送信するテキストは、テンプレートや変数作成に対応しています。テキストから、アプリケーションが実行されていたコンテナや、サーバーのバックエンドで稼働していたデータベースのバージョンなど、アラートがトリガーされた状況を説明する情報を取得することが可能です。

複数の ビジネスメトリクス システムを安全かつ信頼できる方法で統合

複数のチームがアプリケーションからビジネスメトリクスを収集する場合、データを可視化する方法として、それぞれが異なる(オープンソースの)システムを構築することがよくあります。このようなシステムは、異なるビジネスデータを格納するつぎはぎ状態となり、相互接続がないため、異なる方法でデータを収集します。標準化されていないため、たとえ 1 つのアナリティクスプラットフォームに統合されているとしても、データの結合は困難または不可能です。また、中央の IT 部門の管轄外に実装されていることが多いため、誤ったセキュリティ /DR プロトコルに沿って設定が行われている場合や、機密性の高いデータの流出や侵害につながりかねない脆弱性が放置されている場合もあります。

Datadog があれば、分散したデータソースからビジネスデータを取得し、簡単に統合することができます。複数のシステムへと転送されたデータをミラーリングして Datadog に送信することにより、レガシーシステムをそのまま使用しながら、データを中央のデータストアで一元管理することが可能です。Datadog に格納されたデータは、共通のメタデータタクソノミにマッピングされ、共通の時間スケールで正規化されるため、同じ基準で比較することができます。さまざまなチームが収集したビジネスメトリクスをダッシュボードとアラートで集計、関連付け、比較することにより、これまでサイロ化していたデータを包括的な視点から把握することが可能になります。SOC 2 認定と業界をリードする DR 機能も、Datadog の重要な特徴です。Datadog に送信されたデータは、非常にセキュアな方法で保存され、堅牢な方法でバックアップされます。

ステークホルダーをビジネスメトリクスにつなぐ

Datadog は、アプリケーションから収集したビジネスメトリクスデータを、適切なステークホルダーが簡単、迅速、安全に共有できる環境を整えます。Datadog アカウントのメンバー全員が、そのアカウントで収集されたデータをすべて利用できます。したがって、アカウントのメンバーは、自分のチームや他のチームのシステムからビジネスメトリクスデータを取り出し、ダッシュボードやアラートで使用することが可能です。また、次のように、アカウントに所属しないステークホルダーのデータアクセスを制御する機能も備えています。

Page 27: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

ビジネスアナリティクス datadog.com

- 読み取り専用のダッシュボードを公開:Datadog では、読み取り専用のダッシュボードをパブリックで共有できます。このダッシュボードはリアルタイムで更新され、他の Web ページに埋め込むことも可能です。公開されるダッシュボードの URL は、ランダムに生成された文字で構成されます。したがって、このダッシュボードを使用するには、リンクを共有する必要があります。

- 親子アカウントのフェデレーション:Datadog は、単一の親アカウントが制御を行うアカウントフェデレーションに対応しています。子アカウントである各部門は自由にデータを共有できます。一方で、中央の IT 部門やその他のステークホルダーは、子アカウントからデータを取得することが可能です。

- 優れた堅牢性を発揮するサードパーティシステムへのデータエクスポート:Datadog では、外部システムにデータを転送することが可能です。データのエクスポート先は、チケット、チャット、アラート集計システムなど、ワークフローの完了にデータを必要とするシステムです。独自仕様のシステムについては、API や SNMP を使用したエクスポートが可能です。

Page 28: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

金融サービス datadog.com

Datadog ソリューションの概要

金融サービス

何千人ものユーザーに愛され信頼される Datadog

ミッション クリティカルな FinTech アプリケーションの 信頼性を向上

リテールから投資銀行までの幅広い金融機関が、Web アプリやモバイルアプリのホスティングにパブリッククラウドとプライベートクラウドを利用するようになっています。このような金融機関は、クラウド環境への移行を通じて、最先端のテクノロジーエクスペリエンスを顧客に提供しようとしています。小切手の現金化、請求書の支払、株式取引など、優れた顧客エクスペリエンスを提供できるかどうかは、テクノロジーの信頼性と安定性にかかっています。パフォーマンスが低ければ顧客満足度は低下し、そのサービスや金融機関は信頼を失い、顧客ニーズを満たす他の金融機関への乗り換えが起こります。また、法律上の深刻なリスクにつながる可能性もあります。たとえば、証券取引をサポートするアプリケーションに遅延が発生すれば、多額の損失や契約不履行が発生しかねません。Datadog があれば、金融機関のリーダーは、最も重要度の高いミッションクリティカルなアプリケーションの稼働状態を把握することによって SLA と KPI を達成し、顧客に影響が及ぶ前に問題を特定できます。

- 精度の高い問題検知:アプリケーション遅延時間の増加とホスト CPU など、アラートの条件を組み合わせることでノイズや誤通知を低減します。

Page 29: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

金融サービス datadog.com

- パフォーマンス低下を予測:Datadog の予測アルゴリズムは、複数のシステムの履歴データから「学習」し、時間経過に伴うワークロードの増加を予測します。エンジニアチームは、豊富なデータに基づいてリソース拡張を計画できます。

プラットフォームの モダナイゼーションに失敗するリスクを低減

スタートアップや FinTech といった破壊をもたらす企業に対抗するために、銀行や金融機関は新たなテクノロジーエクスペリエンスやプロセスによる IT 運用の最新化に取り組んでいます。このような金融機関は、クラウドプロバイダーの選定、コンテナ化、DevOps やアジャイルの採用、構成管理の自動化といったモダナイゼーションの取り組みを推進しています。新たなツールを学習しながらワークフローを実装する作業には、多くの時間を要します。移行に伴ってプロセスは変化します。また、新しいテクノロジーとの互換性を維持するために、アプリケーションの一部が再設計されることもあります。このようなモダナイゼーションを容易にするには、新しいテクノロジー、プロセス、他のプラットフォームを可視化する機能が必要になります。Datadog は、開発/ 運用チームに次の機能を提供します。

- 将来のニーズにも応えられるテクノロジースタック:Datadog は、最新テクノロジーとの統合に継続して取り組んでおり、すぐに使えるパフォーマンスメトリクスやダッシュボードを提供します。

- 一時的な動的コンテナの自動追跡と捕捉:Datadog の自動検知機能は、作成または削除されるコンテナと、そこで稼働するアプリケーションを自動的に検出します。この機能はオーケストレーションツールに依存しないため、ユーザーはコンテナ内のコンポーネントを常に確実に把握できます。

- 継続的なチーム間コラボレーション:HipChat、Slack、PagerDuty、ServiceNow といったコミュニケーション/通知ツールとの統合により、チームは、環境の変化、パフォーマンス、問題に関する情報を常に交換できます。

Page 30: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

金融サービス datadog.com

効率化と すばやいトラブル シューティングを可能にする 統合プラットフォーム

金融機関は、システムの最新化を進める一方で、重要なビジネスコンポーネントをサポートするレガシーインフラストラクチャーも運用しています。このハイブリッド環境では、それぞれ異なる要件に対応することが求められます。したがって、問題が発生すると、エンジニアチームは環境全体にどのような影響が及ぶのかを把握しなければなりません。データを一元化できれば、エンジニアチームと運用チームは、ツールの切り替えや余分な手作業から解放され、問題の検出とトラブルシューティングにかかる時間を短縮できます。Datadog は、次のような機能を提供します。

- 分散したデータソースからのデータ収集と集約:オンプレミス、クラウド、コンテナといったあらゆるアプリと環境から、イベント、メトリクス、トレース、ログなど幅広いデータを収集し、集約します。このデータは統合プラットフォームに格納され、グラフィック表示、解析、関連付けに利用できます。

- カスタマイズされたビジネスメトリクスの分析:顧客対応アプリケーションから、ビジネスメトリクスを収集して分析します。このデータを、ビジネス活動をサポートするアプリケーションインフラストラクチャーと関連付けることで、トラブルシューティングにかかる時間を短縮します。

メトリクス 可視化の 3 つの柱 トレース要求

ログ

セキュリティ / コンプライアンス規則に対応

Datalog のテクノロジーとプロセスは、金融機関に適用される厳格なセキュリティ / コンプライアンスガイドラインへの対応も可能にします。Datadog は、SOC 2 や GDPR といった数々の法規制へのコンプライアンス認定を取得しており、PII(個人を特定できる情報)を適切に処理します。さらに、Datadog とユーザー間で転送されるデータは TLS(Transport Layer Security)と HTTP Strict Transport Security でセキュリティ保護され、セキュアな対称暗号で暗号化された後、Amazon の厳格なセキュリティプロトコルに沿って AWS 上に保管されます。

Page 31: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

リテールと e コマース datadog.com

Datadog ソリューションの概要

リテールと e コマース

何千人ものユーザーに愛され信頼される Datadog

顧客の購買行動を分析する

オンラインショッピング増大や、高頻度で保存される単品管理、顧客のチェックアウトなど、アプリケーションからはさまざまなビジネスメトリクスが発生し、その全てを追跡するのはとても困難です。Datadog は、このようなデータを収集、ダッシュボードにわかりやすく表示し、顧客チェックアウトが異常に少ない場合などにアラート通知をだすことができます。それにより、特定のビジネスをサポートするアプリケーションやインフラストラクチャのパフォーマンスとの関連性を視覚化することができます。さらには、アナリティクス、ダウンストリームシステムのトリガー、技術的なトラブルシューティングのサポート、販売や顧客エクスペリエンスに影響を与える問題の早期の通知に活用できます。

Page 32: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

リテールと e コマース datadog.com

優れた顧客 エクスペリエンスを 提供する

オンラインのショップでも、実店舗でも、顧客とブランドとの相互関係は非常に重要です。低速な Web サイト、注文処理の問題、POS 端末の故障などは、顧客エクスペリエンスにマイナスの影響を与え、顧客の不満、売上やブランドイメージの低下へとつながりかねません。Datadog のソリューションには、次のような特徴があります。

- リアルタイムのアナリティクスとアラート通知により、Web ショップや実店舗の業務をサポートする IT システムの連続稼働を可能にします。

- アプリケーションレベルでログを記録および追跡することにより、新機能の開発と実装を加速します。

- ビジネスデータ / トランザクションを、ビジネス活動をサポートするアプリケーションインフラストラクチャと関連付けることで、トラブルシューティングの時間を短縮します。

季節性の イベントに備える

ブラックフライデー、サイバーマンデー、季節的なイベントは、リテールや e コマース企業の売上に非常に大きな影響を与えます。企業は、トラフィックや売上が急増するこのような期間にスムーズな顧客エクスペリエンスを提供できるように、エンジニアチームを強化する必要があります。Datadog は、リテール業界向けに次のようなサポートを提供しています。

- 前回の季節イベントをプレイバック: 詳細な履歴データが 15 カ月間保持されているので、前回のイベントの状況を「プレイバック(再生)」して確認できます。

- あらゆるインフラストラクチャを一元的に可視化:アプリケーション、データベース、ホスト、その他のサポートシステムから収集されるパフォーマンスデータは正規化されます。エンジニアチームは、インフラストラクチャの負荷テストを行うことで、あらゆるシステム間のインタラクションを把握して必要な変更を行い、イベントに備えることができます。

- 機械学習を活用して将来的なキャパシティを予測: Datadog の予測アルゴリズムは、複数のシステムの履歴データから「学習」し、次の四半期にワークロードがどの程度増大するかを予測します。エンジニアチームは、豊富なデータに基づいて、店舗をサポートするサブシステムのキャパシティ拡張を計画できます。

Page 33: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

リテールと e コマース datadog.com

予測不能な Web サイト ワークロードを 管理する

ソーシャルメディアでの口コミ投稿といった想定外のイベントが発生すると、Web サイトで対応しきれないほどの需要が突発的に発生することがあります。トラフィックの急増に Web ショップが容易に対応できるように、Datadog は次のような技術サポートを提供しています。

- オートスケーリングへの対応:オートスケールしたホストもモニタリングの対象として自動登録します。ホストは、アラート通知とダッシュボードにも自動的に追加されます。

- 機械学習による自動検出:Datadog の機械学習機能は、システムのパフォーマンスが過去の同じ曜日 / 時刻のパフォーマンスと異なる場合、これを自動検出します。問題の兆候を示す動作パターンを簡単に把握でき、問題を未然に防ぐことができます。

- システムをエンドツーエンドに可視化:相互接続されたシステム間のボトルネックを検出する機能として、Datadog はアップストリームからダウンストリームへのシステム入出力を可視化します。キューが長くなった場合など、さまざまな指標に関してアラート通知を行うことにより、リソースの制限や特定が難しい設定上の問題を切り分けます。

分散した デバイスを監視

リテール業者の場合、POS 端末やオンサイトサーバーに問題が発生すると、売上の低下や物流の問題へとつながりかねません。Datadog は、次に示すように、分散したデバイスのデータの取り込みを実現します。

- デバイスグループをタグで分類: 物理的な位置やファイアウォールバージョンなど、デバイスグループをタグで分類することで、そのサブネットのパフォーマンスやインシデントを分析できます。

- 外れ値や異常値のアラート通知: ソリューションに実装されている機械学習アルゴリズムは、通常とは異なる動作や、最新の履歴データから想定されない動作をするデバイスやデバイスグループを通知します。

- IoT デバイスを監視: AWS IoT、デバイスのファームウェアで使用されるオペレーティングシステムと統合されている Datadog は、IoT デバイス全体を簡単に監視できます。

Page 34: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

ゲーム業界 datadog.com

Datadog ソリューションの概要

ゲーム業界

何千人ものユーザーに愛され信頼される Datadog

安定した プレイヤー エクスペリエンスを提供

予期しないサーバー遅延や貧弱なアプリケーションパフォーマンスが原因でゲームが台無しになることは、ゲームのプレイヤーにとって非常に大きなストレスです。ゲームに没頭するには、アプリケーションとインフラストラクチャの安定したパフォーマンスが不可欠です。世界トップクラスのゲーム開発者に選ばれる Datadog は、世界中にいる無数のプレイヤーのスムーズで一貫したゲーム環境をサポートします。

- 潜在的な問題を識別:インフラストラクチャとアプリケーションメトリクスを使ったリアルタイムアラートとアナリティクスにより、バックエンドプラットフォームの安定性を確保します。また、問題を未然に検出する予測ツールも付属します。

- 最新テクノロジーと統合:Datadog は、250 種類を超えるインテグレーションを提供し、コンテナベースのインフラストラクチャスタックを強力にサポートしています。これにより、変化を続けるモダンなアーキテクチャにも安心して移行できます。

- 症状と根本原因を関連付ける:メトリクスのグラフに対して同じ時刻に発生したイベントを重ねて確認し、パフォーマンスの問題点と関連するログやトレースへの切り替えをすばやく行うことで、トラブルシューティングの時間を短縮します。

Page 35: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

ゲーム業界 datadog.com

ゲーム内の データメトリクスを収集および 分析する:

クレート、ジェム、ゴールドなど、ゲーム内でプレイヤーが通貨やリソースを利用する方法は、ビジネスレベルの意思決定に不可欠な要素です。ゲーム内のメトリクスを分析することで、プレイヤーの行動をより深く理解し、エンゲージメントを強化できます。

- ゲーム内の金銭に関するトランザクションを追跡する:Datadog のカスタムメトリクス処理(StatsD や API を使用)によって、ゲーム内課金や主要なメトリクスを簡単に追跡できます。

- プレイヤーの行動を分析および理解する:異常検知などのパターン認識ツールは、特定の時間帯にプレイヤー数が極端に低下した場合や、過去のトレンドからの逸脱が技術的/ビジネス上の問題を示すため注意が必要な場合などを検出できます。

- 直感的な UI ベースのダッシュボード:カスタムメトリクスは、UI ベースのダッシュボードでグラフ表示できます。複雑なクエリを使用しなくても、プレイヤーの行動に関する疑問の答えを得ることができます。

機械学習ベースのアダプティブなアラートにより、プレイヤー数が普段と比べて低下する異常を検知

リリース初日の トラフィック急増に 対応

人気の高いゲームのリリースは最大限の負荷を設定したストレステストのようなもので、その際のパフォーマンス劣化はゲームの評価に甚大な影響を及ぼし、売上にも影響してしまいます。したがって、トラフィックや売上が急増するこのような期間にスムーズな顧客エクスペリエンスを提供できるように、エンジニアチームを強化する必要があります。Datadog は、次のようなサポートを提供しています。

- 15 カ月間データを保存:リリース初日に備えてリソースのニーズやボトルネックを予測するには、前回のリリースデータから知見を得る必要があります。Datadog では、15 秒単位の粒度のデータが 15 ヶ月間以上保管されているため、前回のリリースの全履歴データにアクセスし、次のリリースに備えることができます。

- あらゆるインフラストラクチャを一元的に可視化: Datadog では、アプリケーション、データベース、ホスト、その他のサポートシステムから収集されるパフォーマンスデータが正規化されます。エンジニアチームは、インフラストラクチャの負荷テストを行うことで、あらゆるシステム間のインタラクションを把握して必要な変更を行い、リリース初日に備えることができます。

- エンドツーエンドのシステムの可視化: E 相互接続されたシステム間のボトルネックを検出する機能として、Datadog はアップストリームからダウンストリームへのシステム入出力を可視化します。マッチメイクキューが長くなった場合など、さまざまな指標に関してアラート通知を行うことにより、リソースの制限や特定が難しい設定上の問題を切り分けます。

Page 36: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。

ゲーム業界 datadog.com

- リリース初日以降のキャパシティプランニング: Datadog の予測アルゴリズムは、複数のシステムを対象に、次の四半期にワークロードがどの程度増大するかを予測します。エンジニアチームは、豊富なデータに基づいて、ゲームをサポートするサブシステムのキャパシティ拡張を計画できます。

分散したチームのコミュニケーションをサポート

綿密なアプリケーション設計には、さまざまなタイプのユーザー(プログラマー、プロジェクトマネージャー、バックエンドオペレーション、設計者、アニメーター、アーティストなど)の協力が必要です コラボレーションと使いやすさを重視する Datadog は、複数のチーム間やチーム内でのリアルタイム情報共有を可能にします。

- すべてのチームが利用できるセルフサービス型のダッシュボード: Datadog は、プレイヤーのログイン、キャラクターの使用率、サーバー稼働時間、アプリケーション遅延といったデータを一元管理し、グラフ表示します。インタフェースはセルサービス型なので、プログラミングの経験は必要ありません。

- 既存ツールと簡単に統合: Slack、Pagerduty、GitHub、Jenkins といった人気のワークプレースツールとの統合に対応し、既存プラットフォーム内のワークフローを妨げることはありません。

- あらゆるステークホルダーに共有できるダッシュボード:ダッシュボードは、パブリック URL で共有することが可能です。マネジメントや社外のステークホルダーなどのグループは、プラットフォームに参加しなくても重要な情報をリアルタイムで参照できます。

Page 37: Datadog ソリューションの概要 クラウドへの移行 · 運用環境で稼働するアプリケーションにとって、パフォーマンスの問題やサービス障害は最悪のシナリオです。