<h3>はじめに</h3>

<p>こんにちは。 DMM GAMESプラットフォーム開発本部PFシステム部インフラエンジニアの軸丸です。</p>

<p>DMM GAMESでは、AWS、GCPなどのパブリッククラウドの導入を進めており、その環境の監視・モニタリングツールとしてDatadogを採用しています。</p>

<p>今回は、Datadogを採用した理由や、それによってインフラ監視がどのように変わったかなどを紹介したいと思います。</p>

<ul>
	<li>なぜDatadogを採用したか？</li>
	<li>インフラ監視運用の変化</li>
	<li>今後の展望</li>
</ul>

<p><img alt="" height="180" src="https://image.dmm-corp.com/4hkwfuv7inh48woml56ile4xpx6w" width="500" /></p>

<h3>なぜDatadogを採用したか？</h3>

<p>パブリッククラウドを本格的に活用し始めたばかりの頃は、従来のオンプレミス環境と違い、監視対象のサーバ数が動的に変化する環境、各種マネージドサービスを含んだ構成、またコンテナを活用したシステムに対して、どのような仕組みで統合的にインフラ監視・モニタリングを行うのがより良いのか、頭を悩ませていました。</p>

<p>そんななか、最終的にDatadogを選定した大きな理由が、以下の2つです。</p>

<h4><strong>SaaSであること</strong></h4>

<p>「監視システム」には、選択肢として大まかに以下の3種類があると思います。</p>

<ul>
	<li>パブリッククラウドが提供する監視システムを利用する。</li>
	<li>監視ソフトウェア(OSSなど)を使ったシステムを自前で構築する</li>
	<li>SaaSを利用する</li>
</ul>

<p>選定にあたり、SaaSの持つ以下の特徴にメリットを感じたため、これを利用するのが良いという結論に至りました。</p>

<ul>
	<li>AWS、GCP、オンプレミスどの環境にあるシステムも1つの監視システムに集約できる</li>
	<li>ネットワーク、OS、ミドルウェア、アプリケーションレイヤの監視も集約できる</li>
	<li>監視基盤自体の運用・メンテナンスをする必要がない</li>
</ul>

<h4><strong>豊富なIntegration</strong></h4>

<p>私たちが複数のSaaSを比較検討するなかで、Datadogを選定するに至った一番の決め手は豊富なIntegrationでした。</p>

<p><img alt="" height="484" src="https://image.dmm-corp.com/lzrspn3y6j6v8mhm5321ae9b3y6z" width="800" /></p>

<p>サーバにエージェントをインストールしてメトリクスを収集する従来型の監視はもちろん、主要なパブリッククラウド(AWS、GCP、Azure)についてはエージェントレスで各種マネージドサービスのメトリクスやイベントを取得することができます。</p>

<p>特にクラウド特有のオートスケールに対する監視が印象的で、スケールアウト時に増えたサーバを自動で監視対象に追加してくれるほか、スケールインを検知して削除されるサーバからのアラートを自動的にミュートしてくれた時には、感動を覚えました。</p>

<p>クラウド環境自体の監視以外にも、MySQLやNginxなどのミドルウェアとの連携も多く、さらにコンテナや、そのオーケストレーション環境についても選定当時、すでにサポートされていました。</p>

<p>今やりたいことに対応できるのはもとより、新しいシステム構築にチャレンジしていくにあたって、現状でもこれだけのIntegrationを提供しているDatadogなら、今後もさらに機能拡張され、この先私たちがやりたいことに対応できるだろうと感じました。</p>

<h3>インフラ監視運用の変化</h3>

<p>Datadogによってシステム環境の変化についていけるような監視を実現できました。 これによって、従来の監視システムの運用方法から変わった点を、いくつかご紹介します。</p>

<h3>ダッシュボードのカスタマイズ</h3>

<p>監視アラートを飛ばすだけではなく、モニタリングも課題でした。 デフォルトで用意されているダッシュボードも見やすくわかりやすいのですが、自前でカスタマイズもできます。</p>

<p>私たちのチームでは、全システムを一覧できるダッシュボードを作ってチームミーティングにて全員で眺めています。 これによって傾向などがつかみやすくなり、アラートが出る前に能動的な対処ができるようになりました。</p>

<p><img alt="" height="682" src="https://image.dmm-corp.com/8k8677mlmvs2ph1dhhh8ebl9et57" width="800" /></p>

<h3>監視設定のCode化</h3>

<p>私たちのチームでは、IaC推進の観点からDatadogの監視設定にTerraformを採用しています (TerraformにはDatadogのProviderが存在するため、監視設定のコード化が可能です)。</p>

<p>IaCのメリットは各所で語られているとおりですが、やはり私たちもコード化の恩恵を受けていると感じます。例えば以下のようなものです。</p>

<ul>
	<li>汎用的なアラート設定をモジュール化しておくことで、ある程度簡単に使い回すことができる</li>
	<li>監視に関する設定(クエリや閾値、アラートの通知先など)のレビューがコードでできる</li>
	<li>ユーザーの作成・削除といった変更履歴を管理できる</li>
</ul>

<h3>検知したイベントのSlack連携</h3>

<p>Datadogでは、標準的なメトリクスだけではなく、各種インテグレーション先で発生したイベントを検知することができます。</p>

<p><img alt="" height="671" src="https://image.dmm-corp.com/880tyio1sg6e938e4umc5ezqns8d" width="800" /></p>

<p>これを利用して、例えば以下のようなイベントのSlack通知を運用に組み込んでいます。</p>

<ul>
	<li>AWSの各種インスタンスのリタイアメントなど、対応が必要なメンテナンススケジュール発生通知</li>
	<li>AWS CodeDeployによるデプロイの失敗/成功通知 など。</li>
</ul>

<p>以前は、イベントをSlackに通知したい場合、Lambdaなどを使用する必要がありましたが、それらが不要になり簡単に通知することができるようになりました。</p>

<p>また直近では、Datadog経由でAnsibleの実行や Jenkinsのジョブの成否などもSlackに通知することを考えています。</p>

<p>&nbsp;</p>

<h3>今後の展望</h3>

<p>現時点ではシステムの監視・モニタリングのみを行っていますが、ログ集約やAPMの導入を行うため準備を進めています。</p>

<ul>
	<li>システムのメトリクス</li>
	<li>アプリケーションのパフォーマンス</li>
	<li>システムログ</li>
</ul>

<p>これらを集約してインフラ、アプリの担当範囲を問わず1つのシステムを上から下まで見ることができるようにし、障害対応だけでなく通常時の運用においてもより効率良く、速やかに問題の発見・解決ができるようになることに目標を置いています。</p>

<p>&nbsp;</p>

<h3>最後に</h3>

<p>クラウド環境の監視については非常に新しい概念が多く、最初はとても戸惑いましたが、 Datadogを導入することでより新しいアーキテクチャの監視を行うことができるようになりました。 現在の設定をブラッシュアップしていく余地もまだありますが、今後さらにDatadogを活用し、インフラ監視のみならず インフラ・アプリをまたいで、より良いシステム運用を行っていきたいです。 別の機会に技術的に掘り下げた話や事例の紹介もできればと思っています。</p>

<p>現在、DMM GAMESでは、プラットフォーム開発本部にてインフラエンジニア、開発エンジニアを募集しています、興味のある方はぜひ下記ページをご覧下さい！</p>

<div data-oembed-url="https://dmmgames.co.jp/recruit/entry/">
<div>
<div style="left: 0; width: 100%; height: 0; position: relative; padding-bottom: 52.5%; padding-top: 120px;"><iframe allowfullscreen="" src="//if-cdn.com/v5AsJpo?app=1" style="top: 0; left: 0; width: 100%; height: 100%; position: absolute; border: 0;" tabindex="-1"></iframe></div>
</div>
<script async="" charset="utf-8" src="//if-cdn.com/embed.js"></script></div>

<p><a href="https://dmmgames.co.jp/recruit/entry/" target="_blank">dmmgames.co.jp</a></p>


DMM GAMES プラットフォーム、Datadogはじめました！

facebook

twitter

DMM TV

DMMブックス

DMM pictures

DMM GAMES

DMMオンクレ

DMMスクラッチ

DMMくじ

DMMオンラインサロン

DMMいろいろレンタル

DMM DVD／CDレンタル

DMM通販

DMMオンラインクリニック

デジタルコミック事業

DMMチャットブースト

DMM英会話

DMMかりゆし水族館

ベルリング

ハッシャダイソーシャル

ヤンキーインターン

シント=トロイデンVV

DMM地方創生

DMM.make AKIBA

DMM.make 3Dプリント

Seamoon Protcol by DM2C Studio

ONE DAY DESIGN

DMM WEBCAMP

DMMぱちタウン

DMM競輪

Algoage

DMM EV CHARGE

DMMポイントクラブ

社会課題

エンターテインメント

動画

電子書籍

アニメ

ゲーム

アプリゲーム

コミュニティ

オンラインサロン

PCゲーム

オンラインイベント

ビジネスソリューション

教育

英会話

水族館

救急車両

消防車両

モノづくり施設

サッカー

スポーツ

地方創生

Web3

研究開発

アプリ

ブロックチェーン

プラットフォーム

横断開発

インフラ

アミューズメント

同人

サーバサイド

バックエンド

フロントエンド

ネットワーク

セキュリティ

配信基盤

ペイメント

Android

データベース

ビッグデータ

フルスタック

データ分析

機械学習

プロトタイピング

グラフィックデザイン

3DCG

モーショングラフィック

プロダクトデザイン

コピーライティング

サービスデザイン

コンテンツ管理・制作

ブランディング

マーケティング

企画

編集

営業

プロモーション

DMM GAMES プラットフォーム、Datadogはじめました！

シェア