DMM.comの、一番深くておもしろいトコロ。

Google Cloud Next'19 Report

Google Cloud Next'19 Report

  • このエントリーをはてなブックマークに追加

f:id:sugano-kosuke:20190419181417j:plain

こんにちは、インフラ部の菅野です。 先日、2019年4月9日~12日にGoogle Cloud Next '19がサンフランシスコで開催されていました。 DMMからは、西岡(SRE)・平良(サーバインフラ)・菅野(配信インフラ)の3名が参加していました。 Google Cloud Next '19は、GCP、G suiteなどの新機能紹介や利用企業の実例紹介が行わるイベントで、サンフランシスコ、東京、ロンドンで開かれます。 Nextで発表された大きなリリースや概要についてはGoogle Cloud Platform Japan Blogに詳しく載っておりますので、そちらを参照いただければと思います。 本記事では、各自が今回のカンファレンスで興味深いと思ったセッションを簡単に紹介したいと思います。

インフラ部 配信基盤グループ 菅野

改めましてこんにちは、インフラ部の菅野です。 DMMの動画配信に関するインフラを担当しております。 そんな配信インフラに所属する私の視点から見たGoogle Cloud Next'19における興味深いセッションを紹介させていただきます。

The High-Performance Network

動画 : https://www.youtube.com/watch?v=pIZXvVl8vIM

このセッションでは、Googleの強みである世界に広がるNW網の強さやソフトウェア的に如何に最適化が行われているかが紹介されています。

我々のレイヤでは海底ケーブルまで意識することはありえないですが、そこを意識した上での最適化が行われているのがGoogleらしい発表となっていました。 その上でSDNが構築されており、GoogleのNWを支えていることが話されています。 また、GCPのVPCを利用することでGoogleのPremiumNWを利用可能になり、安全でレイテンシの低いNWでサービス提供が可能になるといったことも話されています。 そして本セッションでの新しい発表としては32GbpsのVMと100GbpsのVMが追加されたことでした。 配信を支える上で捌けるトラフィックは非常に重要な観点となるため、とても興味深い発表でした。

Livin' on the (CDN) Edge

動画 : https://www.youtube.com/watch?v=JX2qrdp0WT4

このセッションでは The High-Performance Network で話されていたNW網の強さやQUICなどを活かしたGCPでのCDNの利用方法などをデモを交えて紹介されています。

これだけ簡単にCDNを有効化し、PremiumNWを利用し、証明書の設置まで簡単にできるのは普段運用を考えている立場としてはとても便利だと感じますね。 また、本セッションの面白い点として、Googleらしい海底ケーブル敷設や地中にケーブルを埋めている様子まで見ることができます。 なかなか見れるものではないので、それを見てみるためだけにもセッションの動画を眺めてみる価値はあると思います。

インフラ部 サーバインフラグループ 平良

こんにちは。インフラ部の平良です。 DMMのサーバー運用を担当しておりましたが、この度仮想基盤の運用に移る事になりました。 基盤という視点から見た、Google Cloud NEXT'19 における興味をもったセッションを紹介させていただきます。

Opening Keynote (Cloud Next '19)

動画: https://www.youtube.com/watch?v=XGrlWVWlpgE

Google Cloud Japan 公式ブログ: https://cloud-ja.googleblog.com/2019/04/new-platform-for-managing-applications-in-todays-multi-cloud-world.html

各所で話題になっているかとは思いますが、 Opening Keynote で早速発表された Anthos の話です。

どこでもアプリケーションを実行できるオープンプラットフォームと発表されています。

オンプレミスや、AWSを含むいくつかのパブリッククラウドで実行できるため、 “Write once, run anywhere" (一度書けば、どこででも動く)

を実現可能なプラットフォームとなっているそうです。

この発表は衝撃的でした。今まで、オンプレミスとパブリッククラウドを分けて、両方の利点欠点がアプリケーションの方向性に合うかを考え、乗せる環境を判断してきたこの慣習を過去のものにしようとしている Google の戦略は新鮮なものに写りました。

また、同じ発表で Anthos Migrate のベータ版も公開されました。Opening Keynote で、実際にVM上のアプリケーションをKubernetes の container にマイグレーションするデモがあり、驚かされました。弊社でも K8s 化に向けて利用できるシーンはあるかもしれないと想像させられました。

Istio in Production: Day 2 Traffic Routing (Cloud Next '19)

動画: https://www.youtube.com/watch?v=7cINRP0BFY8

デモとデモの説明が上手く、わかりやすい発表でした。

Istio を導入することでトラフィックを管理しやすくなります。具体的には、

  • サービス間ネットワークの相互作用が理解できる
  • サービス間トラフィックの検査ができる
  • 1000ものサービスに自動でポリシーが適用できる
  • 詳細にパーセンテージでルーティングできる
  • ネットワークとアプリケーションコードを切り離せる

といった利点がありますが、その中のルーティングに関してのデモを紹介しています。

0か100かといったデプロイを、一部に適用し少しずつ大きくしてくことができ、本番影響を最小限の状態で確認し、障害を食い止めることが可能になります。 またサービス間の攻撃をサーキットブレーカーで防御する方法などもデモされています。

弊社でもマイクロサービス化が進んでいますが、こういったサービス間の通信について操作、検査できるような仕組みを構成することについては各サービスで認識が異なるため、サービス全体で考えられたら面白いのかなと思いました。

CTO室SREチーム 西岡

こんにちは! CTO室 SREチームの西岡です。 主に弊社にある様々なサービスの開発やインフラ構築、直近ではオンプレからクラウドへの移行案件に携わっています。

私はSRE/DevOpsがテーマのセッションを中心に参加しました。

弊社ではSREチームはまだ出来て半年ほどであり、 SREとしてというより、SREとしての活動を行うためのベースづくりが差し当たりの活動です。

Google Cloud Next '19ではSRE Loungeも開かれており、GoogleのSREたちによるディスカッションが行われていました。 私が見に行ったときは人が溢れているほどの盛況ぶりでした。

Data Management: The New Best Practice for Incident Response

動画:https://www.youtube.com/watch?v=VXqfbp_zE0c

データマネジメントと技術によって夜は安心して眠りたいというテーマです。

障害は避けられないもので、いつでも起こりうるものです。 そのためどのようなフローで誰が何をするか、誰と誰がコミュニケーションするかを決めておくことが重要です。

障害対応のライフサイクルの管理、迅速な障害調査のためのStackdriverのデモも行われました。 StackdriverはGCPで提供されているモニタリングサービスで、アプリケーションのパフォーマンスの確認も行えます。 障害が起こったときに慌てないためにも、このようなサービスはありがたいです。

SREチームではDatadogをメインの監視ツールとして使用しており、 障害が起こったときにすぐに原因を特定するためのダッシュボード作成も行いました。 また、オンプレミスのサーバ郡のモニタリングにも使用しており、監視の導入やダッシュボードの改善が日々行われています。

今後もモニタリングツールや知見を障害対応に活かしていきたいです。

Google Cloud DevOps: Speed With Reliability and Security

動画:https://www.youtube.com/watch?v=cXXZ-AOCALU

15年ほどSREチームのリーダーを務められている方のお話が印象に残りました。

SLOではなくユーザエクスペリエンスが実際にどうであったか、 プロダクトのユーザはどんなパフォーマンスを望んでいるかを本当は意味していて、内部的には Happy SLO と呼ばれているそうです。 とてもシンプルな概念で、プロダクトをユーザと同じ視点で測定しユーザが幸せであるために必要なもの探していきます。

サービスにアクセスできないようなダウンタイムの測定によりSLOを策定することはあると思いますが この測定方法は考えたことがありませんでした。

開発者としてプロダクトを使うのではなく実際のユーザとしての目線で見ることは忘れてしまいがちなので ドックフーディングしてHappy SLOを決めてそれに向けて改善していきたいなと思いました。

おわりに

いかがだったでしょうか? Google Cloud Next'19ではここで紹介しきれないほどの様々なセッションが行われていました。 今回我々は紹介しませんでしたが、MLについてのセッションがとても多く、GCPならではの強みだなと感じる部分でした。 他のセッションについては、YouTubeのリンクを以下に記載しておきます。

www.youtube.com

採用情報

DMM.comでは共に働くエンジニアを募集しております。 興味のある方は、ぜひ下記募集ページをご確認ください。 dmm-corp.com