DMM.comの、一番深くておもしろいトコロ。

ピークトラフィック215Gbps!?タイトル数30万超のデジタルコンテンツを安定して配信するDMMのインフラとは?

ピークトラフィック215Gbps!?タイトル数30万超のデジタルコンテンツを安定して配信するDMMのインフラとは?

  • このエントリーをはてなブックマークに追加

f:id:dmmlabotech:20171002141233j:plain


9月に開催されたアプリケーション・パフォーマンス 2017の基調講演にて
『デジタルコンテンツの安定配信とコスト削減の両立を実現したシステム刷新』というタイトルでインフラ部 部長の渡辺が登壇しました。
DMM.comの動画や電子書籍といったデジタルコンテンツの配信は2002年から行なっててきており、ロングテール型のサービス提供のためタイトル数は30万超、データ量は年1PBのペースで増え続けています。
そんなデジタルコンテンツを安定して配信するためにシステムを支えているインフラ部の技術とは。
講演を終えての気持ちや講演では語られなかったことなどを登壇資料と併せてご紹介します!

ーーデジタルコンテンツの安定配信とのことですが、まずは簡単に講演の概要を教えてください

DMMはかなり大容量のデータを抱えています。
その「大容量データを抱えながらもニーズに合わせてどうオンプレのインフラを変えてきたか」が今回のテーマになっています。
私が入社して約6年経つのですがその間に大きい動画配信基盤のリプレイスがありました。その都度、課題が変わってきているのでそれをどう解決してきたのかといったことを主軸にした内容になっています。
実は、DMMのデータセンターから出ているトラフィックの90%以上は動画などのデジタルコンテンツで生じているんです。
今年の夏には215Gbpsという新記録が出たんですよ(笑)
CDNに頼らなくてもDMMのデータセンターのネットワーク処理力はこれくらいあるぞ!ということを、普段裏方というイメージの強いインフラエンジニアにフォーカスを当てた形でお伝えしたかったんです。
あと、DMMはそれだけのトラフィクを吐く土台があるぞということですね。 

     f:id:dmmlabotech:20170928153948j:plain

 ーー基調講演という大役を終えての感想とかありますか?

あまり緊張せずに話せたので基調講演って感じはあまりなかったですね(笑)
実は講演中、30分ほどマイクが入っていないことに気がついていなかったり、途中でWindowsアップデートのポップアップが出てきたりテンパったのですが、それのおかげかもしれません。
どうやったら、スライドに影響出さずに消せるかなーなんて考え込んじゃいました。
結構会場を見渡す余裕もありました。普段自分が行っている講演とは少し層が違い、30~40歳くらいのミドル層が多めだなとか、私服とスーツの割合は半々くらいだなとか。おそらくBtoCの方たちだけでなくBtoBの方も来ていたんだと思います。

 ーーさらなる安定した基盤に向けての課題についてはどう考えているのでしょう
スライドには残していないのですが、今回発表した内容に行き着くまで3カ年計画で動いていた感があります。
2014年の春ごろ自分たちの当時の状況を客観的に分析してみたんです。お世辞にもサーバー単体の障害発生率が少ないとは言えない状況でした。で、そこからの取り組みでどう変化してきたか年間で継続的に取り組んできた実績をグラフにまとめたのが資料のP50,51です。
トラフィックは年々伸び続けているけれど、インシデントの量は減っている的に減らすことができました。

なので、次はより安定した基盤を提供しつつ、挑戦をしていくことが課題です。
ちょうど会社自体も小さな組織作りを進めている段階でもあるので、組織間の敷居を取っ払って、インフラ部だけでは解決できないより良い基盤を作っていくことをこれからの世代に期待していたりします。

f:id:dmmlabotech:20170928142139j:plain ーーちなみに、社内ではここ1年〜半年くらいでAWSという単語が飛び交うようになった気がしますが、それについて何か思うこととかあったりしますか?
AWSに限定せず、パブリッククラウドの導入は時代の流れと言うかトレンドというか必然の流れもあったと思います。
それだけでなく、パブリッククラウドが社内で使われるようになった理由の1つには既存のオンプレよりも使いやすいというイメージがあったんではないかなと。

例えば組織間の物理的な距離。今ではインフラ部もオフィスが移転して六本木になりましたが、これまで本社は恵比寿、インフラ部は大手町と場所が違っていました。
直接の原因ではないのかもしれませんが、距離の壁があることでプロダクト側とインフラ側の温度感の違いもあったのではないかと個人的には感じています。
スピードを優先するプロダクトにおいては、早く開発に入れるパブリッククラウドの方が特にメリットに感じられたのではないでしょうか。

パブリッククラウドとオンプレを併用して運用していくために
当然オンプレにはオンプレの利点を今以上にしっかりと打ち出せるようにする必要があります。
インフラ部だけではなく、開発エンジニアやプロダクト側に満足して使ってもらうことが重要ですから今後を考えるうえでも学ぶべき1年になったのではないかと思います。
今現在、サービスの安定稼働につながる構成へと改善をしていっているので、これからが新たなスタートラインになると考えています。

ーー最後に今後の展望を聞かせてください

f:id:dmmlabotech:20170928151803j:plain
DMMに入社した6年前は東京のシステムエンジニアは30人位しかいなかったと思います。今は正社員のエンジニアだけでも約550人。
加速度的に会社の規模が大きくなるのに合わせて、インフラも当時あるものでとりあえず事業速度に合わせて作ってきた感はあり、それゆえの技術負債は大きいと個人的に感じています。
CTOの城倉さんとCTO室の佐藤さんも先日別のイベントでDMMの技術負債について話されていましたが、システム部だけの問題ではなくインフラも部も同様だと考えています。
ですので、ここから一年が勝負だな!と。


最後に。登壇の機会をいただけたことで、これまでの組織の取り組みなども振り返ることができ私自身貴重な機会となりました。ありがとうございます。資料もぜひご覧いただければと思います。