はじめに

こんにちは!イノベーティブソリューション部システム開発チームの藤嶌です!

20205年12月16日に開催された、Datadog Live Tokyo 2025に参加しました!

現在、業務の中でDatadogをトライアル期間として利用しており、
本格導入を検討するにあたって「どこまで可視化できるのか」「実運用ではどう使われているのか」
といった点をもう少し深く理解したいと考えていました。

そんな中で開催された Datadog Live Tokyo 2025 は、
Datadogの最新機能や実際の活用事例をまとめてキャッチアップできる良い機会だと感じ、
今回参加することにしました。

本記事では、Datadogをトライアル利用している立場から、
イベントを通じて得られた学びや印象に残ったポイントをまとめます。

 

 

Datadog Live Tokyoとは?

Datadog Live Tokyo は、Datadogユーザーを対象とした大規模イベントで、Datadogの最新プロダクト情報の紹介に加え、実際にDatadogを活用している企業による導入・運用事例の共有や、参加者同士が交流できるネットワーキングの機会が用意されたイベントです。

今回のイベントは、以下のタイムテーブルで実施されました。

  • 14:00~15:30:基調講演
  • 15:45~16:55:ブレークアウトセッション
  • 17:05~17:35:Fireside Chat
  • 17:55~18:45:ネットワーキング・レセプション

印象に残ったセッション

観測から行動へ: Datadog で実現する”活きる”オブザーバビリティ

そもそもオブザーバビリティとは何か、そしてなぜ今オブザーバビリティが求められているのかといった基礎的な部分から丁寧に解説されていました。

特に印象に残ったのは、Observability は
「観測(Observe)+ 活用できる(Ability)」
という意味で、単にシステムの状態を「見ることができる」だけではなく、
必要な情報を「容易に」確認でき、そこから次のアクションへ「素早く」つなげられる、という説明はとても腑に落ちました。

Datadogを使うことで、メトリクス・ログ・トレースといった情報を個別に確認するのではなく、相互に関連付けながら把握できるため、障害対応や原因調査を「観測」で終わらせず、「行動」につなげられる点が強く印象に残りました。

また、フロントエンドで発生したエラーと、その裏側で動いているバックエンドの処理を紐づけて確認できることで、問題の原因をフロントからバックエンドまで、端から端まで追跡できる点も非常に印象的でした。

授業支援アプリのサクサク・ワクワク向上のための Datadog RUM 活用事例

この事例では、RUM 導入の背景として、当時利用していた監視ツールではクライアントサイドの可観測性が不足しており、障害発生時に十分な原因調査ができなかったことが紹介されていました。

Datadog RUM を導入したことで、フロントエンドで発生したエラーとバックエンドの処理を紐づけて確認でき、クライアントからサーバーサイドまでのエンドツーエンドの可観測性を実現できたとのことです。

中でも特に印象に残ったのが、フラストレーションシグナルの活用事例です。
ユーザーの成果物を保存する画面にサムネイルが表示されていたため、多くのユーザーがクリックしていましたが、実際には遷移先の機能が存在しておらず、結果としてクリックの96.1%が「無駄な操作」になっていることが分かりました。

このように、ユーザーがどこで期待を裏切られているのかを定量的に把握できる点は、RUMならではの価値であり、課題を感覚ではなくデータに基づいて改善につなげられることを強く実感する事例でした。

Datadogの活用促進策として紹介されていた「データドッグ合宿」と呼ばれる取り組みも、印象に残る内容でした。

AI Agent で実現する AIOps ― Bits AI SRE 国内活用事例 ―

本セッションを通じて特に印象に残ったのは、

経験の浅いメンバーも含めたすべてのエンジニアが、インシデント発生時に価値ある貢献ができるようになる

というコメントでした。

これは、KyndrylのSite Reliability Engineerである竹屋さんの言葉で、SREだけでなく、エンジニアとして今後どのように価値を発揮していくべきかをあらためて考えさせられる言葉でもありました。

AIが調査や分析を担う領域が広がっていく中で、自分自身がどこで価値を出していくのかについて、正直なところ、少し不安を感じたのも事実です。

インシデント対応は、どうしても経験や勘に依存しがちで、限られたメンバーに負荷が集中してしまう場面も少なくありません。
Bits AI SREは、膨大なログやメトリクスを横断的に分析し、調査の方向性や結論を短時間で提示してくれることで、こうした属人性を大きく下げてくれると感じました。

実際に、毎分170万件に及ぶログを伴うDDoS攻撃に対しても、Bits AI SREが短時間で原因を特定できたという事例から、経験の有無に関わらず、誰もが一定水準の判断を行える環境を実現できる可能性を強く感じました。

Bits AI SRE は、単なるインシデント対応時間の短縮にとどまらず、エンジニア組織全体の底上げにつながる取り組みであり、今後の運用やエンジニアリングの在り方を大きく変えていく存在だと感じています。

トライアル利用者目線での学び

Datadogをトライアル利用している立場で参加したことで、「可視化できたか」ではなく、「観測した情報をどう行動につなげるか」という視点の重要性をあらためて認識しました。

RUMや Bits AI SREの事例を通じて、障害対応や改善をより短時間で進めるための具体的なイメージを持つことができたのは、トライアル利用者にとって大きな学びだったと感じています。

さらに、ビジネスサイドから開発、運用チームまでが同じ目線で議論し、エンジニアが主体となって提案できる環境の大切さを、改めて感じました。

また、エンジニアから学ぶ場を設けたり、合宿を開催したりと、自ら動いてDatadogの「ファン」を増やしていこうとする姿勢に、強く感動しました。

おわりに

Datadog Live Tokyo 2025 は、Datadogの機能を知る場であると同時に、オブザーバビリティや運用の在り方について、改めて考えさせられるイベントでした。

Datadogをすでに利用している方はもちろん、これから導入を検討している方や、トライアル中の方にとっても、多くのヒントが得られる内容だったと感じています。

今回のイベントで得た気づきを、日々の運用や改善に少しずつ落とし込みながら、Datadogの活用を進めていきたいと思います。