JDDUG meetup #6 を開催しました
20 Nov 2024 -
Takeshi KONDO
Datadog Office で開催しました。
connpass
動画
今回はリアルとリモートのハイブリットにチャレンジしました。録画は以下の YouTube でご覧いただけます。
リンクをクリックして動画を再生すると該当の発表時間から再生できます
発表1. 横山達男 (tatsuo48) / 株式会社マネーフォワード
発表2. 今村 光希(@imamura_ko_0314) / 株式会社Goals 8:24
発表3. 笹崎 日登 / アイレット株式会社 17:38
発表4. 宮本 淳志 (@Atsushi68593216) / 株式会社ログラス 29:14
LT1. 福井崇人 / Retty株式会社 37:28
LT2. 竹屋 正樹 / キンドリルジャパン株式会社 42:05
LT3. 門脇 拓巳 (@nomadblacky) / 株式会社スリーシェイク 48:03
発表
文字起こししたものからサマリを紹介します。
発表 1 Inferred Service dependencies を試してみた(tatsuo48)
発表の概要
発表者は Datadog の APM 機能として「Inferred Service Dependencies」を試用し、それがどのようにサービス依存関係の視認性を改善するかについて話しました。具体的な問題点として、サービスマップの複雑さと解読困難さを挙げ、その解決策としてこの新機能の利用を推奨しています。
発表の面白い点
- Datadog の既存のサービスマップが直面している視覚的および機能的な問題点を具体例を挙げて説明。
- 「Inferred Service Dependencies」機能がこれらの問題をどのように解決するかを実例を通じて解説。
- 機能導入前後の比較を示すことで、実際の効果が視覚的に理解しやすい形で提示された。
聞くことをお勧めする人
- サービス依存関係のマップで視覚的な混乱を経験している開発者やエンジニア。
- Datadog APM を使用していて、より効果的なモニタリングツールを求めているテクニカルリードやマネージャー。
- ソフトウェアアーキテクチャの複雑さを管理する方法を模索している SRE(Site Reliability Engineers)。
発表 2 Datadog RUM を用いた UX 指標の監視・顧客対応への活用 〜非エンジニアが Datadog を使いこなす〜(今村)
概要
今村氏は、株式会社 Goals での経験を基に、Datadog の Real User Monitoring (RUM) を活用して UX 指標を監視し、実ユーザーの体験を改善するための方法について語りました。特に、外食産業における通信環境の悪さがユーザーエクスペリエンスにどう影響するかという課題を例に取り上げ、具体的な監視戦略と解決策を提示しました。
発表の面白い点
- 実際のユーザー体験に基づいた問題点を明確にし、Datadog RUM を使ってこれをどのように可視化し解決しているかを詳細に説明。
- 社内ユーザーと実ユーザーのデータを分離することで、より正確なユーザー体験の監視を実現している点。
- UX 監視を通じて得られた洞察が、実際のプロダクト改善にどのように役立っているかの事例を共有。
聞くことをお勧めする人
- UX やパフォーマンス指標の改善に関心のあるウェブ開発者やプロダクトマネージャー。
- Datadog や他のモニタリングツールを活用してユーザーエクスペリエンスの質を向上させたい IT 担当者。
- 特に外食産業など通信環境が複雑な業界で働く技術者やマネージャー。
発表 3 障害対応における Datadog プラットフォーム機能の活用(笹崎)
概要
笹崎氏は iret 株式会社から、Datadog のプラットフォームを使用して障害対応プロセスを効率化する方法を示しました。この発表では、障害発生から復旧、さらにはポストモーテムまでのフローを具体的に説明し、Datadog の機能が如何にして各ステージで活用できるかをデモンストレーションしました。
発表の面白い点
- 障害発生時のアラート検知から始まり、通知、調査、復旧、そして事後分析までの一連の流れを統一されたプラットフォーム上でどのように処理するかが具体的に語られました。
- Datadog の App Builder や Workflow Automation の具体的な活用例が、実際のスクリーンショットと共に紹介され、その有効性が明らかにされた。
- プロセスの自動化がいかにチームの効率を向上させるか、そして再発防止にどう貢献するかが、具体的な事例とともに示されました。
聞くことをお勧めする人
- IT 運用や障害管理の効率化に関心のあるシステム管理者や運用チーム。
- Datadog や他の監視ツールを用いてインシデント管理のプロセスを改善したい IT プロフェッショナル。
- 自動化と観測可能性を重視し、チームの対応能力を高めたいテクノロジーリーダーやマネージャー。
発表 4 OOM 発生時のトラブルシューティング Profiler を活用できるか調査してみた(宮本)
概要
宮本氏は、株式会社ログラスにおいて、OOM(Out of Memory)発生時のトラブルシューティングに Datadog のプロファイラーをどの程度活用できるかを調査した経験を共有しました。特に、Java のヒープメモリー管理、OOM エラーの種類、そして発生事例を通じて、プロファイラーの有効性と限界を探りました。
発表の面白い点
- 実際のサービス運用中に発生した OOM エラーとその対応プロセスについての具体的な事例が語られました。
- Datadog プロファイラーを用いた際のメリットと、ヒープダンプとの比較を通じて、トラブルシューティング時の適用可能性が評価されました。
- 実際に発生した OOM 直前の状態を捉えることの難しさと、それを克服するための具体的な技術的アプローチが示されました。
聞くことをお勧めする人
- クラウドインフラのトラブルシューティングに関心のあるエンジニアやデベロッパー。
- Java アプリケーションのパフォーマンス監視やメモリ管理の改善を図りたい技術者。
- Datadog や他の監視ツールを活用してシステムの安定性を高めたい運用チーム。
LT1 dd-trace-go の trace context propagation 実装 (福井)
概要
福井氏は、dd-trace-go ライブラリの trace context propagation の実装について詳細な説明を行いました。このライブラリを使うことで、Go 言語で書かれたアプリケーション間でトレースコンテキストを効果的に伝播させることが可能になり、分散システム間のデバッグとモニタリングを効率的に行えます。
発表の面白い点
- TraceContextPropagation の具体的な実装方法と、それを支える dd-trace-go の内部機能について具体的に説明しました。
- HTTP と gRPC でのトレースコンテキストの伝搬方法の違いとその実装例を示し、実際のアプリケーション開発における応用可能性を展開しました。
- Go 言語におけるトレースの伝播を通じて、システム全体のトレーサビリティを向上させる方法を詳細に述べました。
聞くことをお勧めする人
- マイクロサービスアーキテクチャを採用している開発者やアーキテクト。
- Go 言語で分散システムを開発しているエンジニア。
- APM ツールの導入または効果的な利用方法を探求している IT プロフェッショナル。
LT2 レガシーシステムへの Datadog APM 導入奮闘記 (竹屋)
概要
竹屋氏は、キンドリルジャパンから、レガシーシステム、特にオンプレミス環境に Datadog APM を導入する際の経験と課題を共有しました。彼の話は、Datadog を利用して既存のインフラをモニタリングし、クラウドへの移行を支援する過程の実例に焦点を当てています。
発表の面白い点
- オンプレミスシステムにおける Datadog の導入に関する具体的な課題と解決策について詳細に語りました。
- AIX サーバーなどの古いシステムにカスタムエージェントを導入し、ログを収集・転送する独自の方法を開発した経験が興味深いです。
- Salesforce の障害発生時に Datadog がどのように役立ったかの事例を交え、リアルタイムの監視の重要性を強調しました。
聞くことをお勧めする人
- レガシーシステムやオンプレミス環境に新しいモニタリングツールを導入しようと考えている IT マネージャーやエンジニア。
- Datadog や他のクラウドベースの監視ツールを活用してシステムの可視性を向上させたい技術者。
- クラウド移行プロジェクトに関わっているプロジェクトマネージャーとインフラエンジニア。
LT3 Reckoner における Datadog Browser Test の活用事例 (門脇)
概要
門脇氏は、Reckoner というデータ連携サービスでの Datadog ブラウザテストの具体的な使用例を紹介しました。彼は、サービスの死活監視、デプロイ後の自動動作確認、およびパフォーマンスチューニングの文脈でこのツールをどのように活用しているかを詳述しました。
発表の面白い点
- Datadog ブラウザテストを使用してエンドツーエンドのテストを簡単に構築し、運用している具体的な手法について語りました。
- 実際のデモを通じて、ブラウザテストの設定と実行のプロセスを視覚的に示し、聴衆に具体的なイメージを提供しました。
- テストの自動化が開発プロセスにどのように統合されているか、特にデプロイ後の検証とパフォーマンスの計測に焦点を当てました。
聞くことをお勧めする人
- Web アプリケーションの品質保証や運用監視に興味のある QA エンジニアや運用マネージャー。
- Datadog や他のシンセティックモニタリングツールを活用してユーザーエクスペリエンスを向上させたい開発者。
- デプロイ自動化やパフォーマンス監視を強化したいテクノロジーリーダー。
余興
今回かのさんが sli.do の機能で Datadog クイズを実施しました。普通に難しかったですね… ランキング載せておきます!
クイズのランキング
景品を Get した人たち!
全問正解おめでとうございます!ピンボケすみません!
3 位&4 位
かわいいデザインですね
終わりに
今回お集まりいただいた参加者、発表者の皆様、Datadog の皆様、Taiji さんいつもありがとうございます!
次回は 2 月か 3 月頃お会いしましょう!
集合写真
All Photos by @chaspy