Header background

エージェント型AIの台頭 第4部:DynatraceがNVIDIA BlackwellおよびNVIDIA NIMを活用したAI向けフルスタック可観測性を提供

Dynatrace®の統合型AI搭載オブザーバビリティプラットフォームは、NVIDIA BlackwellおよびNVIDIA NIMシステムを含むフルスタックAIおよびLLMの監視機能と、AI駆動のインサイトを提供し、企業におけるAI導入の規模と複雑性に対応します。本シリーズ第4弾となる「エージェント型AIの台頭」では、DynatraceとNVIDIAシステムの統合が、顧客対応上の問題の検出に必要なあらゆるインサイトを企業に提供し、ITチームがAIワークロード全体のパフォーマンス、信頼性、セキュリティを維持する方法を解説します。

NVIDIA Blackwellシステムは、エンタープライズAI向けの高性能インフラストラクチャを提供します。今回、DynatraceがNVIDIA Enterprise AI Factoryリファレンスデザインとの統合を実現したことで、企業はNVIDIA BlackwellインフラストラクチャにDynatraceのフルスタック可観測性を追加できるようになりました。これにより、リアルタイムのパフォーマンスインサイト、異常検知、依存関係マッピングが提供され、NVIDIA Blackwellプラットフォームの価値がさらに高まります。

統合された可観測性とセキュリティにより、高いパフォーマンスとセキュリティを最優先に

Figure 1. The Dynatrace AI Observability platform
図1. Dynatrace AI オブザーバビリティプラットフォーム

Dynatrace は、特に金融や医療などの規制の厳しい業界において、オンプレミスの NVIDIA Blackwell 導入に典型的な高いデータセキュリティおよびプライバシー基準に準拠しています。その統合データモデル、Smartscape® トポロジーマッピング、およびDavis® AI エンジンは、GPU メトリクスやコンテナ化されたワークロードから分散アプリケーションやユーザーエクスペリエンスに至るまで、フルスタックを深く可視化し、NVIDIA Blackwell で実行されているワークロードに合わせた可観測性を実現します。NVIDIA Data Center GPU Managerやその他のテレメトリソースの統合は簡単であり、チームは従来のインフラストラクチャメトリクスとともに、GPU の健全性、使用率、温度しきい値、メモリ帯域幅を監視することができます。

Dynatrace のテクノロジーにより、NVIDIA Blackwell アクセラレーションシステム上で動作するサービスの自動検出および計測が可能になります。高スループットの GPU コンピューティングタスク、Kubernetes クラスタ、マイクロサービスのいずれを監視する場合でも、Dynatrace は最小限の手動設定で低オーバーヘッドのパフォーマンス監視を保証します。

AIを活用したリアルタイムのインサイトにより、パフォーマンスと説明可能性が向上します

DynatraceのフルスタックAIオブザーバビリティにより、リアルタイムパフォーマンスの監視、エンドツーエンドのプロンプトトレース、コンプライアンスの確保が可能となり、AIおよびLLMワークフローとエージェントのコストとスループットを最適化します。以下のような様々なユースケースを提供します。

  • サービスの健全性とパフォーマンスを監視し、リアルタイムのメトリクスを追跡するとともに、サービス障害を明確に可視化します。
  • 応答速度の測定やパフォーマンスのボトルネックの特定により、サービスの品質を検証します。
  • エンドツーエンドのトレースとデバッグにより、LLMチェーンにおけるエラーや障害の根本原因を特定し、複雑なパイプラインの問題をトラブルシューティングし、複数のLLM、RAGパイプライン、エージェントフレームワークにまたがるシステム全体の依存関係をトレースします。
Figure 2. Sample dashboards provided for tracking service health and performance
図2. サービスの健全性とパフォーマンスを追跡するためのサンプルダッシュボード

統合されたAI搭載の可観測性

Dynatraceは、NVIDIA Blackwellシステム上で動作するLLMおよび生成AIアプリケーション向けに、フルスタックの可観測性を提供します。複雑で高性能な環境への可視性を提供する能力により、企業はBlackwellの機能を最大限に活用しながら、運用上の卓越性とシステムの信頼性を維持し、AIワークロードおよびエージェントのパフォーマンス、説明可能性、コンプライアンスを向上させることができます。

Figure 3. Dig deeper into the possibilities of AI and LLM observability on the Dynatrace Playground
図3. Dynatrace PlaygroundでAIとLLMの可観測性の可能性をさらに深く探る

Dynatrace Playground をご訪問いただき、事前入力済みデータを用いた実践的な体験を通じて、Dynatrace による AI および LLM オブザーバビリティの可能性をぜひご体感ください。自社 AI ワークロードへの Dynatrace 導入にご関心をお持ちの方は、当社ドキュメントをご参照いただき、AI および LLM 向けフルスタック・オブザーバビリティのメリットをぜひご活用ください。

詳細はこちら

  • 「エージェント型AIの台頭」ブログシリーズの第1部では、AIエージェント、モデル、およびAgent2Agent(A2A)やMCPなどの新興通信規格の基礎について解説します。
  • 第2部では、AIエージェントの可観測性と監視、A2AおよびMCP通信、Amazon Bedrockエージェントのスケーリングと監視方法について探求します。
  • 第3部では、Amazon Bedrockエージェントの監視方法と、大規模なAIエージェントを最適化する可観測性について解説します。
  • 第5部では、OpenAI Agents SDKを使用したシンプルなエージェントアプリケーションの構築方法と、Dynatraceによるデータ計測の実践例をご紹介します。