Header background

能動的AIの台頭 第3部:Amazon Bedrock Agentsの監視と、大規模AIエージェントの最適化における可観測性の役割

Amazon Bedrockのようなモデル構築プラットフォームは、エージェント型AIアプリケーションの成功基盤を提供します。しかし、効果的なエージェント間通信には標準化されたテレメトリが必要です。本シリーズ「エージェント型AIの台頭」第3回では、トレースとロギングの標準化・計測化、およびAmazon Bedrockエージェントの監視が、デバッグと高性能なエージェント型AIアプリケーションの提供にどのように寄与するかを解説します。

人工知能の次なる大きな波は、自律型エージェントを活用し、推論、学習、変化する状況への適応を通じてタスクを実行するエージェント型AIです。エージェント型AIシステムの成功と効率性は、これらのAIエージェントがどれだけ効果的に通信できるかに依存します。この通信を円滑化するには、AIエージェントとその基盤となる通信プロトコル(モデルコンテキストプロトコル(MCP)など)の監視が必要です。

本ブログ記事では、Amazon Bedrock Agents の監視方法と、大規模な AI エージェントの最適化における可観測性の役割についてご説明いたします。

主なポイント
  • 効果的なエージェント間通信には、標準化されたテレメトリが必要です。Amazon Bedrockのような基盤となるモデル構築プラットフォームでは、OpenTelemetryベースのソリューションが、大規模なデバッグのためのトレーシングとロギングの標準化と計測機能を提供します。
  • エンドツーエンドの可観測性は、エージェント型AIを監視する上での重要なベストプラクティスです。AIエージェントの可観測性に関するベストプラクティスには、従来のログ、トレース、計測機能とGenAIのセマンティック規約を併用することが含まれます。
  • 可観測性はスタック全体の文脈において効果的なエージェント型AIの結果を提供します。AIエージェントの可観測性とAmazon Bedrock Agentsのモニタリングは、パフォーマンスの向上、コンプライアンスの確保、詳細なデバッグツールの提供に貢献します。

エージェント間通信には標準化されたテレメトリが必要

大規模言語モデル(LLM)の非決定論的性質と動的なエージェント間通信を考慮すると、組織は標準化されたテレメトリを必要とします。OpenTelemetryベースのジェネレーティブAIセマンティック規約ライブラリが台頭しており、マルチエージェント環境におけるロギング、メトリクス、トレーシングを統一します。同様に、これらの標準化された計測ライブラリにより、Dynatrace上でエージェントの意思決定または通信チェーンの各ステップからデータを収集・分析することが可能となります。各ステップの可観測性により、エージェント間の通信を監視し、その健全性とパフォーマンス、規制コンプライアンス、デバッグを評価することが可能となります。

図1. Amazon Bedrock Agentsを使用した旅行エージェントアプリケーションのアーキテクチャと、OpenTelemetryを介したDynatraceによる監視。

DynatraceによるAmazon Bedrockエージェントのスケーリングと監視

Amazon Bedrock Agentsは、基盤モデルを用いた生成AIアプリケーションを構築・拡張する簡便な手段を提供します。

Amazon Bedrock は、AI21 Labs、Anthropic、Cohere、Luma、Meta、Mistral AI、poolside、Stability AI などの主要 AI 企業、あるいは Amazon 独自のモデルである Amazon Nova による高性能な基盤モデルを、単一の API を通じて選択できるフルマネージドサービスです。さらに、Amazon Bedrock Agents は、セキュリティ、プライバシー、責任ある AI のベストプラクティスに沿った生成型 AI アプリケーションを構築するためにチームが必要とする幅広い機能も提供します。

Dynatrace は、使用されているテクノロジーとサービス相互作用トポロジの完全なコンテキストを追跡・可視化する、AI を活用した統合的な可観測性およびセキュリティソリューションを提供します。Dynatrace を AI エージェント監視および MCP 監視に使用することで、チームはセキュリティ脆弱性を分析し、メトリクス、トレース、ログ、ビジネスイベントをリアルタイムで自動的にかつ安全に監視できます。

「エージェントの台頭に伴い、深い可視性とリアルタイムの洞察の必要性はこれまで以上に重要となっています。このパートナーシップを通じて、AWSとDynatraceは、堅牢なコンプライアンス監視と並行して、パフォーマンス、コスト、品質に関する洞察を提供するという独自の立場にあります。これにより、お客様は自信を持ってイノベーションを推進することが可能となります。」
– アトゥール・デオ、Amazon Bedrockディレクター

エージェント間(A2A)およびMCPモニタリングのベストプラクティス

architecture diagram that shows multiple agents interacting with an agentic application
図2.自律型エージェントのワークフローとタスク実行。

ハイブリッド環境やクラウド環境と同様に、AIエージェントおよびモデルのコンテキストベースの可観測性は、効率的で健全な成果を得るために不可欠です。以下にベストプラクティスをいくつかご紹介します:

  • 共通のセマンティック規約を採用します。異なるフレームワーク間で、メトリクスとトレース属性を標準化します。例えば、gen_ai.agent.operation.namegen_ai.agent.nameなどです。
  • Amazon Bedrockエージェント向けにログとトレースを活用します。重要なタスクライフサイクルイベント(機能発見、アーティファクト作成、エージェント連携ステップ、API呼び出しなど)をログに記録し、チームが複雑な相互作用を再現・デバッグし、幻覚現象を検出できるようにします。
  • 徹底的な計測を実施します外部OpenTelemetryライブラリの使用、または手動による呼び出し計測により、エージェントフレームワークに可観測性を組み込みます。各エージェントの起動、停止、およびツール、ナレッジベース、ガードレールなどの推論ステップが一貫して捕捉されることを保証します
  • 通信の保護。エージェント間通信において、エンタープライズレベルの認証と認可を徹底してください。A2Aなどの明確に定義されたプロトコルを使用し、不正なデータ露出を回避してください。
  • 継続的なフィードバック。エージェントの信頼性向上のため、反復的な再トレーニングや微調整に可観測性の知見を反映させます。
Screenshot of an example trace showing debugging an Amazon Bedrock agent workflow with Dynatrace AI observability.
図3. Dynatrace AI Observability を使用した Amazon Bedrock Agents ワークフローのデバッグ。

Amazon BedrockとDynatrace AI Observabilityソリューションを活用することで、エージェント可観測性に関する以下のユースケースをカバーできます:

AI エージェントのサービス健全性とパフォーマンスの監視

  • リクエスト数、処理時間、エラー率などのリアルタイムメトリクスを追跡し、ボトルネックを検出します。
  • 各リクエストの自動コスト計算により、サービスコストを管理します。
  • サービスレベル目標(SLO)に沿った運用を維持します。

コンプライアンス確保のためのガードレールの監視

  • アプリケーション要件および責任あるAIポリシーに合わせてカスタマイズされた安全対策を監視します。
  • 有害性、フィルタリングされたコンテンツ、拒否されたトピックを検証し、コンプライアンスを確保します。
  • 個人を特定できる情報(PII)の漏洩を防止します。
  • モデルと使用パターンをリアルタイムで検証し、品質の低下を防止します。

エンドツーエンドのトレースとデバッグ

  • プロンプトフローの完全な可視化を実現し、初期リクエストから最終応答までを把握することで、根本原因の分析を迅速化します。
  • 複雑なパイプラインにおける問題のトラブルシューティングのために、詳細なデバッグデータを収集します。
  • LLMプロンプトの詳細なトレース(応答遅延やモデルレベルの指標を含む)により、ワークフローを効率化します。
  • プロンプト、トークン、システム統合における正確な問題箇所を特定し、より迅速に問題を解決します。
Dashboard showing Amazon Bedrock agents monitoring details, such as service health, guardrails, and performance debugging
図4:Amazon Bedrock Agents向けDynatrace AI Observabilityダッシュボード(サービス健全性、ガードレール、パフォーマンス、デバッグを網羅)。

AIエージェントの可観測性とAmazon Bedrockエージェント監視の将来展望

エージェントオーケストレーションプロトコル(A2A、MCP)とオープンな可観測性フレームワークのより深い統合が進み、データ取り込みからクロスエージェント連携までのエンドツーエンドの可視性が実現されると予想されます。標準化が進むにつれ、組織は完全な透明性と制御を維持しながら高度なAIソリューションを迅速に構築できるようになり、自律エージェントのさらなるスケーラビリティ、回復力、信頼性への道が開かれるでしょう。

詳細はこちら

  • 「エージェント型AIの台頭」ブログシリーズの第1部では、AIエージェント、モデル、およびAgent2Agent(A2A)やMCPなどの新興通信規格の基礎について解説します。
  • 第2部では、AIエージェントの可観測性と監視、A2AおよびMCP通信、Amazon Bedrockエージェントのスケーリングと監視方法について探求します。
  • 第4部では、NVIDIA BlackwellおよびNVIDIA NIMを用いたAIのフルスタック可観測性について解説します。
  • 第5部では、OpenAI Agents SDKを使用したシンプルなエージェントアプリケーションの構築方法と、Dynatraceによるデータ計測の実践例をご紹介します。
AI エージェントの可観測性と大規模な MCP モニタリングについては、Dynatrace AI Observability ソリューションおよび AWS Labs GitHub サイト上の Dynatrace提供の可観測性エージェントサンプルをご参照ください