Header background

Amazon Bedrock AgentCore エージェントのオブザーバビリティに関するお知らせ

Dynatraceは、Amazon Bedrock AgentCoreエージェント向けにネイティブのエンドツーエンドオブザーバビリティを提供し、統合トレース、コストおよびレイテンシ分析、ガードレール監視を標準装備で実現します。生成AIによるセマンティック属性が付加されたOpenTelemetryシグナルを取り込むことで、エージェントワークフローの容易な監視、迅速なトラブルシューティング、インテリジェントな異常検知と予測による支出管理の効率化を実現します。

軽量な OTLP 設定と既製のダッシュボードを使用することで、チームはセットアップからインサイト取得まで数分で移行できます。

Unified view of AWS AgentCore service health and model performance
図1. AWS AgentCoreサービスの健全性とモデルパフォーマンスの統合ビュー

エージェント型オブザーバビリティの進化

エージェント型AIシステムは、概念実証から本番環境への移行が急速に進んでおり、お客様は複雑なワークフローの自動化、多様なツールやAPIの呼び出し、複数サービスにまたがるタスクの調整が可能となっています。しかし、従来の監視では、トークン消費量、モデルの動作、ガードレールの結果など、AI特有の重要なシグナルが見落とされがちです。 チームは、非線形のエージェントフローのトレース、動的システムのベースライン確立、大規模利用に伴う予測可能なコスト維持に苦労しています。専用のオブザーバビリティソリューションがなければ、エージェントの複雑化に伴い、体験の劣化、コスト増、コンプライアンスのギャップが生じるリスクがあります。

エージェント型AIがパイロットプログラムから本番環境へ移行する中、組織はAmazon Bedrock AgentCoreを用いて複雑なクロスシステムワークフローの自動化を進めています。しかし、既存の監視スタックの多くは、ツール駆動型の創発的行動を想定して設計されておらず、正確性、安全性、コストに関する死角を残しています。チームは、非線形フローのトレース、動的システムのベースライン確立、エージェント型ワークフローの構築、そして大規模利用に伴うトークン駆動型の支出管理に苦労しています。

AIエージェント導入におけるオブザーバビリティのギャップ

AIエージェントは従業員の生産性向上、効率化、競争優位性など多大なメリットをもたらしますが、オブザーバビリティのギャップが依然として存在し、以下の課題を生み出しています:

  • 複雑な多段階ワークフロー
    AI エージェントは、エージェント間の依存関係を持つ非線形でマルチシステムにわたるシーケンスを実行するため、データフローと責任の所在をトレースすることが困難です。これにより、処理に時間がかかっている箇所や、チェーン内の障害の責任者が不明瞭になります。
  • 従来のメトリクスの限界
    基本的な運用メトリクスでは、CPUやp95レイテンシに顕著な影響を与えないAI推論エラーや品質問題が見落とされがちです。AI専用のテレメトリがなければ、微妙な劣化が見逃されることがよくあります。
  • 継続的な基盤エージェントおよびLLMモデルのバージョン変更
    現在のシステムは堅牢であっても、上流のモデルやバージョンの更新により動作、レイテンシ、コストが変化する可能性があります。これにより、後退やインシデントを防ぐための継続的な適応が求められます。モデル起因の変化を事前に検出することは、長期的な品質と安全性を維持する上で極めて重要です。
  • スケーラビリティと品質の課題
    デプロイメントの拡大に伴い、テレメトリ量と調整オーバーヘッドが急増する一方で、トークン使用量やAPI呼び出しは追跡されません。これによりコスト予測可能性と品質管理が損なわれ、幻覚やモデルドリフトなどの問題が発生します。マルチエージェントロジックは絶えず進化するため、「正常」は流動的な目標となります。ベースラインが変動することで、異常検知と根本原因分析が複雑化します。

これらの課題に対処しなければ、組織はユーザー体験の低下やコストの急増から、コンプライアンス違反や評判の毀損に至るリスクに直面します。

Amazon Bedrock AgentCore を使用した開発チーム向けの新たな機能強化

新たなDynatrace AI オブザーバビリティアプリは、Amazon Bedrock AgentCoreのオブザーバビリティを専用のエンドツーエンド体験に組み込み、エージェント導入におけるあらゆるオブザーバビリティのギャップに対処するため、すぐに使える分析、自動計測、ターゲットを絞ったGenAIメトリクス、デバッグフロー、既製のダッシュボードを提供します。 Amazon Bedrock、OpenAI、Gemini/Vertex、Anthropic、LangChainを含む20以上のテクノロジーに対応しております。

これらの機能強化により、チームは以下のメリットを享受できます:

  • エンドツーエンド分散トレース
    ユーザーのプロンプトからモデルの推論、ツール呼び出しに至るまでのあらゆる相互作用をトレースし、ボトルネック、エラー、コストのかかるループを数秒で特定できます。モデル、プロバイダー、トークン使用量、レイテンシーなどでフィルタリングし、根本原因分析を加速します。
  • 強化された GenAIテレメトリデータ、すぐに利用可能
    各LLMおよびツール呼び出しは、プロンプト、補完内容、トークン数(プロンプトと補完内容の両方)、終了理由、モデルID、レイテンシー、エラーを含むスパンを、GenAIのセマンティック属性を利用して発行します。オーケストレーション層(アクション、HTTP処理時間、ステップ名など)は、完全なワークフローコンテキストのためにキャプチャされます。
  • コスト、パフォーマンス、安全性のインサイト
    インテリジェントな予測機能により、トークン消費量やレイテンシにおけるコスト・パフォーマンスの異常を検知します。有害性、個人識別情報(PII)、禁止トピックに関するガードレールを監視し、信頼性の構築とコンプライアンス要件の達成を支援します。
  • シンプルなOTLP設定、迅速な価値実現
    AgentCoreは既にテレメトリを送信しています。OpenTelemetryエクスポートをDynatraceに一度登録するだけで完了です。DynatraceのOTLPエンドポイントとトークンを使用すれば、コードの書き換えなしでDynatrace Grail®データレイクハウスへシグナルをストリーミングできます。Amazon Bedrock用の既製ダッシュボードにより、データ取り込みの確認と即時インサイトの取得が可能です。
AgentCore end-to-end tracing for the multi-step autonomous agent workflow, available in our GitHub repository
図2. マルチステップ自律エージェントワークフロー向けのAgentCoreエンドツーエンドトレース(GitHubリポジトリで公開中)

今後の展開

Amazon Bedrockモデルとプロバイダーのインサイト深化、ガードレール分析の拡張、および追加の自動化に注力しております。これにより、コストや安全性の異常に対して修復プレイブックを適用することが可能となります。

さらに、AgentCoreエージェント、LLMサービス、ツールバックエンド、依存関係を可視化する新たなエージェント可視化およびトポロジー体験を導入し、スタック全体にわたるリアルタイムのトポロジーとデータフローの理解を可能にします。

トポロジーマップからトレースへ移動し、サービス、プロトコル、外部呼び出しをまたいでエージェントの動作を段階的に追跡することで、ホットスポット、所有権、影響範囲をより迅速に特定できます。

人気のオーケストレーションフレームワークとの緊密な連携強化や、取得処理、マルチエージェント連携、ツールを多用するワークフローなど、一般的なエージェントパターン向けのダッシュボード拡充も予定しております。

Amazon Bedrock AgentCore エージェント向け Dynatrace AI オブザーバビリティのご利用を開始ください

詳細をご確認いただけますか?GitHubリポジトリをご覧ください。

本日よりエージェントの計測を開始しましょう。Dynatrace でAmazon Bedrock AI オブザーバビリティ ダッシュボードを開き、テレメトリを確認して分析を開始してください。