デバッガ:デバッガ一般

ここではデバッガの一般的であると思われる話題について広く浅く取り扱っています。

デバッガ４原則

最初にデバッガが守るべき原則を書いておきます。出典はデバッガの理論と実装

１、デバッグの手続きがシステムに過度の影響を与えてはならない

システムをデバッグするためにはシステム側に対する何らかの加工が必須となりますが、それによる影響を最小限にとどめなければなりません。デバッグしたいのはデバッガ上で動くアプリケーションではなく、普通の環境で動くアプリケーションです。普通に動かしたときに発現し、デバッグしている時は発現しないバグというのが最悪です。

２、デバッガは嘘をついてはならない

デバッグというのは、ありえない値やありえない挙動が見つかったときに得てして活躍するものです。そのため、その値が本当にありえない値（＝デバッガによって捏造された値）であることはなんとしても避けなければなりません。それはユーザーを間違った方向に導くことになりますし、ユーザーのデバッガへの信頼を失わせることにもつながります。

端的に言うとこれは、取り繕ったり捏造したりしてはいけないということです。もしソースが最適化されていたら、それを素直に報告します。見せかける必要はどこにもありません。コールスタックが壊れていたら素直にそう表現しましょう。分からない値や壊れてしまった値でも同様です。信頼はデバッガにとってもっとも重要なものです。

３、文脈はデバッガにとってもっとも重要な情報です

ここでいう「文脈」とは、プログラマがもっとも必要とする情報＝プログラムの文脈情報のことです。

バグが発生したとき、プログラマが一番知りたいのは「バグはどの場所で、どのような状況で発生したのか？」ということだと思います。例えば、例外が発生したら、その発生したときの情報を詳しく知りたいと思うはずです。具体的には

どのファイルのどの行で例外が発生したのか？
そのときの関数呼び出しの履歴はどうなっているのか？
そのときのローカル変数やグローバル変数の値は？
マルチプロセスならプロセス番号、マルチスレッドならスレッド番号は？
[これは無くても構わないと思いますが] もっと具体的にどのCPUやVMのインストラクションで止まった？　そのときのCPUやVMのレジスタの値は？

などの情報です。これらの情報をプログラマに指し示すことがデバッガのもっとも重要な仕事です。

４、デバッグはシステム開発の後を追う

大抵の場合、デバッグ機能というのは、そのシステムが開発されてからずっと後にならないと実装されません。これはつまり、そのシステムが開発されてからかなりの時間が経たないと、デバッガによる強力な支援が得られないことを意味します。例えばＯＳを見ても、Windows3.1には最初、デバッグAPIというもの自体が存在していませんでした。まともなデバッグ機能が付加されたのはWindows95になってからです。他の言語や今盛んなLL言語、大規模ライブラリなどを見てもこの傾向がうかがえます。

新技術や目新しい機能というのは割合すぐに実装されるものですが、それに対するデバッグやデバッグAPIが考慮されるのはそのずっと後です。これにはいくつか理由が考えられるのですが、そのうちのいくつかには

システム開発側がデバッグAPIというもの自体を考慮にいれていない
考慮に入れていたとしても適切なAPIの実装が分からない
他の新機能の実装やバグフィックスに対するコミュニティやユーザーからの要望の方が圧倒的に強い

というのが上げられると思います。したがってデバッガ開発者というのは常に、デバッグ対象となるシステム開発者やコミュニティに対して適切なデバッグAPIの提案と実装への要望を強めていく必要があります。

(注: ただし最近は最初からデバッグAPIが考慮された環境や言語も増えてきています)

IDEデバッガについて

とりあえず、IDEデバッガの紹介みたいなものを書いてみます。というのもIDEというものをほとんど使ったことが無い人もいると思いますし、普段使っていてもソースビューとかデバッガ・デバッギの区別をしている人などはおそらくほとんどいないと思われるからです。

もちろん、そういう環境を全く知らない人に想像しろというのも雲をつかむような話になってしまうので、 VisualStudioですがデバッガの参考例としてここに上げておきます。
イメージ画像(ちなみに、黄色い矢印で指されているのが実行中のソース行で、赤い丸はブレークポイントを示しています)

IDE環境に最低限必要なもの

ソースビュー
- イメージ画像
- その名のとおりソースファイルを表示しますし、高度なエディタ機能も含んでいます。画像の左側にある赤丸はブレークポイントを示しています。IDEはプログラムの実行をこの行の実行が始まる直前で止め、ユーザーがより多くの情報を確認できるようにします。また、このビューの重要な仕事として「ソースレベルでプログラムが進行しているようにユーザーに錯覚させる」というものもあります。また、ソースを表示できない場合はCPUやVMのインストラクションが表示されることもあります。

コールスタックビュー(バックトレースビュー)
- イメージ画像
- 現在実行中の関数や、それ以前に呼ばれた関数の情報を表示します。この漠然とした「関数の情報」というのを普通は、スタックフレームといったりアクティベーションレコードといったりします。例外が発生した場合、このビューを見ればどのような流れで例外が発生したのかがすぐに分かります。

変数ビュー
- イメージ画像
- 変数の名前や型、値などを表示します。その変数がクラスなどの場合はさらに、スロット/メソッド/フィールドなどの付加的な情報も表示します。

ウォッチビュー
- 指定された名前や式の値を表示します。変数ビューが一覧なのに対して、こちらは特定の変数の値が知りたいときに使います。もしそれが評価できない式である場合は、それが素直に報告されます。

他にもIDE環境にあったら嬉しいかもしれないもの

逆アセンブルビュー(= CPUビュー、VMビュー)
- イメージ画像
- CPUのインストラクションやVMのインストラクションを直接表示します。めったに使いませんが、あると便利なことがあります。

スレッドビュー
- イメージ画像
- そのとき動いているスレッドの識別番号や、そのとき実行している関数の名前、優先順位などが表示されます。

ミニインタープリター = 式評価器
- ある環境内で任意の式を実行します。あればすごく便利です。

IDE環境の機能

ステップイントゥ（ソースレベルでのシングルステップ実行）
- プログラムを一行ごとに動かします。その行に関数呼び出しが含まれていた場合、その関数の一番最初の行で止まります．ソースレベルでのシングルステップ実行です。(ちなみに、単なるシングルステップ実行だともっと下位のVMやCPUレベルでのシングルステップ実行を指すことがあります)

ステップオーバー
- ステップイントゥと似ています。ソースレベルで一行ごとに動かしますが、もしそこに関数呼び出しが含まれていた場合、その呼び出しが終わった直後のプログラムが止まれる個所で止まります。その呼び出し先で例外が発生した場合はその限りではありません。

ブレークポイント
- 任意のソース行が実行される直前に、プログラムの進行を止めます。付帯条件をつけその条件が真の場合のみブレークすることや、CPUやVMのインストラクションレベルでのブレークが可能な環境もあります。

データブレークポイント
- ソースにではなくデータに設定されるブレークポイント。指定されたデータの内容が書き換えられるとブレークが行われます。

デバッガの基本的なアーキテクチャ

ネイティブコードのデバッグでも、適切なサポートがされた環境（＝.NETやJava、適切なデバッグAPIを備えたLL言語など）でのデバッグでも、仕組み自体にはそこまで大きな変化はありません。ただ、難易度は大分変わってきます。

その前に用語説明をしておきます。

デバッガ: ビジュアルな表示を担当し、先に説明したビューの管理もここが受け持ちます。eclipseとかvcの本体などのことです。
デバッギ（ターゲットプログラム): デバッグされるプログラムそのもののことを指します。
スタブデバッガ: リモートデバッグ時にはデバッギとデバッガとの間に、それらの通信を受け持つ何かが必要になります。それをここではスタブデバッガと呼んでいます。

一般的なアーキテクチャ

デバッガのプログラムにはいくつかのパターンがありますが、そのメインループはおおむね同じような構造になることが多いようです。重要な違いとなるポイントは以下の２つです。

シングルスレッドか、マルチスレッドか
デバッギとデバッガの通信方法はブロッキング形式か、ノンブロッキング形式か、もしくは割り込みか

典型的なデバッガのプログラムを擬似コードを書くとこのようになります。

ノンブロッキング通信・シングルスレッドの場合

 (define (main-loop)
    ; もしデバッギメッセージがあるのならそれを処理します
    (when (check-debuggee-message)
       (handle-debuggee-message))
    ; もしGUIへのメッセージがあればそれを処理します
    (when (check-gui-message)
       (handle-gui-message))
    (main-loop))

ブロッキング通信・マルチスレッドの場合

 第一スレッド
 ; デバッギからの通知を待ち、来た場合はそれを処理します
 (define (debuggee-thread-loop)
    (wait-debuggee-event) ; デバッギからの通知を待ちます
    (post-event)          ; GUIに対してデバッギの状態をイベントとして通知
    (continue-debugee)    ; デバッギを再開
    (debuggee-thread-loop))
 
 第二スレッド
 ; GUIなどのメインループです
 (define (main-loop)
    (wait-message) ; メッセージを待ちます(ブロッキング呼び出し)
    (cond
     ((gui-message?) ...) ; GUIへのメッセージならそれを処理します
     ((debuggee-message?) ...)) ; デバッギメッセージならそれを処理します
    (main-loop))

インプロセスデバッガ

インプロセスデバッガとは、デバッガとデバッギが同一プロセス上にあるデバッガです。

Windows3.1や一部のスクリプト言語などではこの形を採用しています。また他の形態の場合でも、インプロセスのスタブを挟むことによりインプロセスデバッガの利点を享受していることがあるようです。

  --------------------------------------         --------------------------------------
                                  関数コールバックなど
 
         　　　デバッギ                  ←－→                  デバッガ
 
      (ブレークポイントや例外などの                 (表示やデバッギの制御などを担当)
    何か重要な出来事をデバッガに通知)
  --------------------------------------         --------------------------------------

利点
- デバッガはデバッギの関数などを直接呼び出すことが可能
- デバッギのスタックトレースや変数アドレスなどが自由に読み書きできる
- 特定のコードをデバッギ空間で実行することが簡単にできる
- プロセス間通信やTCP/IPによるオーバーヘッドが存在しない
欠点
- メモリやその他のリソースが間違って上書きされてしまう可能性がある
- すでに実行されている既存プログラムへのアタッチやデタッチが困難になることがある
- デバッガかデバッギがクラッシュすると、そのもう一方を巻き込んでしまうことが多い

アウトプロセスデバッガ

アウトプロセスデバッガとは、デバッガとデバッギのプロセス空間を完全に分離したデバッガです。

ただしデバッガによっては１００％綺麗に分かれているわけではなく、一部の処理をデバッギのプロセス上で処理してしまうデバッガもあります。 Windows3.1以降のWindowsやLinuxなどではこの形態を採用しており、 dotnetではそのほとんどをアウトプロセスで処理しますが、一部の処理はインプロセスのヘルパースレッドに委譲しているようです。

  --------------------------------------         --------------------------------------
                                     プロセス間通信
 
         　　　デバッギ                  ←－→                  デバッガ
 
      (ブレークポイントや例外などの                 (表示やデバッギの制御などを担当)
    何か重要な出来事をデバッガに通知)
  --------------------------------------         --------------------------------------

利点
- デバッガのデバッギへの影響を少なくできる
- アタッチやデタッチの仕組みがインプロセスに比べて作りやすい
欠点
- スタックトレースや変数値の取得にプロセス間通信が必要
- プロセス間通信によるオーバーヘッドがある

リモートデバッガの場合

リモートデバッガとはデバッギとデバッガを完全に分離し、別のマシン上でデバッグすることを可能にしたデバッガです。

Javaやeclipseではこのような形を採用しています。特にJavaの場合はこの形を必ず採用することが決まっており、 TCP/IP通信で使われるワイヤプロトコルの仕様も規格で定められています。

 ---------------------------       ---------------------------         ---------------------------
                 ＯＳや環境に依存した何らかの通信        TCP/IPなどによる通信
 
         デバッギ            －→     　スタブデバッガ          ←－→          デバッガ
                                                          (ワイヤプロトコル)
 
     (アプリケーション)            (デバッガとの通信などを担当)                (表示を担当)
 ---------------------------       ---------------------------         ---------------------------

利点
- デバッガとデバッギが完全に分離されることによって、デバッガのデバッギへの影響が最小限に抑えられる
- 一般的な話として、デバッガを他言語に対応させることが簡単
- アタッチ/デタッチ機構を比較的楽に実現できる
欠点
- インプロセス通信やアウトプロセス通信に比べて遅い
- スタブデバッガを「いつ・誰が」起動するのか問題になることがある
- 既存のものが無い場合、ワイヤプロトコルの仕様を決める必要がある

デバッガの基本的なアーキテクチャ　その２

アタッチとデタッチ

「すでに走っているプログラムに対してデバッグを開始できるのか？」というのは実は結構重要な問題で、これができない場合、デバッガはデバッギの実行時からデバッギに対して何らかの関与をする必要があります。このような場合、デバッガは何らかの特別なAPIを使いデバッギの実行を開始します。

多くのスクリプト言語ではアタッチとデタッチはできません。これは大抵のスクリプト言語では、デバッガとの通信手段がインプロセスなものしかないことやそもそもそういうことをしたいことがあまり多くないというのが原因にあると思われます。普通はスクリプトの開始直前に、デバッグ用のコールバック関数を設定しデバッギを開始します。

Windowsでは他プロセスへのアタッチができます。ただしデタッチはＸＰ以上ＯＳでないとできません。デバッグを開始するには、新規プロセスを開始する場合にはCreateProcessというAPIに特殊なフラグを設定してデバッギを起動するか、 DebugActiveProcessというAPIを用いて既存プログラムにアタッチします。デタッチにはDebugActiveProcessStopというAPIを使いますが、前述のとおりこれは新しいバージョンでしか使うことができません。

Javaの場合、デバッグAPIの仕様がリモートデバッグを前提とした仕様になっており、デバッグ対象となるデバッギは起動の段階でエージェント(前述の説明におけるスタブデバッガにあたるもの)とともに起動される必要があります。エージェント付きで起動されたJavaプログラムには、デバッグAPIを通じて自由にアタッチ/デタッチを行うことができます。

デバッギとデバッガの通信手段

これにはいくつかの種類があります。代表的なものは以下のとおりです。

コールバック(割り込み関数)
- デバッギからデバッガへの通知に関数を使います。
待機関数
- デバッギからの通知を待つ関数と、デバッギの実行を再開する関数により通知を行います。スレッドやミューテックスなどの待機関数に似ています。
TCP/IP通信
- ワイヤプロトコルによる通知を行います。

コードブレークポイント

コードブレークには大別して二つのやり方があります。

まず第一は、関数の呼び出しや新しい行の実行時など何か特定のイベントごとにデバッギからデバッガへ何らかの通知を行う方法です。その時に実行コードの位置などを一緒に通知することでデバッガはそこがブレークポイントであるかどうかを判断することができます。もしブレークする場合は、単純にデバッギへ制御を返さないことで実現できます。

第二の方法は、実行コードのブレークしたい場所に対して何らかのトラップコードを埋め込んでしまうという方法です。トラップコードを検知したらデバッギはそれをデバッガに伝えます。この方法を使うとデバッギの速度低下を最小限に抑えることが可能になります。

ネイティブコードの場合

ネイティブコードの場合、デバッガはＣＰＵ/ＯＳ/デバッグデータベースという三者の協力により実現しています。具体的には

プロセッサの、トラップやフォールトの検出機構
ＯＳの、それらを捕まえデバッガに報告する機能
デバッグシンボルテーブルから、シンボルや関数フレーム情報などを検索する機能

の三つの機構が必要になります。詳しくは後ほど紹介します。

Last modified : 2009/01/30 12:06:24 UTC