Section 3
Prev     Next

3   一般的な解析の原則

本アノテーション体系では,統語構造をラベル付きの括弧によって表示する。すべての左括弧がラベルを付加されるが,これは木構造のノードを表示している。ラベルは単語レベルの品詞(N,P,等)か,または句のレベルのカテゴリーを表す。句レベルのカテゴリーは,構成素の形式を最低限度表す基本的ラベル(NP,PP,等)か,またはハイフンに後続して機能を示す付加的なラベルを伴う(NP-SBJ = 主語,IP-REL = 関係節,IP-SMC = 小節,等)ことがある。大多数の場合,付加的なラベルは1つだけであるが,2つ以上付加されることもありうる。構造には VP(動詞句)のレベルは表示されず,そのため節の構造は一般に平坦で,複数の枝分かれノードをもつ。その中で,IP(節)がすべての文レベルの構成素を直接支配する。狭義の動詞(VB),動詞に類する語(VB0,VB2),助動詞やコピュラ(AX,AXD,等),そして場合によって助詞(P)は,それぞれ個別にラベル付けされ,IP に支配される。助詞(P)名詞句や節に付加されて助詞句(PP)を作る。PP のラベルは決して機能を表示する拡張的なラベル付けを受けることはない。しかし,その直後の姉妹ノードが PP のもつ曖昧性の解消のための情報を提供することはある。この場合,曖昧性解消情報を表示する終端記号は最初と最後に ‘*’ を伴う。句ラベルがもつ文法機能に応じてその下に様々な空要素が出現することができるが,その場合,終端記号は最初と最後に ‘*’ を使って表示される。

     以下の例にもとづいて説明する。

(1)
貴社の記者は汽車で帰社した

統語解析木は以下の通りである。

gr n1 IP-MAT n2 PP n1--n2 n10 NP-SBJ n1--n10 n12 PP n1--n12 n16 VB n1--n16 n17 VB0 n1--n17 n18 AXD n1--n18 n3 NP n2--n3 n9 P n2--n9 n4 PP n3--n4 n8 N n3--n8 n5 NP n4--n5 n7 P n4--n7 n6 N n5--n6 t6 貴社 n6--t6 t7 n7--t7 t8 記者 n8--t8 t9 n9--t9 n11 * n10--n11 n13 NP n12--n13 n15 P n12--n15 n14 N n13--n14 t14 汽車 n14--t14 t15 n15--t15 t16 帰社 n16--t16 t17 n17--t17 t18 n18--t18

括弧表示では以下のようになる。

( (IP-MAT (PP (NP (PP (NP (N 貴社))
                      (P の))
                  (N 記者))
              (P は))
          (NP-SBJ *)
          (PP (NP (N 汽車))
              (P で))
          (VB 帰社)
          (VB0 し)
          (AXD た))
  (ID 34_misc_BUFFALO))

     上記の (NP-SBJ *) は,曖昧性解消のための情報として付加されたもので,その直前のとりたて助詞「は」を含む助詞句(PP)が主語としての主要文法役割をもつことを示している。また,(NP-OB1 *を*) は,直前の助詞「を」を伴う PP が第一目的語としての主要文法役割を果たしていることを示す。これに対して,助詞「の」を伴い名詞を修飾している PP と助詞「で」を伴い付加詞となっている PP に対しては,それらが必須文法役割を果たしていないために,特定の文法機能が示されていない。

     すべての単語には,単語レベルの品詞ラベルが付加される。句を投射する単語(N,P,ADV,等)は句の主要部である。句の主要部はの句のノード(NP,PP,ADVP,等)に直接支配され,主要部に対する修飾部(modifier)と補部(complement)は,主要部の姉妹となる。Xバー理論で用いられているような中間レベルの構造(N',ADV',等)が明示的に表示されることは決してない。このようなフラットな句構造を補うために,句ラベルを拡張して機能表示を行い,修飾部と補部を区別する。

     実際には,単一の語からなる修飾部が句を投射せず,他の語を主要部とする句ノードの直下に現れるパターンがいくつか見られる。例えば,ADV は NUMCLP の修飾部として(「わずか35分」),あるいは位置や等級・程度・量の値を表す語の修飾部として(「ちょっと前に」「ずーっと前から」「最も内陸側に」「凄くたくさんの」「もう少し長く」),NP の直下に現れることがある。また,名詞に先行する修飾語 D, WD や PNL は補部をもたず,また原理的に修飾を受けることがない。これらの語は修飾先である主要部の N が投射する NP により直接支配される(「例の人は」「どの市町村でも」「ただの流行として」等)。

     修飾部ではないが,間投詞(INTJ)は独自の INTJP を投射せずに IP に直接支配される位置に出現することができる。さらに,開始誤り(FS),外来語(FW),および句読点(PU)は自分独自の句ノードを投射することは決して無い。

     最後に,活用語(述語)は通常主要部としてさまざまなタイプの IP を投射するが,述語と共起してそれを拡張し,より大きな語の連鎖の一部となる様々な要素がある。例えば,主節において動詞語幹は (PASS られ) のようなヴォイス形態素や (AX やすい) のような派生形態素,助詞「て」等によって拡張される。「て」にはさらに,アスペクト的,ダイクティックな (VB2 いる) や (VB くる) のような助動詞が後続する。また,(NEG ない) のような否定辞,過去助動詞「た」や,用言の連体形に後続し,談話に関連する意味や推量を表す (P の) (AX だ) および (MD そう) (AX だ),モーダル助動詞 (MD だろう) や (MD よう) (AX だ),さらに (MD らしい) や (MD べし) のようなものもある。またこれらの語の連鎖の内部には「は,も,こそ,ばかり,のみ,さえ」等の様々な助詞が出現することがある。これらはすべて IP の主要部となる,拡張された動詞的語連鎖を構成する部分であると見なされる。

     以上の事柄を考慮して,句構造を以下のように記述することができる。

gr n1 XP n2 Y n1--n2 n3 YP n1--n3 n4 ZP n1--n4 n5 X n1--n5 t2 single-word-modifier n2--t2 t3 multi-word-modifier n3--t3 t4 complement n4--t4 t5 head n5--t5

括弧表示に従うと,以下のようになる。

  (XP (Y 単一の単語からなる修飾部)
      (YP 複数の単語からなる修飾部)
      (ZP 補部)
      (X 主要部))

     原則として,主要部(N,P,ADV,等)は明示され,句のレベルのカテゴリー(NP,PP,ADVP,等)と一致する。

  (PP (NP (N 街))
      (P で))

  (ADVP (ADV とても))

     しかし,単語のレベルの構成素と句のカテゴリーが一致しないこともある。例えば,主要部が省略されていたり(下の右方節点繰上げ構文の例では,IP-ADV の下の述語が欠如している),または,主要部が一般的なカテゴリーのラベルではなく,より特殊なラベルをもっていたり(下の例で,代名詞(PRO)は名詞(N)の下位クラスであり,NP の主要部となっている)する。

  ( (IP-MAT (NP-SBJ *pro*)
            ...
            (IP-ADV (PP (NP (N 指揮))
                        (P に))
                    (NP-OB1 (NPR ヘンリク・シェーファー)))  ← 省略された主要部
            (CONJ *)
            (PU 、)
            (PP (NP (N ピアノ))
                (P に))
            (PP (NP (NPR 萩原麻未))
                (P を))
            (NP-OB1 *を*)
            (VB 迎え)
            (AX ます)
            (PU 。))
    (ID 99_newswire_KAHOKU_00040_K201401060A0KI0XX00001))

  (NP (PRO 彼))   ← 主要部がより特殊なラベルをもつ例

NP の主要部に対する特殊なラベルとして,固有名詞(NPR),量化詞(Q),代名詞(PRO),疑問代名詞(WPRO),中間名詞句(NML),および括弧挿入句(PRN)がある。例外的な場合として,NUMCL(これ自体が句カテゴリーだが)は常に NP を投射する。

     しかしながら,句カテゴリーがそれにマッチする主要部を伴わないケースが他にもある。まず,屈折要素として述語は規則的に IP の主要部となるが,述語自体はその核として,動詞(VB),イ形容詞(ADJI),ナ形容詞(ADJI+AX),述語名詞句(NP-PRD+AX)等,様々な品詞に属する要素をもつことができる。数量詞句(NUMCLP)において,数詞(NUM)と助数詞(CL)は互いに独立しており,右側の要素(つまり,通常は CL)が主要部ではあるが,NUM と CL の両方が句カテゴリーである NUMCLP によって直接支配される。副詞句(ADVP)は,ナ形容詞(ADJN+AX)や イ形容詞(ADJI)の連用形を主要部とすることがある(ただし,イ形容詞の連用形が主語を伴わずに副詞的に用いられている場合や,単独の動詞の「て」形から派生した副詞「決して」「辛うじて」「初めて」「挙って」」「予て」等は ADV とラベル付けされる)。NUMCLP は規則的に NP を投射する。連体詞節(PNLP)はさまざまなカテゴリーを支配することができる。最後に,接続詞句(CONJP)の主要部として,助詞(P),並列接続詞(CONJ)や「裸」の句カテゴリーが現れることがある。


Prev     Next
Section 2  Home  Section 4