主辞駆動句構造文法


Head-driven_phrase_structure_grammar
主辞駆動句構造文法(HPSG)は、CarlPollardとIvanSagによって開発された高度に語彙化された制約ベースの文法 です。 依存文法とは対照的に、これは一種の句構造文法であり、一般化された句構造文法のすぐ後継です。HPSGは、コンピューターサイエンス(データ型理論や知識表現)などの他の分野を利用し、フェルディナンドソシュールの記号の概念を使用しています。。統一された形式を使用し、モジュール方式で編成されているため、自然言語処理に魅力的です。
HPSG文法には、原則と文法規則、および通常は文法に属するとは見なされないレキシコンエントリが含まれます。形式主義は語彙主義に基づいています。これは、レキシコンが単なるエントリのリストではないことを意味します。それ自体が豊かに構造化されています。個々のエントリはタイプでマークされています。タイプは階層を形成します。文法の初期のバージョンは、文法規則(スキーマ)がほとんどなく、非常に語彙化されていました。最近の研究では、より多くのより豊富なルールが追加される傾向があり、構文文法のようになっています。
HPSGが扱う基本的なタイプは記号です。単語とフレーズは、記号の2つの異なるサブタイプです。単語には2つの機能が(音、音声形式)と(構文および意味情報)で、どちらもサブ機能に分割されています。サインとルールは、型付き 素性構造として形式化されます。

コンテンツ
1 サンプル文法
2 実装
3 も参照してください
4 参考文献
5 参考文献
6 外部リンク

サンプル文法
HPSGは、タイプ階層内の位置と、属性値マトリックス(AVM)で表される内部の素性構造によって定義される記号を組み合わせることにより、文字列を生成します。 機能は、タイプまたはタイプのリストを値として取り、これらの値は、独自の機能構造を持つ場合が文法規則は、主に、記号が相互に配置する制約によって表現されます。記号の素性構造は、音韻的、構文的、および意味論的特性を記述します。一般的な表記法では、AVMは大文字の機能と、イタリック体の小文字のタイプで記述されます。AVMの番号付きインデックスは、トークンの同一の値を表します。
以下の単語(この場合は「週末の素敵な散歩」のような名詞ではなく動詞)の簡略化されたAVMでは、動詞のカテゴリ情報(CAT)は、それを説明する機能(HEAD)とその引数を説明する機能(VALENCE)。
AVM
  「歩く」は、動詞型の頭を持つ単語型の記号です。自動詞として、「歩く」には補語はありませんが、第三者の単数名詞である主語が必要です。件名の意味値(CONTENT)は、動詞の唯一の引数(歩く個人)と一緒に索引付けされます。次の「彼女」のAVMは、これらの要件を満たすことができるSYNSEM値を持つ記号を表します。
She-avm.png
  タイプフレーズの記号は、1つ以上の子と統合され、情報を上向きに伝播します。次のAVMは、 head-subj-phraseの即時支配ルールをエンコードします。これには、2つの子が必要です。頭の子(動詞)と、動詞のSUBJ制約を満たす非頭の子です。
Head-subj-avm.png
  最終結果は、動詞の頭、空のサブカテゴリ機能、および2人の子を順序付ける音韻値を持つ記号です。
HPSGの実際の文法は完全に素性構造で構成されていますが、言語学者は、同等のAVMが扱いにくい標識の統一を表すためにツリーを使用することがよく
Head-subj-tree.png
 

実装
HPSG形式に基づくさまざまなパーサーが作成されており、現在、最適化が調査されています。ドイツ語の 文を分析するシステムの例は、 FreieUniversitätBerlinによって提供されています。さらに、ベルリン自由大学の文法グループのCoreGram プロジェクトは、TRALEシステムに実装されたオープンソースの文法を提供します。現在、ドイツ語、デンマーク語、北京語、マルタ語、、ペルシア語の文法があり、共通のコアを共有して公開されています。
HPSGイニシアチブを使用したDeepLinguisticProcessing( DELPH-IN )では、さまざまな言語の大規模なHPSG文法が開発されています。英語、 ドイツ語、、および日本語の広範囲にわたる文法は、オープンソースライセンスの下で利用可能です。これらの文法は、相互に互換性のあるさまざまなオープンソースHPSGパーサー(LKB、PET、 Ace、および同意)で使用できます。これらはすべて、「最小再帰セマンティクス」、MRSの形式でセマンティック表現を生成します。 HPSG形式の宣言型の性質は、これらの計算文法が通常、構文解析と生成(セマンティック入力から表面文字列を生成する)の両方に使用できることを意味します。同じくDELPH-INによって配布されているツリーバンクは、文法の開発とテスト、および構文解析時のもっともらしい解釈(または生成時の実現)を決定するためのランキングモデルのトレーニングに使用されます。
Enjuは、日本の東京大学の辻井研究室によって開発された、英語用の無料で入手可能な広範囲の確率的HPSGパーサーです。

も参照してください
語彙機能文法
最小限の再帰セマンティクス
関係文法
状況セマンティクス
構文
変形文法
タイプ説明言語

参考文献
^ 「HPSG」。
^ ミュラーS、アベイレA、ボーズリーRD、ケーニッヒJP、編 (2021)。主辞駆動句構造文法:ハンドブック(pdf)。ベルリン:ランゲージサイエンスプレス。土井:10.5281/zenodo.5543318。ISBN
 978-3-96110-255-6。
^ ポラード、カール、およびイワンA.サグ。1987年。情報ベースの構文とセマンティクス。ボリューム1。基本。CLSIレクチャーノート13。
^ ポラード、カール; アイバンA.サグ。(1994)。主辞駆動句構造文法。シカゴ:シカゴプレス大学。
^ Sag、IvanA.1997.英語の関係節構文。言語学ジャーナル。33.2:431-484 ^ サグ、イワンA .; トーマス・ワソフ; &エミリーベンダー。(2003)。構文理論:正式な紹介。第2版 シカゴ:シカゴプレス大学。
^ バベルシステム:HPSGインタラクティブ ^ CoreGramプロジェクト ^ ベリグラム ^ ダングラム ^ 中国語 ^ マルタ語 ^ ペルシア語 ^ DELPH-IN:オープンソースのディーププロセッシング ^ 英語のリソース文法と語彙 ^ Berthold Crysmann ^ JacyTop-HPSGを使用した深い言語処理(DELPH-IN) ^ DELPH-INPETパーサー ^ エース:回答制約エンジン ^ 文法工学に同意する ^ Copestake、A.、Flickinger、D.、Pollard、C.、およびSag、IA(2005)。最小再帰セマンティクス:はじめに。言語と計算に関する研究、3(2-3)、281-332。
^ 辻ラボ:エンジュパーサーのホームページ2010年3月7日 ウェイバックマシンでアーカイブ(2009年11月24日取得)

参考文献
Carl Pollard、Ivan A. Sag(1987):情報ベースの構文とセマンティクス。ボリューム1:基本。スタンフォード:CSLI出版物。
Carl Pollard、Ivan A. Sag(1994):主辞駆動句構造文法。シカゴ:シカゴプレス大学。()
Ivan A. Sag、Thomas Wasow、Emily M. Bender(2003):構文理論:正式な紹介、第2版。シカゴ:シカゴプレス大学。()
レバイン、ロバートD .; W. Detmar Meurers(2006)。「主辞駆動句構造文法:言語学的アプローチ、正式な基礎、および計算の実現」 (PDF)。キースブラウン(編)。言語と言語学の百科事典(第2版)。オックスフォード:エルゼビア。2008年9月5日にオリジナル (PDF)からアーカイブされました。
ミュラー、ステファン(2013)。「すべてを統一する:より単純な構文、構文文法、ミニマリズム、およびHPSGに関するいくつかの注意」。言語。89(4):920–950。土井:10.1353/lan.2013.0061。

外部リンク
スタンフォードHPSGホームページ ウェイバックマシンでアーカイブされた2020-03-13–年次HPSG会議のオンライン議事録が含まれています
オハイオ州立HPSGホームページ
主辞駆動句構造文法に関する国際会議
HPSG文法開発のためのDELPH-INネットワーク
HPSGの基本的な概要
HPSGと代替案の比較、および歴史的展望
HPSG出版物の参考文献
AVMを描画するためのLaTeXパッケージ–ドキュメントが含まれています”