第２章　演習問題解答例

第２章　演習問題解答例

演習１演習２演習３演習４演習５演習６演習７演習８

演習１　

(1-1) 「彼だけに話した」

(1-2) 「彼にだけ話した」

(2-1) 「その病気は、この薬だけで治せる」

(2-2) 「その病気は、この薬でだけ治せる」

のように，「だけに」と「にだけ」，「だけで」と「でだけ」はどちらも正しい表現である．したがって，2単語間の連接可能性を使って文節の文法を記述すると次のように繰り返しを行った表現も正しい文節として認めることになる．

「彼にだけにだけにだけに」

「この薬だけでだけでだけで」

演習２　（下の線が1行に収まるようにウィンドウを広げてください）

--------------------------------------------------------------------------------------------------------------------------------------------

agenda open result

----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

step.1 [(0,0,δ)] []

step.2 [] [(0,0,δ)]

step.4 [] [] [(0,0,δ)]

step.5 [(0,1,毛),(0,2,怪我)] [] [(0,0,δ)]

step.7 [] [(0,2,怪我),( 0,1,毛)] [(0,0,δ)]

step.2 [] [( 0,1,毛)] [(0,0,δ),( 0,2,怪我)]

step.4 [] [( 0,1,毛)] [(0,0,δ),( 0,2,怪我)]

step.5 [(2,2,δ),(2,3,を)] [( 0,1,毛)] [(0,0,δ),( 0,2,怪我)]

step.7 [] [(2,3,を), (2,2,δ),(0,1,毛)] [(0,0,δ),( 0,2,怪我)]

step.2 [] [(2,2,δ),(0,1,毛)] [(0,0,δ),(0,2,怪我) ,(2,3,を)]

step.4 [] [(2,2,δ),(0,1,毛)] [(0,0,δ),(0,2,怪我) ,(2,3,を)]

step.5^† [(3,3,δ)] [(2,2,δ),(0,1,毛)] [(0,0,δ),(0,2,怪我) ,(2,3,を)]

step.7 [] [(3,3,δ),(2,2,δ),(0,1,毛)] [(0,0,δ),(0,2,怪我) ,(2,3,を)]

step.2 [] [(2,2,δ),(0,1,毛)] [(0,0,δ),(0,2,怪我) ,(2,3,を),(3,3,δ)]

step.4 [] [(2,2,δ),(0,1,毛)] [(0,0,δ),(0,2,怪我) ,(2,3,を),(3,3,δ)]

step.5^‡ [(3,6,治す),(3,5,なお),( 3,4名)] [(2,2,δ) ,(0,1,毛)] [(0,0,δ),(0,2,怪我) ,(2,3,を),(3,3,δ)]

step.7 [] [(3,4名),(3,5,なお),( 3,6,治す),(2,2,δ),(0,1,毛)] [(0,0,δ),(0,2,怪我) ,(2,3,を),(3,3,δ)]

step.2 [] [(3,5,なお),( 3,6,治す),(2,2,δ),(0,1,毛)] [(0,0,δ),(0,2,怪我) ,(2,3,を),(3,3,δ), (3,4名)]

step.4 [] [(3,5,なお),( 3,6,治す),(2,2,δ),(0,1,毛)] [(0,0,δ),(0,2,怪我) ,(2,3,を),(3,3,δ),(3,4名)]

step.5 [(4,4,δ)] [(3,5,なお),( 3,6,治す),(2,2,δ),(0,1,毛)] [(0,0,δ),(0,2,怪我) ,(2,3,を),(3,3,δ),(3,4名)]

step.7 [] [(4,4,δ),(3,5,なお),( 3,6,治す),(2,2,δ),(0,1,毛)] [(0,0,δ),(0,2,怪我) ,(2,3,を),(3,3,δ),(3,4名)]

step.2 [] [(3,5,なお),( 3,6,治す),(2,2,δ),(0,1,毛)] [(0,0,δ),(0,2,怪我) ,(2,3,を),(3,3,δ),(3,4名),(4,4,δ)]

step.4 [] [(3,5,なお),( 3,6,治す),(2,2,δ),(0,1,毛)] [(0,0,δ),(0,2,怪我) ,(2,3,を),(3,3,δ),(3,4名),(4,4,δ)]

step.5 [(4,6,押す),(4,6,雄)] [(3,5,なお),( 3,6,治す),(2,2,δ),(0,1,毛)] [(0,0,δ),(0,2,怪我) ,(2,3,を),(3,3,δ),(3,4名),(4,4,δ)]

step.7 [] [(4,6,雄),(4,6,押す),(3,5,なお),( 3,6,治す), [(0,0,δ),(0,2,怪我) ,(2,3,を),(3,3,δ),(3,4名),(4,4,δ)]

(2,2,δ),(0,1,毛)]

step.2 [] [(4,6,押す),(4,4,δ),(3,5,なお),( 3,6,治す), [(0,0,δ),(0,2,怪我) ,(2,3,を) ,(3,3,δ),(3,4名),(4,4,δ),

(2,2,δ),(0,1,毛)] (4,6,雄)]

step.3 終了

----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

演習３　

解析を失敗する原因は，入力文中の未登録語（システムの単語辞書に登録されていない単語，未知語ともいう．）である．ただし，入力文字列に未登録語が存在していても解析が失敗するとは限らない．単語の集合｛怪我（けが），毛（け），蛾（が），を｝と入力文字列「けがを」について考えてみる．

(1)「怪我」が未登録語の場合

システムの単語辞書には｛毛（け），蛾（が），を｝が登録されているので「けがを」は「毛　蛾　を」と解析される．

(2)「怪我」と「蛾」が未登録語の場合

システムの単語辞書には｛毛（け），を｝しか登録されていないので解析に失敗する．「怪我」と「毛」が未登録語の場合も同様に解析に失敗する．

演習４　

例えば，演習２の解答例では，位置3で実行される1回目のstep.5と2回目のstep.5で同じ位置での辞書検索が行われている．この問題を回避する方法としては次のようなものが考えられる．

(1) 単語辞書を自立語辞書と付属語辞書に分割し，step.5における辞書検索を次のように場合分けする．

if(M_l = δ) 自立語辞書を検索する

else 付属語辞書を検索する

(2) 次のように，文節内の連接可能性関数cを文内の連接可能性関数Cに拡張して，ダミーの形態素δの使用を止める．

c(w₁,w₂)=1 または (c(w₁,δ)=1 かつ c(δ,w₂)=1) ならば C(w₁,w₂)=1 である

そうでないならば　C(w₁,w₂)=0 である

演習５　

(24) けがながい

文(24)を図2.10に示したアルゴリズムで解析すると次のラティス構造が展開される．形態素間の接続コストを1とし，δとの接続コストを0とすると図中の太線で示した「怪我　長い」が最小コスト解になる．

図中，赤い線はδを介在する接続を示しているが，例えば，

c(名詞,δ) = 20

c(助詞,δ) = 0

c(δ,w) = 0

として，後続するδとの接続コストで文節末らしさを与える（名詞は文節末になりにくいが，助詞は文節末になりやすい）と，最小コスト解は次の図に示すように「毛　が　長い」となる．

演習６　解析表を作成するアルゴリズムを次に示す．解析表ができたら単純な深さ優先のアルゴリズムですべての文節を取り出すことができる．

step.1 T( i ) = φ ( i = j, j+1, …, n) ;

step.2 文字列 c_j+1c_j+2…c_n の先頭から始まるすべての自立語 M (morph(c_j+1c_j+2…c_k,M)) について2項組 ( j, M) を作成して集合 T(k) に追加する．

step.3 i = j+1 から始めて i<n のあいだ i を1ずつ増やしながら，step.3-1を繰り返す．

step.3-1 T( i )≠φならば，文字列 c_i+1c_i+2…c_k の先頭から始まるすべての付属語 M (morph(c_i+1c_i+2…c_k,M)) について，c(M_l,M)=1となる2項組(m,M_l) が集合T( i )に存在するならば，2項組 ( j, M) を作成して集合 T(k) に追加する．