2013年11月20日水曜日

熟語1つが流行するだけでも分布が変わったように見える

下の Google Books Ngram Viewer のグラフを見て欲しい。 フランス語において venir "来る"の到達点を示すために、 どういう前置詞が使われてきたかの変化を調べようとして見付けたものだ。

込みいった式を使っているが、要するに venir のあとに à, en, dans が 来る場合の中で en が使われる割合を示すためのグラフである。 青のグラフが示しているのは、それまで 10% ぐらいだった en が次にくる 確率が 1830年代から急速に上がり 30% ぐらいになったということである。

Ngram Viewer から年代ごとの用例を確認できるので、 見てみたところ venir en aide が、予想外に多いことが分かった。 そこで分母・分子ともにこの表現を除いたのが赤のグラフである。 これでは 1830年のあたりでほとんど変化がない。

"助ける" という意味ので目的語に"彼ら"を付けて、 leur venir à, les assister, les aider の中での最初のものの 内訳のグラフは下のようになる。 他の 2つは Grand Robert の aide の項で参照として 挙げられているものである。

このグラフにより venir en aide à が19世紀中頃から20世紀前半に よく使われた表現であることが分かる。

辞書の項目に時代性の説明があるものが 手持ちの辞書やネットのものでは見付けられなかった。 TLFにも Syntagmes fréq. "頻繁な連辞" とあるだけである。

この例は、かなり大きなコーパスであっても、 実際の用例を確認しなければ、 熟語の流行という偶発的な要因で統語的な分析で誤る可能性があるという教訓になるであろう。

接頭辞の re- (2)

英語の接頭辞 re- についての続きである。

re-present が分かり易いと思う。 この re- /ri:/ は、reprsent の re- /rE/ と発音も意味も異なる。 後者の方はフランス語からの借用で、英語として意味を考えられるかは疑問である。

次のような例をネットやOEDから拾うことができる。

  1. Such a table lets us survey the role in the development of the story by different characters, as they are presented and re-presented in each phase in turn.
    ("re-present v.2" in OED)
  2. f you're not appropriately dressed, girls have difficulty wanting to kiss you. Basic 'School Outfit' works fine, I gave a girl a flower, got in kisses if I needed to, then left the area and re-presented them with flowers until I ran out, then repeated.
    (http://www.gamefaqs.com/boards/942199-bully-scholarship-edition/42518177)
  3. If [Coetzee] had stayed in the U.S. then his oeuvre may have been quite different, and possibly it is the forced return that re-presented him with the richness of South African society that was to feed the writing.
    (http://quarterlyconversation.com/j-m-coetzee-a-life-in-writing-by-j-c-kannemeyer)

(1)が繰り返し、(2)が相互、(3)が回復のような意味になる。 これらすべてに共通して次のような図式が考えられるだろう。 実際の動詞が意味するのは「⇒」の部分である。

(→)A(→)B⇒A

最初の括弧内の矢印が「活性化」すると(1)の繰り返し、 二番目の括弧内の矢印が「活性化」すると(2)の相互、 いずれも活性化しないと(3)の回復の意味になる。

むしろ重要なのはAに戻るというところだと考える。 ただし、やっかいなのは、A が項のときもあれば、 状態のときもあることだと思う。 状態のときには re- がアスペクトのマーカーになる。 フランス語の場合、これが拡大していると考えている。

2013年11月16日土曜日

S字カーブを伸ばす

暇というわけではないのだが、この前の項目のグラフを変換して、伸ばしてみた。 左軸が odds の対数目盛、右軸が正規分布の逆関数である。 300年分を全部つかうのは大変なので、5年ごとに数字を読んで、Google Spreadsheet でグラフにした。

ほとんど見分けがつかない。年との相関係数は、odds の対数が 0.9885..., 正規分布が 0.9852... なので、 誤差の範囲だろう。

2013年11月15日金曜日

英語・現在完了助動詞の変化についてのS字カーブ

Google Books Ngram Viewer でかなりきれいな S字カーブがみつかったので、 記念に保存。

英語の完了形は、 非対格動詞については be+過去分詞から have+過去分詞に変化している。 このグラフは is come から has come への変化について。 この2つの選択肢があるところで、has come の確率が S字で増えていくことが分かる。

暇ができたら、log (p/(1-p)) と正規分布累積分布関数の逆関数を かまして、どちらが直線っぽいか確認したい。

2013年11月1日金曜日

Google Books Ngram Viewer にみる whom と who

Google Books Ngram Viewer には、Ngram Composition という機能がある。 この機能は歴史言語学において非常に重要である。 変異形の割合変化のグラフが一瞬で書けてしまう。

疑問代名詞 who と whom が対格のときのグラフを描いてみよう。 検索文字列は次のようなものである。

(Who did he / (Whom did he + Who did he))

その結果は下のようなグラフになる。 100%に近いほど who が使われ、0%に近いほど whom が使われている。

宇賀治正朋先生の『英語史』(現代の英語学シリーズ、第8巻、開拓社、2000) には次のようにある(p.340)。

疑問詞 who が動詞または前置詞の目的語である場合、 本来の whom に代って主格形 who が用いられることがある。 15世紀中頃に始まり (OEDの初例は 1450 Paston Letters から)、 以後、目的語 who は次第に盛んになり、早くも17世紀後半には whom をしのぎ、 PEでは whom は稀にしか用いられない。

19世紀初頭には who へ変化していたが、 そのあと規範文法 prescriptive grammar が対格形 whom を広めていったことが グラフから見てとれる。 その後、書きことばでもゆっくりと主格形というより無標形の who に戻って きている。

Google Maps Engine Lite で方言地図

Google Maps Engine Liteを 使って、方言地図を作ってみたら、予想以上に簡単だった。 ただし、スタンプ式のものである。

  1. Google Drive のスプレッドシートでデータを作る。

    1行目を見出し行にする。 順序はどうでもいいが、方言形、代表形、地点の列を作る。 地点を自然言語で指定できるので楽である。 (他の表計算ソフトでももちろん可)

  2. Maps Engine にデータをインポートする。 レイヤーを選び、インポートで、Google ドライブから 読み込む。 このときポップアップの許可が必要になることがある。

  3. 目印の場所として使う列として「地点」を選ぶ。

  4. 地図上の目印として使う列として「方言形」を選ぶ。

  5. 目印のスタイルを変更する。 スタイルを選び、 データ列別のスタイルで列として「代表形」を選ぶ。

  6. 代表形ごとの目印の色や形を適当に変更する。

面倒なのは、データ入力ぐらい。 これも Google Drive でフォームを作っておけば、方言形や地点の入力は楽になるはず。 データが集まってから、 代表形をいくつか選んで、 スプレットシートの入力の検証でリストに入れておけば、 ここも省力化できそう。

2013年10月29日火曜日

接頭辞のre- (1)

以前 はじめての「ふたたび」という項を書いた。 英語にロマンス語から借用された re- も似てなくもない。

re- については [ri:] と強く読む場合と、 それ以外の場合は分けて考えて方がいいようである。 [ri:] は "繰り返して〜する" の意味で生産性がある。 しかし、それ以外の場合はロマンス語からの借用やそれを真似た派生で、 すでに生産性がないようだ。

re- はラテン語の接頭辞 re(d)- に由来する。 これは "後に" のような意味である。 これからいろいろな意味が出てくるが、 研究社『英語語源辞典』が繰り返し以外を10に分けているのは、細かく分けすぎだと思う。

construct と reconstruct のような対をみてみよう。 最初の例では、"再び"の意味で、2回ある。

(1) The bridge was originally constructed in 1946 and was reconstructed during the summer of 2003.

次の例では、1回しかなく、"戻す"という意味が出ている。ただし、この場合も発音は強い [ri:] である。

(2) The police reconstructed the scene of the accident.

re- の意味については、少し気になっているので、続くかもしれない。

2013年7月8日月曜日

しばらく休む

統計をみるかぎり、referer spam 以外でアクセスしている人がいないようですが、 レポートの採点が一段落するまで、お休みします。

2013年7月5日金曜日

子山羊田と子豚田

分析は全くしていないのだけど、メモ。 山羊田くんと豚田さんの続き。

文脈を入れないと「山羊田」/ヤ*ギタ/、「豚田] /ブタダ/なのだが、 「子山羊田」/コヤギダ/ 〜 /コヤ*ギタ/、「子豚田」/コブタダ/ だ と思う。 「子山羊」が平板でも発音できるためだろうか。

2013年7月4日木曜日

構文という考え方が好きではない

構文文法 construction grammar が実は好きではない。 他の単語や文脈がなければ構文が決められないことがあるからである。

(1)a. うち豆を作るために、豆を薄く叩いた。
   b. 血色を良く見せようと、紅を薄く叩いた。
   c. 不機嫌だったので掲示板で、論客たちを薄く叩いた。

この中で、いわゆる結果構文なのは a. のみである。 「薄く叩く」という部分からは決められない。 どの構文に属するかが意味により決定するのであれば、 〈単語の意味からだけでは意味が分からない〉という理由で 構文の必要性が主張できるのだろうか。

2013年7月3日水曜日

文法判断と外界知識

いわゆる結果構文というものがある。 英語に比べると、日本語で使える範囲はせまい。 それは事実であるが、微妙な例については、 むしろ外界の知識に左右されているのではないかと思う。

(1)a. She painted the wall red.
   b. She hammered the metal flat.
(2)a. 彼女は壁を赤く塗った。
   b.?彼女は金属を平らに叩いた。

(2)b. の許容度が低いらしいのだが、 実をいえば、僕個人には違和感がない。 金属の特徴の 1つに展性(叩くとのびる)があるのは当然なので、 なぜ不自然という判断になっているのか例文を読むたびに思う。

形容動詞「平らだ」が結果になるような例はいろいろな動詞でみつかる。 とくに料理関係で拾える。

(3)a. 餅は丸く平らに潰した形で、両面に焼き色があり、...
   b. 大麦の外皮をむいて加熱し、ローラーで平らに押したものが「押し麦」。
   c. うち豆とは、平らに叩いた大豆のことです。

形容詞「薄い」が結果になるものもある。

(4)a. 初めに出てきたものは民族料理で、タイ米を乾燥させて薄く潰したもの...
   b. 左上にあるのはカワエビっぽいエビを薄く押したもの。
   c. 肉を薄く叩くのは、少ない油で調理する為でもある。

(3)(4)については、b や c を料理に関心がない人に判断させると、 「非文」と判断をするかもしれないかと思う。 僕自身も実際に用例があるかを確認して、 目的語つきのものを読むまで不自然な感じがしていた。

2013年7月2日火曜日

ヲ/デの交替

日本語において、格付与が変わるのは前項のように 「△に▽を」と「△を▽で」というものが多い。 それ以外の場合として 「△で▽を」と「△を▽で」の場合がある。

(1)a. 森高は、この曲でドラムを叩いた。
   b. 森高は、この曲をドラムで叩いた。

これは「で」の役割分担が広いことによる。 パラフレーズすれば、 a. では「〜において」(処格)、 b. では「〜を使って」(具格)になる。 このような例では、意味の違う構文が2種類あると考えるより、 役割で決まると考える方が簡明であろう。

対格が受動者と言えない例もある。

(2)a. 僕は、「座頭市」で勝新を観た。
   b. 僕は、「座頭市」を勝新で観た。

b.は文脈か外界知識が必要かもしれない。 「座頭市」が複数作られていて、主演俳優が違うものがあるという 知識がないと違和感がある可能性がある。

2013年7月1日月曜日

格付与と「いっぱい感」

Goldberg による構文文法 construction grammar が流行っている。 そこでよく出てくるものの 1つのは、次のような対での意味の差である。

(1)a. Mary loaded the hay onto the truck.
   b. Mary loaded the truck with (the) hay.

a. ではトラックがいっぱいとは限らず(ただし、干し草は全体)、 b. ではトラックがいっぱいということである。

日本語の似た例を考えてみた。

(2)a. マリは、棚にバラを飾った。
   b. マリは、棚をバラで飾った。
(3)a. Aちゃんは、話にホラを盛った。
   b. Aちゃんは、話をホラで盛った。

英語の例ほど「いっぱい感」はないようであるが、(2)(3) いずれも a より b の 方がバラや噂が多いと感じるはずである。 しかし、下の(4)では、動詞の意味から「いっぱい感」は変わりようがないはずだ。

(4)a. マリは、瓶に水を満たした。
   b. マリは、瓶を水で満たした。

「いっぱい感」や「全体感」が出てくるのは、むしろ 対格の付与が示す受動者(patient)という役割から出ているのだと思う。 例えば、(2)b では、 少量のバラでは棚が影響を受けた感じがしないということにすぎない。

2013年6月28日金曜日

「ている」の例外的な用法

『日国』の「ている」の項の補注に次のようにある。

動詞のうち、 (イ)「立つ」「落ちる」「開く」「閉じる」「別れる」「できる(生じる意)」など、ある一時点で変化する作用を表わすものにつく場合は (2)[完了した状態がそのままたもたれていること]に限られる。 ... (ニ)その他のある時間にわたって継続する作用を表わす動詞、 「笑う」「鳴く」「降る」「遊ぶ」「あやす」「明滅する」などの場合、 (1)[ある動作・作用が持続、または繰り返し進行中である]の意になるが、「読む」「聞く」「食べる」「動く」などの場合は、(1)のほか(2)になることのあるものがある。

これらは文脈と時の副詞を入れれば、ひっくりかえせる。

(1)ごらんください。初の巨大ロボットです。スイッッチを入れました。 動いています。そうです。今ちょうど立っています。

(2)えーと。鶯ですか。もう鳴いていますよ。昨日聞きました。

上の引用の省略部分について。

(ハ)「ある」「いる」「できる(可能の意)」などは、標準語では「ている」を伴うことがない。

接尾辞的な「できる」では、「ている」形はかなり正式な文書でも みつかる。国土交通省の報告書から。

ASV装置が装備されていることで運転について「すごく安心できる」「まあ安心できる」が 70%を占めており、装置が搭載されていることで運転手も安心して運転できていることが判り、

「運転手」を「選手」、「運転できる」を可能動詞の「泳げる」に置き換えても大丈夫なので、これは可能の意のはずである。

2013年6月26日水曜日

freshwoman が意外に多い

大方の辞書に、freshman を両性にもちいると注釈がある。 OED にも、freshwoman が rare と書いてある。 昔のものなので、Google で検索してみた。

site:ac.uksite:edu
freshwomen約 65 件約 1,990 件
female freshmen約 15 件約 1,650 件
woman freshmen10 件

意外に freshwoman が強い。

2013年6月25日火曜日

女性名のアクセント

新明解のアクセント辞典に載っている範囲では、 次のようになっている。

  • 2拍以下が頭高型
  • 「〜よ」「〜え」が平板型
  • 「〜こ」「〜か」が 3拍が頭高型、4拍以上が前部の最後にアクセント
  • 外国人名は、外来語アクセント
  • カタカナ・ひらがなで用いられるようなものは、平板型

最後の規則の意味がよく分からないのだが、 「〜み」の「ひろみ」「なおみ」「ますみ」が例に出されている。

女性名で多そうなものだと「〜な」〜の」がある。 前部が 2拍で「ゆりな」が頭高、「ゆりの」が平板だと思う。 前部に意味がない「さりな」「さりの」だと両方、頭高のような気がする。

どういう規則なのか、全然分からない。

2013年6月24日月曜日

アクセントがない語

日本語以外を専門とするものとして、 アクセントのない語というのが、不思議なのである。

その単語自体にアクセントがなく、 近接する語と同じアクセントのグループに入る clitic 接語がある言語は多い。 ところが、日本語のアクセントのない語 (金田一語類の名詞 1類) は、 そうではなく、自立語である。

多くの方言では、 アクセントと声調についてのいろいろな規則があるので、 それを破らないためには、 〈アクセントがある〉という規則を破ればいいという 最適性理論的に考えたい。 ところが、1類には単純語と考えたい語が多いので、なやましい。

2013年6月21日金曜日

2拍+1拍と中高型の忌避

複合語とアクセント、連濁の関係で、ずっと悩んでいるわけである。

後半 1拍でわりときれいにアクセントが決まるものとして、 人名の「〜子」がある。 前半が 1拍「リ子」HL、2拍「サト子」HLL、 3拍「サクラ子」LHHL のようになる。 4拍以上の実例は知らないがふざけて作るようなものでは、 LHH...HL になる。

ここで問題なのは、2拍+1拍(合計 3拍)のときのみ、 アクセント位置が1つ目にずれていることである。 これは東京アクセントにおいて、 金田一語類3拍名詞 3類、5類のLHL がHLL に移行していることと 関係があると思う。

なお、人名以外の場合、「〜子」で連濁するものがある。 人名の「ミドリコ」も"嬰児"「ミドリゴ」も LHHL で アクセントは同じだ。 前半2拍では「タマゴ」が中高 LHL か平板、 「フタゴ」や「ダンゴ」が平板になっている。 ただし、 「ウジコ」や「ウリコ」も平板である。

2013年6月20日木曜日

漢語3拍「□語」のアクセント

「(漢字1字2拍)語」という形の単語を『逆引き広辞苑』で集め、 新明解のアクセント辞典と国語辞典でアクセントを調べてみた。

アクセントの分かる64語中、 頭高のみが7語 (「言語(げんご)」「豪語」「言語(ごんご)」「人語」「壮語」「面語」「妄語」)、 頭高と平板が 5語 (「閑語」「結語」「隻語」「発語(はつご)」「密語」)、 頭高と中高が 1語 (「激語」) だった。

「言語(げんご)「言語(ごんご)」「人語」「隻語」の 4語を除くと、 サ変動詞になるものばかりである。

しかし「造語」のようにサ変で使えるものでも平板がある。

いくつか仮説が考えられるが、 「語」の部分の意味が単語や言語のときは平板になり、 意味が語る行為のときには頭高なのかもしれない。 とはいえ全部は説明できそうにない。

2013年6月19日水曜日

「~~語」のアクセント

「〜〜語」という単語のアクセントが気になりだした。 手元の新明解のアクセント辞典と国語辞典では、 「語」自体は /go*/ なのだが、 「〜〜」の部分が1拍だと頭高型 (「華語」/ka*go/) 長い場合は平板型(「中国語」/cu:gokugo/、 ただし「中国」/cu*:goku/) のようである。

問題なのは、「〜〜」が2拍のときで、 頭高型の「言語」/ge*Ngo/ と平板型の「原語」/geNgo/ がある。 アクセント辞典では、名詞で頭高(「正史」/se*:si/) で、 動詞で平板(「制止」/se:si/)が多いとあるが、それとも違うようである。 「口語」は平板で、「豪語」は頭高だ。

「フラ語」「スペ語」のような新語は平板のようだ。

2013年6月18日火曜日

発音が同じ en- と in-

英語の前置詞の in の語源である √en は、 接頭辞として英語の in-、仏語の en-、ラテン語の in-、ギリシア語の en- になるはずである。 しかし、このうち英語、仏語、ラテン語のものの発音が /in/ なので、 英語とフランス語のものが混同されやすい。 実際、『リーダース+プラス』(EPWING CD-ROM版, 研究社, 1996)には 次のようにある。

★en- と in- は交換できる場合があるが, 《米》 は in-, 《英》 は en- を用いることが多い.

例によって、Google で検索。 フランス語では enflammer の inflame、 entraîner (意味は違う)の entrain だと次のようになる。

to inflameto enflameto intrainto entrain
site:edu約 11,500 件約 1,310 件約 14 件約 8,430 件
site:ac.uk約 4,410 件約 309 件---約 1,980 件

フランス語がない inarm と enshrine だと次のようになる。

to inarmto enarmto inshrineto enshrine
site:edu約 52 件1 件約 46 件約 7,370 件
site:ac.uk------2 件約 5,600 件

この範囲では辞書の記載形が強いとしか言いようがない。

2013年6月17日月曜日

フランス語風ラテン語彙

英語の語彙で数が多いのが、 フランス語風ラテン語彙とでも呼ぶべきものである。 綴りをみると、ほとんどの部分がラテン語なのであるが、 語末の部分だけが、フランス語の形 (ただし、現代フランス語とは異なることがある) になっている。 例えば、"性質" は、 ラテン語で主格が qualitas, 対格が qualitatem であるが、 現代フランス語で qualité, 英語で quality になっている。

これは英語がラテン語から借用するときに、 フランス語のラテン語からの借用規則も借用してしまったことによる。

語末の部分だけフランス語なので、 派生を繰り返すとラテン語のような形に戻しておかないといけない。 例えば、-ity〜-itat-、-ize〜-izat- のようにである。 そこで、quantity → quantitative → quantitativize → quantitativization のように派生されていく。

これだけでもややこしいのに、フランス語風でないラテン語彙がある。 例えば、sanatorium "療養所" のようなものである。 -torium はフランス語風の -tory に対応する。 例えば、 lavatory "便所" のようなものである。

しかも、フランス語風の -ity や非フランス語風の -ium は 古典語アクセント規則(大体は後ろから 3つ目)なのに、 -tory は違う可能性があるというのがさらに面倒。 diréctory だけど、lávatòry 。

2013年6月14日金曜日

-ism と -ist

-ism と -ist は対になる接尾辞とされているが、 頻度が違うばあいも多い。 対応する派生で意味が計算できるか否かによるのか、 個別の意味で意味が計算できるのか否かによるのか、 考えあぐむ。 どちらかと言えば後者だと思う。

Marx (人名) に対して、Marxism "マルクス主義", Marxist "マルクス主義者" のような例は分かりやすいし、 頻度が両方とも大きい。

しかし、○○-ism が "○○の特徴" のようなばあいは、 -ist の頻度が下る。 -ist の意味としては "○○の専門家" になったり、 "○○の特徴がある" になったりする。 例えば、 Hebraism "ヘブライ語法" に対して Hebraist "ヘブライ語学者"、 Spoonerism "語音転換" (例: なつがあつい → あつがなつい) に対して Spoonerist "語音転換エラーをするような"、 Gasconism "ガスコーニュ語法" に対して Gasconist "ガスコーニュ語法ガスコーニュ語運動家" のようにである。 Spoonerist については Spooneristic の方がはるかに頻度が高い。 *Gasconistic は Google にない。

○○-ist が "○○を使いこなす人" のばあいは、 -ism があまりないようであるが、"○○を使うこと"の意味になるようだ。 abacist "算盤の達人" に対して、abacism "算盤での計算"、 のような例はある。 harpist "ハープ奏者" に対して、 harpism "誇張" は意味がかなり違う。これはどう考えればいいのか分からない。

2013年6月13日木曜日

UNIX のコマンド

僕がプログラミングを覚えたのが、 Kernighan & Plauger の 『 ソフトウェア作法』 だった (ただし、Ratfor ではなく C で書き直していた) ということもあるが、 言語処理の基礎訓練は、 UNIX のコマンドもどきを何かのプログラミング言語 (今なら Python か Ruby だろうか) で書いてみることと、 UNIX のコマンドを組み合わせて何ができるか考えてみることだと思う。 実際、 GNU Core utilitiesだけでも、 かなりのテキスト処理はできる

とはいえ、自分の学生に指導していいものかで悩み、毎年断念している。 プログラミングは適性がどうしてもあるので。

2013年6月12日水曜日

Shibbolethism

Shibbolethism がOED に載っていないのが、意外だった。 もちろん shibboleth "他の集団が発音できない語" は載っている。 英語版のWikipedia には Shibbolethの説明と、 一覧がある。

語源は、『旧約聖書』「士師記(ししき)」12.06 に由来する。(引用は新共同訳)

12:05ギレアドはまた、エフライムへのヨルダンの渡し場を手中に収めた。エフライムを逃げ出した者が、「渡らせてほしい」と言って来ると、ギレアド人は、「あなたはエフライム人か」と尋ね、「そうではない」と答えると、 12:06「ではシイボレトと言ってみよ」と言い、その人が正しく発音できず、「シボレト」と言うと、直ちに捕らえ、そのヨルダンの渡し場で亡き者にした。そのときエフライム人四万二千人が倒された。 12:07エフタは六年間、士師としてイスラエルを裁いた。ギレアドの人エフタは死んで、自分の町ギレアドに葬られた。

2013年6月11日火曜日

場所+ism

-ism には "○○の特徴" (とりわけ語法) という意味がある。 既存の語では、○○が地名の場合、 前半部分が形容詞になるようである。 例えば、Americanism, Anglicism, Gallicism のようにである。

一時語として作られるものでは、地名そのままも多いようだ。 括弧内は例によって Google の検索で出る数。 London に対して、Londonism (約 16,800 件)、 Londonerism (2件)、Londonianism (0件)。 New York に対して、newyorkism(約 1,850 件)、 "New Yorkism" (約 5,350 件)、 newyorkerism (約 26 件)、 "New Yorkerism" (約 919 件) のようにである。

Paris の場合は、フランス語の影響のためか、 Parisism (約 2,820 件) より Parisianism (約 4,480 件) が多い。

2013年6月10日月曜日

ウルトラマンより仮面ライダー

ぼつぼつ相補分布を講義で説明する予定である。

環境によって同じ要素が別の形になっていることを示すのに、 変身ヒーローを使う人が多いようだ。 ウルトラマンやスーパーマンよりは、 僕は仮面ライダーがいいと思う。

最近の仮面ライダーはそうでもないようなのだけど、 初期のものはオートバイも変身する。 同じ要素であることをいうには、 相補分布するだけでなく、共通の素性があることも説明できる。

参考

2013年6月9日日曜日

「▽っ△り」「▽ん△り」の生産性

オノマトペの副詞「▽△り」には 強調形の「▽っ△り」「▽ん△り」がある。 どちらになるかは、△のところの子音による。

△の子音が、阻害無声音であるときには、促音が入る。 「にこり」から「にっこり」、「にたり」から「にったり」、 「にぱり」から「にっぱり」、 「ぱさり」から「ぱっさり」、「ぽちゃり」から「ぽっちゃり」 のようにである。

△の子音が、r 以外の鳴音のときには、促音が入る。 「やわり」から「やんわり」、「ひやり」から「ひんやり」、 「にまり」から「にんまり」、「しなり」から「しんなり」 のようにである。

僕個人で遊んでみた場合、この2つの場合は生産性がある。

△の子音が、阻害有声音のときには、促音の例が拾える。 「ざぶり」から「ざんぶり」、「あぐり」から「あんぐり」のようにである。 「うんざり」も「*うざり」からのはずであるが、 「*うざり」の実例は『日国』精選版にない。

△の子音が r のときには、辞書に記載がないようである。 しかし、両形が拾える。 検索は適当なので、オノマトペ以外も含むが、 Google では「ゆるり」(約 5,910,000件)であるが、 「ゆんるり」(約 7,670 件)に対して「ゆっるり」(約 2,660 件)ある。 「ぐるり」(約 2,770,000 件)では、傾向が逆で、 「ぐんるり」(約 439 件)に対して「ぐっるり」(約 808 件)ある。 「ぱらり」(約 381,000 件)だと、 「ぱんらり」(約 15,000 件)に対して「ぱっらり」(約 3,640 件)、 「ぷりり」(約 45,600 件)だと 「ぶんりり」(約 76 件)、「ぷっりり」(約 277 件)のように傾向は 一定しないが両形が可能のようである。

僕個人の内省としては、一時語の場合、 △が r と阻害有声音では、 促音より撥音の方がましのことが多く、 特殊拍を入れない方がいい感じがする。 「ぱるり」>>「ぱんるり」>「ぱっるり」、 「ぱぶり」>>「ぱんぶり」>「ぱっぶり」のような感じだ。 あえて強調するなら「ぱるっり」「ぱぶっり」の形の方がまだ、いい感じがする。 代用できる自然な形は「ぱるっと」「ばぶっと」だと思う。

2013年6月7日金曜日

-ic と -ique

フランス語やその祖語にあたるラテン語から 同じ要素を数度にわたって英語が借用していることがある。

-ic も -ique もラテン語の (場合によっては対応するギリシア語からラテン語が借用した) -icum (対格, 主格は -icus) に由来する。

-ic は中世以降の書きことばとしてのラテン語からの借用である。 アクセントはこの前の母音にある。 例えば、Hellénic "ギリシア的な" である。 ラテン語のアクセント位置が保たれていて、 いわゆる古典語アクセント規則には従わない。

一方、 -ique はフランス語がラテン語から借用したものをさらに借用したものである。 例えば、uníque である。 比較的最近の借用で、アクセントはフランス語のアクセント位置が保たれ、 i にある。 大母音推移のあとの借用なので、 〈i〉であるにもかかわらず、/aI/ ではなく、/i:/ であることも注意したい。

ところが、これらは、 名詞化すると Hellenícity, unícity のように同じふるまいをする。

実は、mariage などの語尾 -age も -ic や -ique と関係があり、 -áticum に由来する。 これは古フランス語から中英語の段階で借用している。 古い語尾なので、アクセント位置は前半要素に移動している。 ただし、garage のように /Á:3/ で終る新しい借用語はフランス語の アクセント位置である語末にある。

古フランス語に由来する語、 古典語に由来する語、 近代フランス語に由来する語で同じような要素が借用されていて、 アクセントの規則が別々というのが、本当に面倒だと思う。

2013年6月6日木曜日

山羊田くんと豚田さん

連濁の話である。 「山羊田くんはヤギタかヤギダか」 で、 「○△田」のような名字が前半要素に濁音がある場合でも 連濁することがあることを述べた。

前回のは文脈を入れると△が濁音でも「田」が濁りうるという話だった。 ○のところが濁音の場合は例が少ないのであるが、 筆名や仮名では例が拾える。 この場合に特別な文脈がなくても連濁する「豚田」/butada/ がある。

前半が 1拍のものでは、アクセントが平板型で連濁するようである。 例えば、「馬田」で /bada/ のように。

こういうのまで含めてなんとか説明でくるとうれしいのであるが、 いいアイディアが思いつかない。

2013年6月5日水曜日

派生語尾 -ty によるアクセント位置

英語の語形成とアクセント位置がややこしい。 一例を眠れぬ夜に読み始めると徹夜すること間違いなしの 『プログレッシブ英語逆引き辞典』(國廣哲彌, 堀内克明 (編)、小学館, 1999年) を引こう。 -ty "……な性質" の項 (p.1213) から。

第1強制は, (1)直前の母音字が付く場合は 2つ前の音節に, (2) 直前に子音字が付く場合には語頭にある. 例外: entirety.

この説明は不正確である。 実は、-ity の項 (p.683) の「直前の音節に第 1 強勢」 とセットで考えないといけない。

ややこしいのは、(A) 古典語アクセント規則によるものと、 (B) 本来語・フランス語借用語アクセント規則によるものがあるからだ。

(A) 古典語アクセント規則に従うもののアクセント位置は、 ここでは後ろから 3番目と考えておけばいい。 派生語尾を含めて 3番目にくる。

この規則に従うものは -ity が基本形である。 実際、able に対して、ラテン語っぽくして abil- にしてから abílity になる。 ところが、 語基の最後が i の場合に異化 (dissimilation) -ety に変わる。 そこで、anxi-ous に対して anxíety になる。 引用の(1)における「直前の母音字」は、〈e〉に限られるのは、このためだ。

(B) 本来語・フランス語借用語アクセント規則に従うもののアクセント位置は、 原則として接頭辞を除く語頭だが、動詞や一部の形容詞では重い音節にある。 この場合、-ity の -i にあたる母音はフランス語では消えているので、 「直前に子音字」になることがほとんどだ。 これが (2) の場合のことである。 こちらは、派生語尾によって強勢位置が移動しない。 そこで、 前の部分が形容詞として実際にあるものは、形容詞の強勢位置が名詞の強勢位置になる。 したがって、lóyal に対して lóyalty、 entíre に対して entírety になる。

接頭辞は通常、アクセントをもたないので、entirety 以外にも語頭に アクセントがないものがある。 例えば、dislóyal からの dislóyalty、 unsúre からの unsúrety などである。

2013年6月4日火曜日

不規則な五段活用

国語学で五段活用、日本語学で子音語幹活用と呼ばれているものには、 不規則なものもある。 しかし、どういう理由か、国語辞典に記載してくれない。 母語話者なら知っていて当然ということであろうか。

不規則なところは、連用形の音便形である。 よく使うもののは「行く」と「問う」の2つ。 地域方言ではこれよりも増えることが多い。 ちなみに勤務先は「歩って」の地域である。

カ行のばあい、イ音便が普通(「書く」から「書いて」)であるが、 「行く」は「行って」と促音便になる。 「行いて」のようなイ音便形も拾えるが頻度はかなり低い。

ワア行のばあい、促音便が普通(「思う」から「思って」)であるが、 「問う」は「問うて」とウ音便になる。 ウ音便は動詞の活用のところに「国文法」だと書いてないことがある。

「問う」の連用形は変異形もかなり観察される。 また、複合語の「言問う」の連用形にも変異形がある。 以下は、google.co.jp でフレーズ検索した結果。 ただし、「を問○て」は lang:ja つき、「言問○た」「物問○て」はつけず。

を問○て約 7,9201979
言問○た約 1,160456
物問○て約 52

「言問う」は雅語のせいか、 音便形とはいえない「言問いて」の形の許容度が 高いようである。 これで「言問○て」にしなかったのは地名として「言問」があるので、 「って」("とて")を加えたものが多いからである。

地域差もかなりあるので、連用音便形は辞書の各項目に記載して欲しい。

2013年6月3日月曜日

初めての「ふたたび」

「ふたたび」は『新明解』(第7版)で "同じ事がもう一度繰り返される様子" と定義されているが、繰り返しがない場合でも使うことができる。 例えば、次のようにである

ヨーロッパは、経済危機によりふたたび 分裂しようとしている。

動詞が有界(telic)で、終了すると状態が変わる場合に使える。 結果としてなるような状態から始め、そうでなくなり、またそうなる ときに使える。 上の例では、分裂した結果と同じように分かれているところから始まるので、 使える。 「登る」のような場合でも、そういう文脈を入れれば使える。

Aさんは○○山で生まれ、下界を知らずに育った。 大人になり、山を下ったが、平野の生活にすっかり飽いた。 そして、彼はふたたび ○○山に登った。

2013年6月2日日曜日

山羊田くんはヤギタかヤギダか

連濁をしないこと説明するために ライマンの法則が使われる。 ここで問題にしたいのは、前半に濁音がある場合である。 Wikipedia から引用しよう:

また、かつては前部要素のもつ濁音も連濁を阻止していたと言われており、 「ながしま(長島)」と「なかじま(中島)」などにその痕跡を見ることができる。

問題は、2つある。「○△田」のような名字について:

  1. 聞いたことがない名字でも△が濁音であれば、最後が/タ/になるので、 痕跡ではなく規則が生きていないと困る。
  2. その一方、百科事典的な知識を与えると最後が/ダ/でも可能になる。

例えば「鍵田」という名字がある(「鍵」は /カギ*/)。 この名字について知らない人に発音してもらうと /カ*ギタ/になる。 しかし、次のような背景説明をすると /カギダ/ が出てくる。

ほら、あそこに L 型の田圃があるでしょ。 昔の鍵の形で、この人の先祖はあの田圃のところに住んでたので、 こういう名字になったんだって。

同様のことは、今のところ実例が拾えていない「山羊田」でも なりたつ(/ヤ*ギ/)。 仮名として使われている場合は /ヤ*ギタ/ であるが、 《どうみても動物のヤギなのにクラスメートというギャグ漫画に出てくる人物》と すると/ヤギダ/が許される。

このことは、聞いたことがないような名字を使っても同様になる。 「海田」は複数の読みがあるが、/ウ*ミタ/ > /ウミダ/ の ようである。 これについても知らない人は /ウ*ミタ/ と発音する。 ところが、《先祖が2ヶ所に田圃をもっていて分家するときに海の方のをもらった》ということにすると /ウミダ/ が許される。

ということで、語構成の違いで、連濁の有無があると考えている。 ここで出したのは、アクセントが頭高で連濁せず、平板で連濁であるが、 その逆のパターンもあるので、 うまい定式化はできていない。

2013年5月31日金曜日

いろいろな同じ

タイプとトークンの小話。

A: 昨日の10円返せよ。

B: ほい。

A: 違う。あれは初恋のCちゃんに貰った世界に1つだけの10円玉……。

B: んなもん貸すな。

イーミックとエティックの小話。

A: 昨日の10円返せよ。

B: ほい。

A: 違う。あれは珍しい昭和33年のキザ十……。

B: そんなもん知るか。

2013年5月30日木曜日

「~る」の音韻テンプレートはどんな形か(2)

N.Tsujimura先生講演会の感想。Google+の内容の実質的な再投稿。承前

Tsujimura先生は動詞の新語「~る」の音韻テンプレートとして (C)V(C)V*r- (*はアクセント位置)というものを考えている。 最後の部分が r- ではなく、ru# なのではないのかが、前の投稿の話。今回は、前半の部分。

*ru# のようにアクセントの指定だけがあり、長さの制約がないのではないか。

僕自身の作例では、1拍でも可能である。 実際に採集できているものは、語幹部分が2拍以上であり、Tsujimura先生もビル・ゲイツに由来する「ビる」だけをあげる。 しかし、《仕事を進めずにギャーギャー騒いでばかりいる》の意味で「ギャる」を作れると思う。 短さに制限があるようにみえるのは、音韻の問題というより、 元の語が再現できないという機能的な問題なのではないだろうか。

さらにCVCV型のテンプレートというより、韻律的なものではないかと思う。それには母音の短縮が関係している。

アクセント位置の母音については、「コピー」から「コピる」になるように長母音の場合、短縮することが多い。 短縮しない場合は、音節を分けるとよくなる。ただし、実例は少ない。僕が拾えたものには人名に由来する「イトウる」がある。 アクセント位置以外の母音についても短縮しやすい。 「グーグル」から「ググる」が有名であるが、 「デニーズ」からの「デニーズる」「デニズる」「デニる」のようにいくつかの形が見つかるものもある。

アクセント位置の母音が短縮されるか、分割されるのは、 重い音節では左側の要素がアクセントを持ちやすいことが関係していると考えると説明できそうである。 OT的に言えば、 アクセント位置を変えてはいけないという制約や重い音節で左側にアクセントがあるという制約より 母音の長さを維持するという制約の序列が低ければよい。 そうすると、母音が短縮されるか、音節が分割される。

元の語が推定できるという制約の位置づけが難しいが、 重い音節がアクセントを持ちやすいという制約と組み合わせることで、 韻律的なテンプレートによって、前にある長母音が短縮されるということも説明ができるようになる。 前に長母音があると重い音節なので、アクセントがないと制約に違反する。 長母音維持の制約の序列が低ければ、短縮した方がよくなる。

そこでCVCV型というより韻律テンプレートの方がいいのではないかと思う。

2013年5月29日水曜日

「~る」の音韻テンプレートはどんな形か(1)

N.Tsujimura先生講演会の感想。Google+の内容の実質的な再投稿。承前

Tsujimura先生は、(C)V(C)V*r- というテンプレート (*はアクセント位置)を考えている。 派生接尾辞として-ru を想定しないことには賛成する。しかし、テンプレートは *ru という形をしていると考える。 前半部分は次回に譲り、今回は後半の ru について検討する。

末尾がラ行もしくはその長音で終わるものを調べた場合、比較的短い場合には、 ルのものはそれを活用語尾にするが、他のものは、そうでもない。

ルでは、「ドトール」から「ドトる」、「トラブル」から「トラブる」、「ダブル」から「ダブる」である。 ただし、「ドトールる」「トラブルる」「ダブルる」も拾えるが、総体的に頻度が小さい。

ほかのものでは、、 「フラー(ダンス)」から「フラる」、「田村(芸人)」から「タムラる」、「フォロー」から「フォロる」、 「きみまろ(芸人)」から「きみまろる」のようになる。 ただし、「コスプレ」に対しては「コスプレる」と「コスプる」「コスる」のように複数の形がある。 また、リの場合には、「キャリー」から「キャリる」、「青酸カリ」から「青酸カリる」がある一方で、 「マキャベリ」から「マキャベる」がある。

ルで終わるものが、最後のルを活用語尾化しやすく、他のラ行ではそうとは言いにくいので、 テンプレートが /-r-/ ではなく /-ru/ である可能性がある。

2013年5月28日火曜日

「~る」の意味が文脈によるという性質は、構文がもっているのか

Google+に書いたものの書きなおし。 Indiana大学のN.Tsujimura先生の講演会の感想その1.元ネタは次のものだと思うが読んでいない。

その場でも質問したことであるが、「~る」の意味が文脈性 contextuality をもっているというのは、 一時語動詞 nonce verb 一般の性質で、構文 construction がもっているのではないのではないかという疑問をもった。 ただし、これは僕が Booij などの構文形態論 construction morphology に批判的なためかもしれない。

現代日本語で新語動詞として生産性があるのは「~る」と「~する」である。 この2つで有標なのは「~る」で意味(eventの構造やAktionsart)にも音韻にも条件がある。 一方、「~する」には目立つ条件がない。 そのため、コンビニエンスストアに行くことを意味させる場合でも、 「ファミマる」(< ファミリーマート)に対して、 「セブンする」(< セブンイレブン)になる。 「~る」の意味に文脈性があるのであれば、音韻的条件で代替になる「~する」も文脈性が必要になるはずである。

以下は僕による作例なので、許容しない人もいるかもしれない。

  • (1) (職業を聞かれて) 大学で先生してます。(≒"教員である")
  • (2) (親しい同僚に愚痴って) 学期中は先生してたから、夏休みは研究者しないと。
  • (3) (課題プリントを授業中に個別指導したことを指して) Tっち、珍しく先生しまわってたね。

「~する」でも十分に文脈性があると思う。

こちらも僕の作例で、スペイン語の profesor "先生" から「プロフェソる」を作ってみる。

  • (1') (職業を聞かれて) 大学でプロフェソってるよ。(≒"教えている")
  • (2') (親しい同僚に愚痴って) 学期中はプロフェソってたから、夏休みはエストゥディオソしないと。
  • (3') (課題プリントを授業中に個別指導したことを指して) Tっち、珍しくプロフェソりまわってたね。

構文の側にあるとするならば、(1)と(1')の差で、これを「~る」の側に載せるのが理論としてきれいだと思う。 両側に載せない理由としては、次のような対も考えられる。ただし、(4)は通常の「にこにこする」とはアクセントが異なる。

  • (4) (ニコニコのサービスを利用して)今日はずっとニコニコしてたよ。
  • (4') (ニコニコのサービスを利用して)今日はずっとニコニコってたよ。

一時語でかなり特定した文脈を入れれば、「~る」で言えることは「~する」でも言えるので、 「~る」のテンプレートに意味の文脈性を入れるのは好ましくない。

今さらながらブログ

普段は某アレゲなサイトで日記を書いている。 言語系の話で、論文を書くまでもないけど少し専門っぽいことは、 こちらに書こうと思う。

実は N.Tsujimura先生の講演会の感想をgoogle+に書きこんでみたら、読みにくかったので、こちらに。