2013年11月20日水曜日

熟語1つが流行するだけでも分布が変わったように見える

下の Google Books Ngram Viewer のグラフを見て欲しい。 フランス語において venir "来る"の到達点を示すために、 どういう前置詞が使われてきたかの変化を調べようとして見付けたものだ。

込みいった式を使っているが、要するに venir のあとに à, en, dans が 来る場合の中で en が使われる割合を示すためのグラフである。 青のグラフが示しているのは、それまで 10% ぐらいだった en が次にくる 確率が 1830年代から急速に上がり 30% ぐらいになったということである。

Ngram Viewer から年代ごとの用例を確認できるので、 見てみたところ venir en aide が、予想外に多いことが分かった。 そこで分母・分子ともにこの表現を除いたのが赤のグラフである。 これでは 1830年のあたりでほとんど変化がない。

"助ける" という意味ので目的語に"彼ら"を付けて、 leur venir à, les assister, les aider の中での最初のものの 内訳のグラフは下のようになる。 他の 2つは Grand Robert の aide の項で参照として 挙げられているものである。

このグラフにより venir en aide à が19世紀中頃から20世紀前半に よく使われた表現であることが分かる。

辞書の項目に時代性の説明があるものが 手持ちの辞書やネットのものでは見付けられなかった。 TLFにも Syntagmes fréq. "頻繁な連辞" とあるだけである。

この例は、かなり大きなコーパスであっても、 実際の用例を確認しなければ、 熟語の流行という偶発的な要因で統語的な分析で誤る可能性があるという教訓になるであろう。

接頭辞の re- (2)

英語の接頭辞 re- についての続きである。

re-present が分かり易いと思う。 この re- /ri:/ は、reprsent の re- /rE/ と発音も意味も異なる。 後者の方はフランス語からの借用で、英語として意味を考えられるかは疑問である。

次のような例をネットやOEDから拾うことができる。

  1. Such a table lets us survey the role in the development of the story by different characters, as they are presented and re-presented in each phase in turn.
    ("re-present v.2" in OED)
  2. f you're not appropriately dressed, girls have difficulty wanting to kiss you. Basic 'School Outfit' works fine, I gave a girl a flower, got in kisses if I needed to, then left the area and re-presented them with flowers until I ran out, then repeated.
    (http://www.gamefaqs.com/boards/942199-bully-scholarship-edition/42518177)
  3. If [Coetzee] had stayed in the U.S. then his oeuvre may have been quite different, and possibly it is the forced return that re-presented him with the richness of South African society that was to feed the writing.
    (http://quarterlyconversation.com/j-m-coetzee-a-life-in-writing-by-j-c-kannemeyer)

(1)が繰り返し、(2)が相互、(3)が回復のような意味になる。 これらすべてに共通して次のような図式が考えられるだろう。 実際の動詞が意味するのは「⇒」の部分である。

(→)A(→)B⇒A

最初の括弧内の矢印が「活性化」すると(1)の繰り返し、 二番目の括弧内の矢印が「活性化」すると(2)の相互、 いずれも活性化しないと(3)の回復の意味になる。

むしろ重要なのはAに戻るというところだと考える。 ただし、やっかいなのは、A が項のときもあれば、 状態のときもあることだと思う。 状態のときには re- がアスペクトのマーカーになる。 フランス語の場合、これが拡大していると考えている。

2013年11月16日土曜日

S字カーブを伸ばす

暇というわけではないのだが、この前の項目のグラフを変換して、伸ばしてみた。 左軸が odds の対数目盛、右軸が正規分布の逆関数である。 300年分を全部つかうのは大変なので、5年ごとに数字を読んで、Google Spreadsheet でグラフにした。

ほとんど見分けがつかない。年との相関係数は、odds の対数が 0.9885..., 正規分布が 0.9852... なので、 誤差の範囲だろう。

2013年11月15日金曜日

英語・現在完了助動詞の変化についてのS字カーブ

Google Books Ngram Viewer でかなりきれいな S字カーブがみつかったので、 記念に保存。

英語の完了形は、 非対格動詞については be+過去分詞から have+過去分詞に変化している。 このグラフは is come から has come への変化について。 この2つの選択肢があるところで、has come の確率が S字で増えていくことが分かる。

暇ができたら、log (p/(1-p)) と正規分布累積分布関数の逆関数を かまして、どちらが直線っぽいか確認したい。

2013年11月1日金曜日

Google Books Ngram Viewer にみる whom と who

Google Books Ngram Viewer には、Ngram Composition という機能がある。 この機能は歴史言語学において非常に重要である。 変異形の割合変化のグラフが一瞬で書けてしまう。

疑問代名詞 who と whom が対格のときのグラフを描いてみよう。 検索文字列は次のようなものである。

(Who did he / (Whom did he + Who did he))

その結果は下のようなグラフになる。 100%に近いほど who が使われ、0%に近いほど whom が使われている。

宇賀治正朋先生の『英語史』(現代の英語学シリーズ、第8巻、開拓社、2000) には次のようにある(p.340)。

疑問詞 who が動詞または前置詞の目的語である場合、 本来の whom に代って主格形 who が用いられることがある。 15世紀中頃に始まり (OEDの初例は 1450 Paston Letters から)、 以後、目的語 who は次第に盛んになり、早くも17世紀後半には whom をしのぎ、 PEでは whom は稀にしか用いられない。

19世紀初頭には who へ変化していたが、 そのあと規範文法 prescriptive grammar が対格形 whom を広めていったことが グラフから見てとれる。 その後、書きことばでもゆっくりと主格形というより無標形の who に戻って きている。

Google Maps Engine Lite で方言地図

Google Maps Engine Liteを 使って、方言地図を作ってみたら、予想以上に簡単だった。 ただし、スタンプ式のものである。

  1. Google Drive のスプレッドシートでデータを作る。

    1行目を見出し行にする。 順序はどうでもいいが、方言形、代表形、地点の列を作る。 地点を自然言語で指定できるので楽である。 (他の表計算ソフトでももちろん可)

  2. Maps Engine にデータをインポートする。 レイヤーを選び、インポートで、Google ドライブから 読み込む。 このときポップアップの許可が必要になることがある。

  3. 目印の場所として使う列として「地点」を選ぶ。

  4. 地図上の目印として使う列として「方言形」を選ぶ。

  5. 目印のスタイルを変更する。 スタイルを選び、 データ列別のスタイルで列として「代表形」を選ぶ。

  6. 代表形ごとの目印の色や形を適当に変更する。

面倒なのは、データ入力ぐらい。 これも Google Drive でフォームを作っておけば、方言形や地点の入力は楽になるはず。 データが集まってから、 代表形をいくつか選んで、 スプレットシートの入力の検証でリストに入れておけば、 ここも省力化できそう。