2013年6月28日金曜日

「ている」の例外的な用法

『日国』の「ている」の項の補注に次のようにある。

動詞のうち、 (イ)「立つ」「落ちる」「開く」「閉じる」「別れる」「できる(生じる意)」など、ある一時点で変化する作用を表わすものにつく場合は (2)[完了した状態がそのままたもたれていること]に限られる。 ... (ニ)その他のある時間にわたって継続する作用を表わす動詞、 「笑う」「鳴く」「降る」「遊ぶ」「あやす」「明滅する」などの場合、 (1)[ある動作・作用が持続、または繰り返し進行中である]の意になるが、「読む」「聞く」「食べる」「動く」などの場合は、(1)のほか(2)になることのあるものがある。

これらは文脈と時の副詞を入れれば、ひっくりかえせる。

(1)ごらんください。初の巨大ロボットです。スイッッチを入れました。 動いています。そうです。今ちょうど立っています。

(2)えーと。鶯ですか。もう鳴いていますよ。昨日聞きました。

上の引用の省略部分について。

(ハ)「ある」「いる」「できる(可能の意)」などは、標準語では「ている」を伴うことがない。

接尾辞的な「できる」では、「ている」形はかなり正式な文書でも みつかる。国土交通省の報告書から。

ASV装置が装備されていることで運転について「すごく安心できる」「まあ安心できる」が 70%を占めており、装置が搭載されていることで運転手も安心して運転できていることが判り、

「運転手」を「選手」、「運転できる」を可能動詞の「泳げる」に置き換えても大丈夫なので、これは可能の意のはずである。

2013年6月26日水曜日

freshwoman が意外に多い

大方の辞書に、freshman を両性にもちいると注釈がある。 OED にも、freshwoman が rare と書いてある。 昔のものなので、Google で検索してみた。

site:ac.uksite:edu
freshwomen約 65 件約 1,990 件
female freshmen約 15 件約 1,650 件
woman freshmen10 件

意外に freshwoman が強い。

2013年6月25日火曜日

女性名のアクセント

新明解のアクセント辞典に載っている範囲では、 次のようになっている。

  • 2拍以下が頭高型
  • 「〜よ」「〜え」が平板型
  • 「〜こ」「〜か」が 3拍が頭高型、4拍以上が前部の最後にアクセント
  • 外国人名は、外来語アクセント
  • カタカナ・ひらがなで用いられるようなものは、平板型

最後の規則の意味がよく分からないのだが、 「〜み」の「ひろみ」「なおみ」「ますみ」が例に出されている。

女性名で多そうなものだと「〜な」〜の」がある。 前部が 2拍で「ゆりな」が頭高、「ゆりの」が平板だと思う。 前部に意味がない「さりな」「さりの」だと両方、頭高のような気がする。

どういう規則なのか、全然分からない。

2013年6月24日月曜日

アクセントがない語

日本語以外を専門とするものとして、 アクセントのない語というのが、不思議なのである。

その単語自体にアクセントがなく、 近接する語と同じアクセントのグループに入る clitic 接語がある言語は多い。 ところが、日本語のアクセントのない語 (金田一語類の名詞 1類) は、 そうではなく、自立語である。

多くの方言では、 アクセントと声調についてのいろいろな規則があるので、 それを破らないためには、 〈アクセントがある〉という規則を破ればいいという 最適性理論的に考えたい。 ところが、1類には単純語と考えたい語が多いので、なやましい。

2013年6月21日金曜日

2拍+1拍と中高型の忌避

複合語とアクセント、連濁の関係で、ずっと悩んでいるわけである。

後半 1拍でわりときれいにアクセントが決まるものとして、 人名の「〜子」がある。 前半が 1拍「リ子」HL、2拍「サト子」HLL、 3拍「サクラ子」LHHL のようになる。 4拍以上の実例は知らないがふざけて作るようなものでは、 LHH...HL になる。

ここで問題なのは、2拍+1拍(合計 3拍)のときのみ、 アクセント位置が1つ目にずれていることである。 これは東京アクセントにおいて、 金田一語類3拍名詞 3類、5類のLHL がHLL に移行していることと 関係があると思う。

なお、人名以外の場合、「〜子」で連濁するものがある。 人名の「ミドリコ」も"嬰児"「ミドリゴ」も LHHL で アクセントは同じだ。 前半2拍では「タマゴ」が中高 LHL か平板、 「フタゴ」や「ダンゴ」が平板になっている。 ただし、 「ウジコ」や「ウリコ」も平板である。

2013年6月20日木曜日

漢語3拍「□語」のアクセント

「(漢字1字2拍)語」という形の単語を『逆引き広辞苑』で集め、 新明解のアクセント辞典と国語辞典でアクセントを調べてみた。

アクセントの分かる64語中、 頭高のみが7語 (「言語(げんご)」「豪語」「言語(ごんご)」「人語」「壮語」「面語」「妄語」)、 頭高と平板が 5語 (「閑語」「結語」「隻語」「発語(はつご)」「密語」)、 頭高と中高が 1語 (「激語」) だった。

「言語(げんご)「言語(ごんご)」「人語」「隻語」の 4語を除くと、 サ変動詞になるものばかりである。

しかし「造語」のようにサ変で使えるものでも平板がある。

いくつか仮説が考えられるが、 「語」の部分の意味が単語や言語のときは平板になり、 意味が語る行為のときには頭高なのかもしれない。 とはいえ全部は説明できそうにない。

2013年6月19日水曜日

「~~語」のアクセント

「〜〜語」という単語のアクセントが気になりだした。 手元の新明解のアクセント辞典と国語辞典では、 「語」自体は /go*/ なのだが、 「〜〜」の部分が1拍だと頭高型 (「華語」/ka*go/) 長い場合は平板型(「中国語」/cu:gokugo/、 ただし「中国」/cu*:goku/) のようである。

問題なのは、「〜〜」が2拍のときで、 頭高型の「言語」/ge*Ngo/ と平板型の「原語」/geNgo/ がある。 アクセント辞典では、名詞で頭高(「正史」/se*:si/) で、 動詞で平板(「制止」/se:si/)が多いとあるが、それとも違うようである。 「口語」は平板で、「豪語」は頭高だ。

「フラ語」「スペ語」のような新語は平板のようだ。

2013年6月18日火曜日

発音が同じ en- と in-

英語の前置詞の in の語源である √en は、 接頭辞として英語の in-、仏語の en-、ラテン語の in-、ギリシア語の en- になるはずである。 しかし、このうち英語、仏語、ラテン語のものの発音が /in/ なので、 英語とフランス語のものが混同されやすい。 実際、『リーダース+プラス』(EPWING CD-ROM版, 研究社, 1996)には 次のようにある。

★en- と in- は交換できる場合があるが, 《米》 は in-, 《英》 は en- を用いることが多い.

例によって、Google で検索。 フランス語では enflammer の inflame、 entraîner (意味は違う)の entrain だと次のようになる。

to inflameto enflameto intrainto entrain
site:edu約 11,500 件約 1,310 件約 14 件約 8,430 件
site:ac.uk約 4,410 件約 309 件---約 1,980 件

フランス語がない inarm と enshrine だと次のようになる。

to inarmto enarmto inshrineto enshrine
site:edu約 52 件1 件約 46 件約 7,370 件
site:ac.uk------2 件約 5,600 件

この範囲では辞書の記載形が強いとしか言いようがない。

2013年6月17日月曜日

フランス語風ラテン語彙

英語の語彙で数が多いのが、 フランス語風ラテン語彙とでも呼ぶべきものである。 綴りをみると、ほとんどの部分がラテン語なのであるが、 語末の部分だけが、フランス語の形 (ただし、現代フランス語とは異なることがある) になっている。 例えば、"性質" は、 ラテン語で主格が qualitas, 対格が qualitatem であるが、 現代フランス語で qualité, 英語で quality になっている。

これは英語がラテン語から借用するときに、 フランス語のラテン語からの借用規則も借用してしまったことによる。

語末の部分だけフランス語なので、 派生を繰り返すとラテン語のような形に戻しておかないといけない。 例えば、-ity〜-itat-、-ize〜-izat- のようにである。 そこで、quantity → quantitative → quantitativize → quantitativization のように派生されていく。

これだけでもややこしいのに、フランス語風でないラテン語彙がある。 例えば、sanatorium "療養所" のようなものである。 -torium はフランス語風の -tory に対応する。 例えば、 lavatory "便所" のようなものである。

しかも、フランス語風の -ity や非フランス語風の -ium は 古典語アクセント規則(大体は後ろから 3つ目)なのに、 -tory は違う可能性があるというのがさらに面倒。 diréctory だけど、lávatòry 。

2013年6月14日金曜日

-ism と -ist

-ism と -ist は対になる接尾辞とされているが、 頻度が違うばあいも多い。 対応する派生で意味が計算できるか否かによるのか、 個別の意味で意味が計算できるのか否かによるのか、 考えあぐむ。 どちらかと言えば後者だと思う。

Marx (人名) に対して、Marxism "マルクス主義", Marxist "マルクス主義者" のような例は分かりやすいし、 頻度が両方とも大きい。

しかし、○○-ism が "○○の特徴" のようなばあいは、 -ist の頻度が下る。 -ist の意味としては "○○の専門家" になったり、 "○○の特徴がある" になったりする。 例えば、 Hebraism "ヘブライ語法" に対して Hebraist "ヘブライ語学者"、 Spoonerism "語音転換" (例: なつがあつい → あつがなつい) に対して Spoonerist "語音転換エラーをするような"、 Gasconism "ガスコーニュ語法" に対して Gasconist "ガスコーニュ語法ガスコーニュ語運動家" のようにである。 Spoonerist については Spooneristic の方がはるかに頻度が高い。 *Gasconistic は Google にない。

○○-ist が "○○を使いこなす人" のばあいは、 -ism があまりないようであるが、"○○を使うこと"の意味になるようだ。 abacist "算盤の達人" に対して、abacism "算盤での計算"、 のような例はある。 harpist "ハープ奏者" に対して、 harpism "誇張" は意味がかなり違う。これはどう考えればいいのか分からない。

2013年6月13日木曜日

UNIX のコマンド

僕がプログラミングを覚えたのが、 Kernighan & Plauger の 『 ソフトウェア作法』 だった (ただし、Ratfor ではなく C で書き直していた) ということもあるが、 言語処理の基礎訓練は、 UNIX のコマンドもどきを何かのプログラミング言語 (今なら Python か Ruby だろうか) で書いてみることと、 UNIX のコマンドを組み合わせて何ができるか考えてみることだと思う。 実際、 GNU Core utilitiesだけでも、 かなりのテキスト処理はできる

とはいえ、自分の学生に指導していいものかで悩み、毎年断念している。 プログラミングは適性がどうしてもあるので。

2013年6月12日水曜日

Shibbolethism

Shibbolethism がOED に載っていないのが、意外だった。 もちろん shibboleth "他の集団が発音できない語" は載っている。 英語版のWikipedia には Shibbolethの説明と、 一覧がある。

語源は、『旧約聖書』「士師記(ししき)」12.06 に由来する。(引用は新共同訳)

12:05ギレアドはまた、エフライムへのヨルダンの渡し場を手中に収めた。エフライムを逃げ出した者が、「渡らせてほしい」と言って来ると、ギレアド人は、「あなたはエフライム人か」と尋ね、「そうではない」と答えると、 12:06「ではシイボレトと言ってみよ」と言い、その人が正しく発音できず、「シボレト」と言うと、直ちに捕らえ、そのヨルダンの渡し場で亡き者にした。そのときエフライム人四万二千人が倒された。 12:07エフタは六年間、士師としてイスラエルを裁いた。ギレアドの人エフタは死んで、自分の町ギレアドに葬られた。

2013年6月11日火曜日

場所+ism

-ism には "○○の特徴" (とりわけ語法) という意味がある。 既存の語では、○○が地名の場合、 前半部分が形容詞になるようである。 例えば、Americanism, Anglicism, Gallicism のようにである。

一時語として作られるものでは、地名そのままも多いようだ。 括弧内は例によって Google の検索で出る数。 London に対して、Londonism (約 16,800 件)、 Londonerism (2件)、Londonianism (0件)。 New York に対して、newyorkism(約 1,850 件)、 "New Yorkism" (約 5,350 件)、 newyorkerism (約 26 件)、 "New Yorkerism" (約 919 件) のようにである。

Paris の場合は、フランス語の影響のためか、 Parisism (約 2,820 件) より Parisianism (約 4,480 件) が多い。

2013年6月10日月曜日

ウルトラマンより仮面ライダー

ぼつぼつ相補分布を講義で説明する予定である。

環境によって同じ要素が別の形になっていることを示すのに、 変身ヒーローを使う人が多いようだ。 ウルトラマンやスーパーマンよりは、 僕は仮面ライダーがいいと思う。

最近の仮面ライダーはそうでもないようなのだけど、 初期のものはオートバイも変身する。 同じ要素であることをいうには、 相補分布するだけでなく、共通の素性があることも説明できる。

参考

2013年6月9日日曜日

「▽っ△り」「▽ん△り」の生産性

オノマトペの副詞「▽△り」には 強調形の「▽っ△り」「▽ん△り」がある。 どちらになるかは、△のところの子音による。

△の子音が、阻害無声音であるときには、促音が入る。 「にこり」から「にっこり」、「にたり」から「にったり」、 「にぱり」から「にっぱり」、 「ぱさり」から「ぱっさり」、「ぽちゃり」から「ぽっちゃり」 のようにである。

△の子音が、r 以外の鳴音のときには、促音が入る。 「やわり」から「やんわり」、「ひやり」から「ひんやり」、 「にまり」から「にんまり」、「しなり」から「しんなり」 のようにである。

僕個人で遊んでみた場合、この2つの場合は生産性がある。

△の子音が、阻害有声音のときには、促音の例が拾える。 「ざぶり」から「ざんぶり」、「あぐり」から「あんぐり」のようにである。 「うんざり」も「*うざり」からのはずであるが、 「*うざり」の実例は『日国』精選版にない。

△の子音が r のときには、辞書に記載がないようである。 しかし、両形が拾える。 検索は適当なので、オノマトペ以外も含むが、 Google では「ゆるり」(約 5,910,000件)であるが、 「ゆんるり」(約 7,670 件)に対して「ゆっるり」(約 2,660 件)ある。 「ぐるり」(約 2,770,000 件)では、傾向が逆で、 「ぐんるり」(約 439 件)に対して「ぐっるり」(約 808 件)ある。 「ぱらり」(約 381,000 件)だと、 「ぱんらり」(約 15,000 件)に対して「ぱっらり」(約 3,640 件)、 「ぷりり」(約 45,600 件)だと 「ぶんりり」(約 76 件)、「ぷっりり」(約 277 件)のように傾向は 一定しないが両形が可能のようである。

僕個人の内省としては、一時語の場合、 △が r と阻害有声音では、 促音より撥音の方がましのことが多く、 特殊拍を入れない方がいい感じがする。 「ぱるり」>>「ぱんるり」>「ぱっるり」、 「ぱぶり」>>「ぱんぶり」>「ぱっぶり」のような感じだ。 あえて強調するなら「ぱるっり」「ぱぶっり」の形の方がまだ、いい感じがする。 代用できる自然な形は「ぱるっと」「ばぶっと」だと思う。

2013年6月7日金曜日

-ic と -ique

フランス語やその祖語にあたるラテン語から 同じ要素を数度にわたって英語が借用していることがある。

-ic も -ique もラテン語の (場合によっては対応するギリシア語からラテン語が借用した) -icum (対格, 主格は -icus) に由来する。

-ic は中世以降の書きことばとしてのラテン語からの借用である。 アクセントはこの前の母音にある。 例えば、Hellénic "ギリシア的な" である。 ラテン語のアクセント位置が保たれていて、 いわゆる古典語アクセント規則には従わない。

一方、 -ique はフランス語がラテン語から借用したものをさらに借用したものである。 例えば、uníque である。 比較的最近の借用で、アクセントはフランス語のアクセント位置が保たれ、 i にある。 大母音推移のあとの借用なので、 〈i〉であるにもかかわらず、/aI/ ではなく、/i:/ であることも注意したい。

ところが、これらは、 名詞化すると Hellenícity, unícity のように同じふるまいをする。

実は、mariage などの語尾 -age も -ic や -ique と関係があり、 -áticum に由来する。 これは古フランス語から中英語の段階で借用している。 古い語尾なので、アクセント位置は前半要素に移動している。 ただし、garage のように /Á:3/ で終る新しい借用語はフランス語の アクセント位置である語末にある。

古フランス語に由来する語、 古典語に由来する語、 近代フランス語に由来する語で同じような要素が借用されていて、 アクセントの規則が別々というのが、本当に面倒だと思う。

2013年6月6日木曜日

山羊田くんと豚田さん

連濁の話である。 「山羊田くんはヤギタかヤギダか」 で、 「○△田」のような名字が前半要素に濁音がある場合でも 連濁することがあることを述べた。

前回のは文脈を入れると△が濁音でも「田」が濁りうるという話だった。 ○のところが濁音の場合は例が少ないのであるが、 筆名や仮名では例が拾える。 この場合に特別な文脈がなくても連濁する「豚田」/butada/ がある。

前半が 1拍のものでは、アクセントが平板型で連濁するようである。 例えば、「馬田」で /bada/ のように。

こういうのまで含めてなんとか説明でくるとうれしいのであるが、 いいアイディアが思いつかない。

2013年6月5日水曜日

派生語尾 -ty によるアクセント位置

英語の語形成とアクセント位置がややこしい。 一例を眠れぬ夜に読み始めると徹夜すること間違いなしの 『プログレッシブ英語逆引き辞典』(國廣哲彌, 堀内克明 (編)、小学館, 1999年) を引こう。 -ty "……な性質" の項 (p.1213) から。

第1強制は, (1)直前の母音字が付く場合は 2つ前の音節に, (2) 直前に子音字が付く場合には語頭にある. 例外: entirety.

この説明は不正確である。 実は、-ity の項 (p.683) の「直前の音節に第 1 強勢」 とセットで考えないといけない。

ややこしいのは、(A) 古典語アクセント規則によるものと、 (B) 本来語・フランス語借用語アクセント規則によるものがあるからだ。

(A) 古典語アクセント規則に従うもののアクセント位置は、 ここでは後ろから 3番目と考えておけばいい。 派生語尾を含めて 3番目にくる。

この規則に従うものは -ity が基本形である。 実際、able に対して、ラテン語っぽくして abil- にしてから abílity になる。 ところが、 語基の最後が i の場合に異化 (dissimilation) -ety に変わる。 そこで、anxi-ous に対して anxíety になる。 引用の(1)における「直前の母音字」は、〈e〉に限られるのは、このためだ。

(B) 本来語・フランス語借用語アクセント規則に従うもののアクセント位置は、 原則として接頭辞を除く語頭だが、動詞や一部の形容詞では重い音節にある。 この場合、-ity の -i にあたる母音はフランス語では消えているので、 「直前に子音字」になることがほとんどだ。 これが (2) の場合のことである。 こちらは、派生語尾によって強勢位置が移動しない。 そこで、 前の部分が形容詞として実際にあるものは、形容詞の強勢位置が名詞の強勢位置になる。 したがって、lóyal に対して lóyalty、 entíre に対して entírety になる。

接頭辞は通常、アクセントをもたないので、entirety 以外にも語頭に アクセントがないものがある。 例えば、dislóyal からの dislóyalty、 unsúre からの unsúrety などである。

2013年6月4日火曜日

不規則な五段活用

国語学で五段活用、日本語学で子音語幹活用と呼ばれているものには、 不規則なものもある。 しかし、どういう理由か、国語辞典に記載してくれない。 母語話者なら知っていて当然ということであろうか。

不規則なところは、連用形の音便形である。 よく使うもののは「行く」と「問う」の2つ。 地域方言ではこれよりも増えることが多い。 ちなみに勤務先は「歩って」の地域である。

カ行のばあい、イ音便が普通(「書く」から「書いて」)であるが、 「行く」は「行って」と促音便になる。 「行いて」のようなイ音便形も拾えるが頻度はかなり低い。

ワア行のばあい、促音便が普通(「思う」から「思って」)であるが、 「問う」は「問うて」とウ音便になる。 ウ音便は動詞の活用のところに「国文法」だと書いてないことがある。

「問う」の連用形は変異形もかなり観察される。 また、複合語の「言問う」の連用形にも変異形がある。 以下は、google.co.jp でフレーズ検索した結果。 ただし、「を問○て」は lang:ja つき、「言問○た」「物問○て」はつけず。

を問○て約 7,9201979
言問○た約 1,160456
物問○て約 52

「言問う」は雅語のせいか、 音便形とはいえない「言問いて」の形の許容度が 高いようである。 これで「言問○て」にしなかったのは地名として「言問」があるので、 「って」("とて")を加えたものが多いからである。

地域差もかなりあるので、連用音便形は辞書の各項目に記載して欲しい。

2013年6月3日月曜日

初めての「ふたたび」

「ふたたび」は『新明解』(第7版)で "同じ事がもう一度繰り返される様子" と定義されているが、繰り返しがない場合でも使うことができる。 例えば、次のようにである

ヨーロッパは、経済危機によりふたたび 分裂しようとしている。

動詞が有界(telic)で、終了すると状態が変わる場合に使える。 結果としてなるような状態から始め、そうでなくなり、またそうなる ときに使える。 上の例では、分裂した結果と同じように分かれているところから始まるので、 使える。 「登る」のような場合でも、そういう文脈を入れれば使える。

Aさんは○○山で生まれ、下界を知らずに育った。 大人になり、山を下ったが、平野の生活にすっかり飽いた。 そして、彼はふたたび ○○山に登った。

2013年6月2日日曜日

山羊田くんはヤギタかヤギダか

連濁をしないこと説明するために ライマンの法則が使われる。 ここで問題にしたいのは、前半に濁音がある場合である。 Wikipedia から引用しよう:

また、かつては前部要素のもつ濁音も連濁を阻止していたと言われており、 「ながしま(長島)」と「なかじま(中島)」などにその痕跡を見ることができる。

問題は、2つある。「○△田」のような名字について:

  1. 聞いたことがない名字でも△が濁音であれば、最後が/タ/になるので、 痕跡ではなく規則が生きていないと困る。
  2. その一方、百科事典的な知識を与えると最後が/ダ/でも可能になる。

例えば「鍵田」という名字がある(「鍵」は /カギ*/)。 この名字について知らない人に発音してもらうと /カ*ギタ/になる。 しかし、次のような背景説明をすると /カギダ/ が出てくる。

ほら、あそこに L 型の田圃があるでしょ。 昔の鍵の形で、この人の先祖はあの田圃のところに住んでたので、 こういう名字になったんだって。

同様のことは、今のところ実例が拾えていない「山羊田」でも なりたつ(/ヤ*ギ/)。 仮名として使われている場合は /ヤ*ギタ/ であるが、 《どうみても動物のヤギなのにクラスメートというギャグ漫画に出てくる人物》と すると/ヤギダ/が許される。

このことは、聞いたことがないような名字を使っても同様になる。 「海田」は複数の読みがあるが、/ウ*ミタ/ > /ウミダ/ の ようである。 これについても知らない人は /ウ*ミタ/ と発音する。 ところが、《先祖が2ヶ所に田圃をもっていて分家するときに海の方のをもらった》ということにすると /ウミダ/ が許される。

ということで、語構成の違いで、連濁の有無があると考えている。 ここで出したのは、アクセントが頭高で連濁せず、平板で連濁であるが、 その逆のパターンもあるので、 うまい定式化はできていない。