日本語練習虫

旧はてなダイアリー「日本語練習中」〈http://d.hatena.ne.jp/uakira/〉のデータを引き継ぎ、書き足しています。

Google先生に「こ」「か」「が」のケヶを尋ねる

先に結論を記すと、「こ」と読むときのケヶと、「か」と読むときのケヶ、「が」と読むときのケヶは、我々日本語作文者にとって、同じ重みを持つ選択ではない可能性がある。

どうも、「か」と読む日常語の表記におけるケヶの選択に際しては、「こ」・「が」の時よりも「ケ」が忌避される度合ひが強い模様。

「n[ケヶ個]の」の用例数と二ケ・三ケ・四ケ

先日Antonさんから頂いたコメントにインスパイアされて、今回はGoogle先生に「n[ケヶ個]の」の用例数を尋ねてみた。

以下、2009年7月15日10時頃の、「n[ケヶ個]の」に関する日本語ページの検索結果*1












nn
19,92020,1003,650,000386617516,000
25,58019,7002,630,0001,55027074,100
33,1109,190 2,100,0003,29052737,400
43,06017,9001,370,00024912517,100
51,3404,1801,100,00033314912,700
63,3904,1401,020,00014810212,400
7330618596,00010528130,200
8774816715,0002251385,850
9287430530,000893,690
106,1103,4701,260,00023928144,600

数量がアラビア数字であり純粋に個数を数えたと思はれる方、「こ」と読むだらう助数詞*2の表記に総じてケはヶの半数程度選ばれてゐる。もっとも、「個」を選ぶ数に比べると、目くそ鼻くその違ひではある。

漢数字の二ケ、三ケ、四ケ、五ケ、六ケでケがヶを圧倒してゐるのは、町名あるひは字名にそれを含む地名が引っかかってゐるため。不勉強で、「こ」「か」「が」「け」のどれで読めばいいのか、己は全く判らない。その何れでも無いかもしれない。

今回は、日本人は「いち、に、さん、よん、ご、ろく、たくさん」といふ数え方をするといふ考察が得られた。ってことでいいんだらうか。


「n[ケヶカヵか箇]所」の用例数

以下は、2009年7月15日16時頃の、「n[ケヶカヵか箇]所」に関する、日本語ページの検索結果。












nn
125,000299,000299,00034,900589,0001,310,000151,800841,000350,0001,010,0001,200,0001,250,000
49,00089,800493,00012,200149,000176,000259,6001,050,000597,0001,000,000303,0007,610,000
30,300113,000752,00023,00024,100702,000337,6002,710,000335,000643,000211,000941,000
12,60029,00032,4006,33026,40026,700421,000289,000210,00077,400128,0003,140,000
33,300216,00027,6007,54020,30013,600519,300172,000722,00044,200376,0001,370,000
92,200529,00027,5003,1103,9204,97068,740124,000118,00052,900328,000191,000
3,9205,13058,3001,3102,9104,95074,540422,00082,00026,300251,000560,000
30,7001,520,000498,00084,300251,00098,40088,20099,30072,30031,20047,500120,000
8042,87010,5008261,7909,11093,56053,000243,00016,30037,10059,900
1,5309,61039,0003,0206,47024,100106,050459,00095,000137,00052,300139,000

ちなみに、「一ケ所」「二ケ所」「三ケ所」「四ケ所」「五ケ所」「六ケ所」「七ケ所」には地名の影響があり得る。また、数詞の表記が助数詞の選択に想像以上に多大な影響を与えてゐるらしくも見える。

個数の表記に比べ、箇所数の表記においては、ケヶといふ選択肢は無視できないボリュームと言へる。

今回は、日本人は「いち、に、さん、よん、ご、たくさん」といふ数え方をすると見るべきか「いち、に、さん、たくさん」といふ数え方をすると見るべきか悩ましいといふ考察が得られた。ってことでいいんだらうか。

六ケ敷六ケし

同じ「か」と読むケヶでも、完全に宛字と認知されてゐるだらう語句の場合はどうだらう。以下、2009年7月15日17時頃、Googleで日本語のページを検索してみた。

「六ケ敷」768件、「六ヶ敷」507件。「六ケし」56件、「六ヶし」269件。

どちらも「ヶ」とする青空文庫のデータを除外してをらず、総用例数に甚大な影響が見られる状態で、この程度の差となってゐる。

今回は、「むつかし」以外の宛字用例を知らない己の無知を呪うこととなった。


岩手県金ケ崎町」「東京都青ヶ島村」他

平成19年に、町議会にて「ケ」表記を選び取った岩手県金ケ崎町。町は公文書に「ケ」を使用するが一般の表記を制限するものではないと言ってをり、MS-IME 2002 (ver.8.1.4203.0)では「金ヶ崎」としか変換されねぇんだども、ウェブでの表記はどいなくなってっぺ。

以下、2009年7月15日15時頃、Googleで日本語のページを検索してみた。

岩手県金ケ崎町」19,200件、「岩手県金ヶ崎町」4,550件。

赤いほうが緑の3倍超と、圧倒的である。

同様に、自らの名称を「大きいケ」だと称してをり、かつ「ヶ」でも構はないと許容してゐる茨城県龍ケ崎市の場合はどうか。

茨城県龍ケ崎市」191,000件、「茨城県龍ヶ崎市」126,000件。

同じく公称が「ケ」である横浜市保土ケ谷区の場合、「横浜市保土ケ谷区」834,000件、「横浜市保土ヶ谷区」1,840,000件。

どうやら、言及数が増えれば増えるほど、IMEの力に負けてゆく模様。

一方、公称が「ヶ」である自治体の場合はどうか。

「東京都青ケ島村」1,750件、「東京都青ヶ島村」27,700件。

宮城郡七ケ浜町」66,700件、「宮城郡七ヶ浜町」207,000件。

「長野県駒ケ根市」74,700件、「長野県駒ヶ根市」614,000件。

IMEの誘惑に負けず、自らの信ずるところによって「ケ」を選んだ表記が一定数認められる。ここで「ケ」を選ぶ割合(約1割)は、「やつがたけ」などの多くの自然地名においても同様の割合であるらしいことが、芝野先生が用ゐたGoogle N-gramデータによって確認できる。

今回は、平成17年度の国勢調査に基づく13歳以上の日本の人口1億1273万人を日本語作文者数と見積もれば、1127万人くらいが「ケ」派で1億146万人くらいが「ヶ」派だといふ考察が得られた。ってことでいいんだらうか。

*1:Antonさんのコメントと「4ケの」の数字が違ふのは、検索対象が「ウェブ全体」か「日本語のページ」かの違ひによる模様。

*2:ケヶで記された助数詞をその文章の記述者が「こ」ぢゃなく「け」だと思ってゐる可能性、実はゼロでは無い。