日本語練習虫

旧はてなダイアリー「日本語練習中」〈http://d.hatena.ne.jp/uakira/〉のデータを引き継ぎ、書き足しています。

Webの戸籍法施行規則に誤字が多数あったといふ件

事の次第を、共同通信による5月13日付の記事から引用しておきませう。(ほとんどそのまま転載してゐる地方紙なども多かったやうです。)

 各省庁の情報を調べることができる国のホームページ(HP)「電子政府の総合窓口」に掲載されていた人名用漢字の一覧表に、コンピューターの「文字化け」で144字もの誤字が掲載されていたことが、13日までに分かった。
 一覧表の誤字を使って子供の名前を付けようとしたため、出生届が受理されなかったケースもあり、HPを管理する総務省は同日、一覧表を差し替えた。
 同省情報システム管理室によると、昨年9月の戸籍法施行規則の改正で人名用漢字に488字が追加されたことから、官報の一覧表データをHPに転載した。
 しかし、パソコンが一部の文字に対応しておらず「寓」が「萬」、「祇」が「祗」になるなど488字のうち、144字が誤字や異体字になってしまったという。

テキストデータによる漢字表から画像データの漢字表へと差し替へられたといふ戸籍法施行規則のデータに関して、Googleに「2005年3月23日 18:38:58 GMTに保存された」といふキャッシュが残ってゐました。

いはゆる「文字化け」に相当するケースが何件で、OCRにかけた後チェックし忘れたんだべなといふケースが何件で、そもそも文字符号では示せないのが何件か(このケースはあるのか?)…といった検証は、漢字好きの皆様にお任せします。

ところで、上記の記事を配信した共同通信の中の人や、記事を転載した各紙の中の人は、《なぜ記事中では「寓」「萬」・「祇」「祗」が「文字化け」せずに扱へるのか》と不思議に思はなかったのでせうか。この点で、更に多くの取材を行ひ「入力ミス」とした朝日毎日・読売は、サスガです。