日本語練習虫

旧はてなダイアリー「日本語練習中」〈http://d.hatena.ne.jp/uakira/〉のデータを引き継ぎ、書き足しています。

HTML5の文字セットと己言語識別子

HTML5の文書文字セット(document character set)はどんな符号化文字集合(coded character set, CSS)なんだべか、HTML5だからUnicode5だったりするんだべか、てなことが知りたくてドラフトば眺めてみだっけ、それらしい記述が探せねがった。出てきたのは、文字エンコーディングスキーム(character encoding scheme, CES)についてXHTMLぢゃないHTMLだったら最初のmeta要素のcharset属性で示すべしといふ件(<meta charset="shift_jis">てな新しい記法)のみ。
ひょっとしてコメントアウトされた隠しメッセージがあったりしねぇべかと文書のソースば眺めてゐだっけ、ルート要素のlang属性が「en-US-x-Hixie」と記されったことに気づいた。HTML5のドラフトは、Ian "Hixie" Hicksonさん一人で書きあげたんですカ? David Hyattさんと二人でHixie語ば使って書いたんですカ? ひょっとして、そっち方面の方々の間ではHixie語が主流なんですカ?
……
己もこの我流表記ば流通させる際、「lang=ja-JP-x-North_East_Japan」か「ja-JP-x-uakira」と記述しておくべきだったか。
少佐の演説で遊ばずにはゐられねぇ人で、手でHTML書いてるヒトや自前のCMSば動かしてる人なんかは、「lang=ja-JP-x-hirano」みたいな目印を残さずにはゐられねぇですよね!?
……
ともあれ、手で己言語のHTMLば書く際にはさういふ目印にしておくべかねと心覚え。