日本語練習虫

旧はてなダイアリー「日本語練習中」〈http://d.hatena.ne.jp/uakira/〉のデータを引き継ぎ、書き足しています。

2014-07-15から1日間の記事一覧

Tesseract-OCRの日本語調教(2)

調教情報(Training Tesseract3)を見ると、必ず用意すべきファイルとして「unicharset」「inttemp」「normproto」「pfftable」が挙げられている。このうち「unicharset」は先日眺めた、OCRで認識させたい文字の一覧だ。 あとの3つのうち「inttemp」と「pfft…