日本語練習虫

旧はてなダイアリー「日本語練習中」〈http://d.hatena.ne.jp/uakira/〉のデータを引き継ぎ、書き足しています。

Tesseract-OCRとカタカナ繰り返し記号

昨年7月にTesseract-OCRの中身を覗き見た際に本家に報告していた、OCR辞書にカタカナ繰り返し記号「ヽ(U+30FD)」(KATAKANA ITERATION MARK)の登録が無い件がFIXされたという連絡を受けた。他の件もそのうち進展があるんだろうか。気長に見守り隊。