日本語練習虫

旧はてなダイアリー「日本語練習中」〈http://d.hatena.ne.jp/uakira/〉のデータを引き継ぎ、書き足しています。

Google ColabでNDLOCRアプリを実行するには何を手直しすればいいでしょうか(Tensorflowバージョンエラーを解消?)

さてさて、仮称「図デコファントム」によって検索リターンがアウトになってしまうNDL全文検索対象のOCRテキスト。

#NDL全文検索 対象テキストに含まれている「宇宙戦艦」以外のイースターエッグを見つけた方はぜひお教えくださいッ #次々デジ備忘録 #図デコファントム」の後半で、OCRテキストを保存する時に何か事故ってしまったんじゃないかと想像したやつだけでも、改めてNDLOCRアプリで光学文字認識させた結果を直接この目で確認してみたい、――そう思いますよね。

というわけで、Toru Aoike(@blue0620)さんによるGoogleコラボバージョンのNDLOCR(https://twitter.com/blue0620/status/1519294332159012864)をnakamura196さんがアレンジしてくださった「Google Colabを用いたNDLOCRアプリの実行(Google Driveを用いた画像の入力と結果の保存)」〈https://zenn.dev/nakamura196/articles/a8227f4524570c〉を試してみようと思ったわけなのですが。

nakamura196さんが丁寧に書いてくださったノートブックをマニュアルの手順通りに実行してみたつもりで、結果、outputフォルダに画像ファイル名を流用した新しいフォルダが生成されているものの、中身に何も入っていない状態になってしまいます。

改めて「1.初期セットアップ」の「コードを表示」させながら初期セットアップの状況を観察してみたところ、……

「Tensorflowのバージョンが合ってないよ」的なエラーメッセージ

「Tensorflowのバージョンが合ってないよ」的なエラーメッセージが出ているのが何となく気になります。エラーメッセージは出ているものの、セットアップの作業は進み、完了という表示になるので「2.設定」「3.実行」に進むわけなのですが。

やはり空っぽのフォルダが生成されるだけで、期待したOCR処理結果が出力される様子が見えません。

PyTorchのパッケージ設定

「1.初期セットアップ」のところに記載されている「#2. 必要なパッケージをインストールする」のところに書かれている「PyTorchのパッケージ設定(?)」を修正すればいいんでしょうか?

!pip install -q torch==1.8.1+cu111 torchvision==0.9.1+cu111 -f https://download.pytorch.org/whl/lts/1.8/torch_lts.html

そういう問題ではない?!