2022-11-28から1日間の記事一覧

簡易的に Webページ をキャプチャしてその画像を OCR にかけてテキストを抽出する方法

結論 OCR には Tesseract を用います Webサーバ には PHP の ビルトインWebサーバ を用います Webページ の 画像キャプチャ には capture-website-cli を用います ここは Npm 依存です 具体的方法 GitHub Actions で CI として動かす形で書いてみます。 テキ…

Powered by はてなブログ