画像から文字を抽出する gem
character_recognition_by_vision_api
という gem を作りました。以下でソースを公開しています。
RubyGems での場所はここです。
使い方
ドキュメントにもありますが、以下のようにして使います。
0. gem のインストール
まずは gem をインストールします。
$ gem install character_recognition_by_vision_api
1. 文字が埋め込まれている画像ファイルを準備する
文字情報が埋め込まれている画像ファイルを用意します。ここでは以下のファイルを用いるものとします。
2. API キー を準備する
Google Cloud Platform にて、Vision API の「API キー」を取得します。ここでは詳しい取得方法は省略します。
下記の画像の青い部分に「API キー」が書かれています。
3. gem を require する
あとはコードを書くだけです。まずは gem を require します。
require 'character_recognition_by_vision_api'
4. extract_to_text メソッドを実行する
extract_to_text
メソッドに以下の2つの引数を与えて実行します。
- 画像ファイル名(以下の例では
sample_image.png
とします) - API キー(以下の例では
abcdef0123456789
とします)
CharacterRecognitionByVisionApi.extract_to_text('sample_image.png', 'abcdef0123456789')
5. 🎉画像に埋め込まれている文字がテキスト形式で返ってくる🎉
こんな感じで文字列が返ってきます。
あいうえおかきくけこさしすせそた ちってとなにぬねのはひふへぼまみ むめもやゆよらりる丸ろわをんーゑ H本語表示サンプJ 1 2 3 4 5 60 ABCDE FGHIJKLMNOP
ちょっと間違っているところもありますが、むしろそれにより実際の結果の雰囲気がつかめるのではないかと思います。