Google Cloud Vision API を用いて 文字が埋め込まれている画像 から テキスト形式で文字を抽出する gem を作りました

画像から文字を抽出する gem

character_recognition_by_vision_api という gem を作りました。以下でソースを公開しています。

RubyGems での場所はここです。

使い方

ドキュメントにもありますが、以下のようにして使います。

0. gem のインストール

まずは gem をインストールします。

$ gem install character_recognition_by_vision_api

1. 文字が埋め込まれている画像ファイルを準備する

文字情報が埋め込まれている画像ファイルを用意します。ここでは以下のファイルを用いるものとします。

f:id:gregminster:20171224142509p:plain

2. API キー を準備する

Google Cloud Platform にて、Vision API の「API キー」を取得します。ここでは詳しい取得方法は省略します。

下記の画像の青い部分に「API キー」が書かれています。

f:id:gregminster:20171224142832p:plain

3. gem を require する

あとはコードを書くだけです。まずは gem を require します。

require 'character_recognition_by_vision_api'

4. extract_to_text メソッドを実行する

extract_to_textメソッドに以下の2つの引数を与えて実行します。

  • 画像ファイル名(以下の例では sample_image.png とします)
  • API キー(以下の例では abcdef0123456789 とします)
CharacterRecognitionByVisionApi.extract_to_text('sample_image.png', 'abcdef0123456789')

5. 🎉画像に埋め込まれている文字がテキスト形式で返ってくる🎉

こんな感じで文字列が返ってきます。

あいうえおかきくけこさしすせそた
ちってとなにぬねのはひふへぼまみ
むめもやゆよらりる丸ろわをんーゑ
H本語表示サンプJ 1 2 3 4 5 60
ABCDE FGHIJKLMNOP

ちょっと間違っているところもありますが、むしろそれにより実際の結果の雰囲気がつかめるのではないかと思います。

Powered by はてなブログ