2023-12-22から1日間の記事一覧

MeCab の辞書をビルドするときに文字コードが euc-jp になってしまう場合の対処方法

結論 mecab-ipadic-2.7.0-20070801 を --with-charset=utf8 のオプション付きでビルドする。 $ ./configure --with-charset=utf8 Natto で確認する 期待通りの挙動になっているかを Natto で確認します。 > require 'natto' > nm = Natto::MeCab.new => #<Natto::MeCab:0x00007f2546c63280 @model=#<FFI::Pointer address=0x0000561020b78620>, @</natto::mecab:0x00007f2546c63280>…

Powered by はてなブログ