日記/2013-06-10

2014-07-26 (土) 12:22:43

データベース文字エンコーディング変換

http://www.orca.med.or.jp/receipt/download/precise/database.html

http://www.orca.med.or.jp/receipt/use/jisx0213/encode.html#ver470

将来的にはUTF-8への変換が必要と思いつつ、Ubuntu12.04にapt-getでインストールしたTeX(pLaTeX)のエンコーディングがUTF-8に対応していないのでペンディングにしていた。

Ubuntu12.04と同じ方法で、Ubuntu13.04にTeXをインストールしてみた。

# apt-get install ptex-bin dvipdfmx xdvik-ja

defaultのエンコーディングがUTF-8になっていた。もちろんeuc-jp、sjisにも対応。
上記ではなく下記の方法で一発で日本語TeXをインストールできるようになったそうだ。すばらしい。

# apt-get install texlive-lang-cjk

http://kubuser.blog.fc2.com/blog-entry-33.html

そこで、ORCAデータベース文字エンコーディング変換をやってみた。

$ sudo gedit /etc/jma-receipt/db.conf

DBENCODING="UTF-8"
を記述。

こちら
http://yukeikai.net/orca/index.php?%C6%FC%B5%AD%2F2013-01-12#y562faf5
のエラー対策がしてあるので

$ sudo -u postgres psql orca -c "COMMENT ON EXTENSION plpgsql IS NULL;"

は省略。

$ sudo service jma-receipt stop
$ sudo -u orca /usr/lib/jma-receipt/bin/jma-dbconvert.sh -t

いくつか不正な文字があるが、削除方法がわからないものもあるので、このまま変換。

$ sudo -u orca /usr/lib/jma-receipt/bin/jma-dbconvert.sh

無事変換終了、のようだ。

$ sudo jma-setup
$ sudo service jma-receipt start

PreciceORCA UTF-8版の完成。

Ubuntu14.04ORCAになったらUTF-8版にしよう。

$ sudo rm /etc/jma-receipt/db.conf

としてバックアップファイルからリストアして元のeuc版ORCAに戻す。

日記