日記/2013-06-10
データベース文字エンコーディング変換†
http://www.orca.med.or.jp/receipt/download/precise/database.html
http://www.orca.med.or.jp/receipt/use/jisx0213/encode.html#ver470
将来的にはUTF-8への変換が必要と思いつつ、Ubuntu12.04にapt-getでインストールしたTeX(pLaTeX)のエンコーディングがUTF-8に対応していないのでペンディングにしていた。
Ubuntu12.04と同じ方法で、Ubuntu13.04にTeXをインストールしてみた。
# apt-get install ptex-bin dvipdfmx xdvik-ja
defaultのエンコーディングがUTF-8になっていた。もちろんeuc-jp、sjisにも対応。
上記ではなく下記の方法で一発で日本語TeXをインストールできるようになったそうだ。すばらしい。
# apt-get install texlive-lang-cjk
http://kubuser.blog.fc2.com/blog-entry-33.html
そこで、ORCAデータベース文字エンコーディング変換をやってみた。
$ sudo gedit /etc/jma-receipt/db.conf
DBENCODING="UTF-8"
を記述。
こちら
http://yukeikai.net/orca/index.php?%C6%FC%B5%AD%2F2013-01-12#y562faf5
のエラー対策がしてあるので
$ sudo -u postgres psql orca -c "COMMENT ON EXTENSION plpgsql IS NULL;"
は省略。
$ sudo service jma-receipt stop $ sudo -u orca /usr/lib/jma-receipt/bin/jma-dbconvert.sh -t
いくつか不正な文字があるが、削除方法がわからないものもあるので、このまま変換。
$ sudo -u orca /usr/lib/jma-receipt/bin/jma-dbconvert.sh
無事変換終了、のようだ。
$ sudo jma-setup $ sudo service jma-receipt start
PreciceORCA UTF-8版の完成。
Ubuntu14.04ORCAになったらUTF-8版にしよう。
$ sudo rm /etc/jma-receipt/db.conf
としてバックアップファイルからリストアして元のeuc版ORCAに戻す。