文字コードの変換

最終更新:2 か月半前

文字コード変換に使われるソフトウェアとしてnkfとiconvが知られている。

  • iconv
    • ただし、BOMや改行コードは扱えない
    • 良くも悪くもシンプルで、from (-f) とto (-t) だけ指定して使う
    • glibcに含まれており、たいていのLinux環境に最初から入っている。ただしShift-JISが扱えないなど、日本語対応に問題のあるバージョンであることがあるらしい
  • nkf
    • BOMや改行コードも扱える
    • 文字コードの自動判定もできる
    • コマンドラインインターフェースはちょっと複雑
    • デフォルトの挙動では半角カナを全角化するので注意が必要(-x で無効化)
    • 原作者も現在の主要なメンテナも日本人で、日本語対応に困ることはない
    • ほとんどメンテナンスされていない。バージョン番号が付いているのは最新でv2.1.5 (2018/12/15) で、GitHub nurse/nkf にある。OSDNにもあるが、中の人は同じようなので無視してよさそう

逆に言えば、メンテナンスされていて、できれば多くの環境で最初から使えて、BOMや改行コードを扱える最低限の文字コード変換ツールというものは存在しないと言ってよい。

Xで コメントする

Mentions