[samba-jp:20394] Re: Vine 3.2、Windows、Proftpd、Samba混合環境の文字化けについて

MORIYAMA Masayuki moriyama @ miraclelinux.com
2008年 9月 26日 (金) 14:32:15 JST


森山です。

J K wrote:
> また、OSをVineからDebianに乗り換えたいとなると、OSの持つ文字コードが
> EUC-JPからUTF-8になるので、その際にもLinuxから見て正常にファイル名が
> 読める状態でないと移行するのは不可能だと考えております。

■ファイル名文字コード変換ツールについて

ファイル名の文字コード変換であれば convmv コマンドを使
うのが良いかもしれません。

  ※ファイル名文字コードの変換をする場合は、万が一の時
    のために、バックアップは *忘れず* にとっておいてく
    ださい。

convmv で eucJP-ms を扱う場合は、CPAN の Encode::EUCJPMS
モジュールをインストールして次のコマンドを実行しておくこ
とで convmv で eucJP-ms を変換できるようになります。

$ sudo enc2xs -C

cp932 -> utf-8 の変換であれば、このモジュールは必要なく
Encode モジュール標準で cp932 をサポートしています。

  ※Samba でファイル共有する場合、convmv でのファイル
    名文字コード変換の際に sjis や euc-jp ではなく
    cp932 や eucJP-ms を使うようにしてください。

■ FTP クライアントの EUC-JP について

ちなみに、FFFTP などの Windows 用の FTP クライアントの
多くが eucJP-ms には対応していないので、(自前で文字コー
ド変換しているソフトは cp51932 対応すら怪しい…) いわ
ゆる機種依存文字がファイル名に使われている場合に文字化
けしますのでご注意ください。(ファイル名に制御コードが
含まれてしまったりして扱いが厄介になります。)

  ※Windows から FTP 接続する場合、FTP サーバー側の
    ファイル名文字コードは UTF-8 にした方がいいでしょ
    う。

■ MacOS X の UTF-8 について

MacOS X の FTP クライアントの事情は知らないのですが、
適切に文字コード変換をしていないと、FTP サーバーに、
いわゆる UTF-8-MAC 呼ばれる、「が」などの文字が、
基底文字 + 結合文字に分解されたファイル名が保存され
てしまう事になり問題を生じますのでご注意ください。

  ※MacOS X から FTP 接続を許可する場合は、使用す
    る FTP クライアントが適切に基底文字 + 結合文字
    を合成済み文字に変換できるソフトだけを使うよう
    に徹底する必要があるでしょう。

--
森山 将之 <moriyama @ miarclelinux.com>




samba-jp メーリングリストの案内