[samba-jp:19402] Re: libiconv-1.9.1-ja-patch-1. diff.gz????CP932?CP943?????

MORIYAMA Masayuki moriyama @ miraclelinux.com
2007年 4月 18日 (水) 14:43:08 JST


森山です。

TAKAHASHI Motonobu wrote:
> libiconvで指定可能なCP932はパッチ適用後、windowsの文字コードセットであるMS932と
> 変換
> テーブルが完全互換になるととのことですが、CP943との具体的な相違点があれば知りた
>> とおもっております。。。
*完全* 互換ではありません。
libiconv の CP932 は、U+301C を変換するなどの拡張がほどこされています。

>> 文字コード("display charset","dos charset","unix charset")ですが、CP932と
>> CP943ではどのような違いがあるのでしょうか。
>> CP932とCP943の具体的な変換テーブルの差についてご存知でしたら教えていただけないで
>> しょうか?
> 
> 規格上の差異は、
> 
> http://www2d.biglobe.ne.jp/~msyk/cgi-bin/charcode/bbs.cgi?past=1&c=r&n=55
> 
> などを参照していただければと思います(※適当にぐぐっただけです。すみま
> せん)。

http://www2d.biglobe.ne.jp/~msyk/cgi-bin/charcode/bbs.cgi?past=1&c=gr&n=93
の方が詳しく書いていますので参考にしてください。
CP943 ではく、CP943C ですけれども…

この違いの他、Cp943C には、0x80, 0xA0, 0xFD, 0xFE, 0xFF に文字定義がなさ
れています。
http://euc.jp/i18n/ucsnote.ja.html
→5. 「全角」「半角」

> しかし、libiconv では lib/cp943.h にて cp932 と同じものとして定義され
> ています。曰く
>
> -----
> /*
>  * IBM CP943
>  */
>
> /* This is essentially CP932, with many mappings missing in the AIX >
> conversion
>    table. We just pretend it were the same as CP932. */
> -----

cp932 パッチでは、CP943 はケアしてませんので、パッチを適用すると
libiconv の cp943 は、IBM-943 とは異なるものになってしまっていますね。
しかし、libiconv の元の cp932(cp943) に関しても、0x80, 0xA0, 0xFD, 0xFE,
0xFF とかはケアしていなかったと思うけどなぁ…




samba-jp メーリングリストの案内