[samba-jp:19055] SJIS(CP932なのか?) <-> UTF-8 に関する議論詳細のまとめはどこ かにありませんか?

Kenichi Okuyama okuyamak @ dd.iij4u.or.jp
2006年 12月 8日 (金) 23:38:24 JST


奥山です。

# あぁ、なんか久しぶりにここに書いている。

Samba といえば SJIS <-> EUC とかの文字コード変換苦労話ですが、

・SJIS <-> UTF-8 変換
・EUC  <-> UTF-8 変換
# 1byte カナも影響するらしいので、それも。

について、ある程度技術詳細のついたまとまった資料はありませんか?


それはそれは「れがしぃ」なアプリケーションを、「唐突に」Linux環境に
移植する話が持ち上がったのですが、あまりにも「れがしぃ」すぎて文字コー
ド問題まで内包していたのに最近まで気がつきませんでした。
#通常のプログラミング上の大変さだけで頭が一杯で…。

たしか、記号かなにかに、反復変換するたびに文字コードが変わっていく、
楽しい奴がいたと思うんですが、そういうのとかも含めて…。

「これこれ!」というものがありましたら、よろしくお願いします。


# 結論は先にわかっているんですが、説明用資料が…。
---- 
奥山 健一[煤背会:No.0x00000001]
#URL http://www.dd.iij4u.or.jp/~okuyamak/
#    http://developer.osdl.org/dev/doubt/
#今日のお言葉『Be as One』:なんかSAYONARAがかっちょいい。



samba-jp メーリングリストの案内