White scenery @showyou, hatena

If you have any comments, you may also send twitter @shsub or @showyou.

文字コード

http://d.hatena.ne.jp/kazama/20061124/p1
先日の「Vistaが引き起こす文字コードの問題」についてのコメント。


文字コードについても勉強しないとなぁ(割と切実。特に三つ目)。今晩あたりさらっとまとめてみるか。

ちなみにShift-JIS(CP932),EUC,Unicode,UTF8,UTF16くらいは分かる。C言語での変換方法とか良く分からんけど。

あと、Javaには疎いので、「JSR-204」って何ぞや?と思い調べてみたら、こんなの出てきた。
http://java.sun.com/developer/technicalArticles/Intl/Supplementary/index_ja.html

長すぎて私には読む気が起きない(ぉぃのですが、まとめたのがこの辺か?

  • 基本データ型 int を使用して、低レベル API (Character クラスのスタティックメソッドなど) のコードポイントを表現する。
  • すべての形式の char シーケンスを UTF-16 シーケンスとして解釈し、高レベル APIUTF-16 シーケンスを使うようにする。
  • さまざまな char 型とコードポイントによる表現を相互に簡単に変換できる API を提供する。

Javaだといける。ではCでは・・?C++/CLIでは・・?