Unicode
調べていたらこんがらがってきたのでまとめ。
Unicode : The universal character encoding
(昔は)16bitに全ての文字を詰め込もうとした文字集合。当然65536字に全世界の文字が収まるはずはないのでHan Unificationという漢字統合作業をして無理やり詰め込んだ。
(今は)文字コード?UTFの総称?UCS-2の別名?なんか場所によって色々言われててよくわらん。教えてエロイ人。Unicode公式のFAQでは"Unicode is the universal character encoding, maintained by the Unicode Consortium"
ってことで符号化方式だし、"What is Unicode?"では"Unicode provides a unique number for every character"
ってことは文字集合だし、やっぱりよくわからん。
UCS : Universal Character Set
ISO/IEC 10646っつー名前で規定されている文字集合(Character Set)。各文字に通し番号がついてるので文字コードとしても使おうと思えば使えるだけ、という認識でいいのか…?