Zバリアント


Z-variant
には特殊文字が含まれています。適切なレンダリングサポートがないと、疑問符、ボックス、またはその他の記号が表示される場合が
ユニコード二グリフがあると言われているZ-変異体(しばしばスペルzVariantsそれらは同じ語源を共有するが、わずかに異なる外観と異なるユニコードている場合)コードポイント。たとえば、Unicode文字U + 8AAA說とU + 8AAC説はZバリアントです。Z分散の概念は、「CJKVスクリプト」(中国語、日本語、韓国語、ベトナム語)にのみ適用され、ハンユニフィケーションのサブトピックです。

コンテンツ
1 Z軸の違い
2 錯乱
3 も参照してください
4 参考文献

Z軸の違い
CJK言語のコードポイント割り当てのUnicode哲学は、3つの「軸」に沿って編成されています。X軸はセマンティクスの違いを表します。たとえば、ラテン語の大文字A(U + 0041 A)とギリシャ語の大文字のアルファ(U +0391Α)は、Unicodeの2つの異なるコードポイントで表され、「Xバリアント」と呼ばれる場合があります(この用語は一般的ではありませんが) )。Y軸は、セマンティクスではありませんが、外観の大きな違いを表しています。たとえば、繁体字の漢字「猫」(U + 8C93貓)と簡体字の漢字(U + 732B猫)はYバリアントです。
Z軸は、誤植のわずかな違いを表しています。たとえば、漢字(U + 838A莊)と(U + 8358荘)はZバリアントであり、(U + 8AAA說)と(U + 8AAC説)も同様です。Unicode.orgの用語集では、「Zバリアント」を「同一のセマンティクスと統一可能な形状を持つ2つのCJK統合表意文字」と定義しています。ここで、「統一可能」はハン統一の意味で解釈されます。
したがって、ハンユニフィケーションが完全に成功した場合、Zバリアントは存在しません。これらは、Unicodeと、Big5やCCCIIなどの他のCJKエンコーディングとの間でドキュメントを「ラウンドトリップ」できると便利であると見なされたため、Unicodeに存在します。たとえば、文字莊は21552DをエンコードするCCCIIを持っていますが、そのZバリアントは2D552DをエンコードするCCCIIを持っています。したがって、これら2つのバリアントには別個のUnicodeコードポイントが与えられ、CCCIIドキュメントをUnicodeに変換したり、元に戻したりすることはロスレス操作になります。

錯乱
「Zバリアント」の正確な定義については、多少の混乱が例えば、でインターネットドラフト(のRFC  3743 2002日付)、 1つの発見BU “NO”(U + 4E0D不)及び(U + F967不と記す) “フォントが変異体”は、用語「Zバリアント「見かけのような言語間のペアのために予約されている中国語 TUウサギ『(U + 5154』兔)と日本の『ウサギ』(U + 514E兎)。ただし、ユニコードコンソーシアムのUnihanデータベースは、両方のペアをZバリアントとして扱います。

も参照してください
z-variantを調べて
下位互換性

参考文献
^ “用語集”。www.unicode.org。
^ Huang、K。; Ko、Y。; 小西健一; Qian、H。「中国語、日本語、韓国語の国際化ドメイン名(IDN)登録および管理に関する共同エンジニアリングチーム(JET)ガイドライン」。tools.ietf.org。
^ 「Unihanデータベースルックアップ」。www.unicode.org。