平面 (Unicode)


Plane_(Unicode)

「Plane」Unicode  –         
Unicode標準では、プレーンは65,536 (2 16 )コード ポイントの連続したグループです。0 ~ 16 の数字で識別される 17 のプレーンがあり、6 桁の16 進数形式 (U+ hh hhh )の最初の 2 つの位置の取り得る値 00 ~10 16に対応します。プレーン 0 は基本多言語プレーン (BMP) であり、最も一般的に使用される文字が含まれています。上位プレーン 1 ~ 16 は「補足プレーン」と呼ばれます。 Unicode の最後のコード ポイントは、プレーン 16 の最後のコード ポイント、U+10FFFF です。Unicode バージョン 15.0 では、プレーンのうち 5 つにコード ポイント (文字) が割り当てられ、7 つに名前が付けられています。
17 プレーンという制限は、2 20コード ポイント (16 プレーン) を単語のペアとしてエンコードできるUTF-16に加え、BMP を単一の単語としてエンコードできるためです。 UTF-8は、2 31 (2,147,483,648) コード ポイント (32,768 プレーン)というはるかに大きな制限を設定して設計されており、現在の制限下でも2 21 (2,097,152) コード ポイント (32 プレーン)をエンコードできます。4バイト。
17 プレーンは 1,114,112 個のコード ポイントを収容できます。これらのうち、2,048 はサロゲート(UTF-16 でペアを作成するために使用)、66 は非文字、137,468 はプライベート使用のために予約されており、残りの 974,530 はパブリック割り当て用です。
プレーンはさらにUnicode ブロックに分割されます。Unicode ブロックはプレーンとは異なり、固定サイズを持ちません。Unicode 15.0 で定義されている 327 ブロックは、可能なコード ポイント スペースの 26% をカバーし、サイズの範囲は最小 16 コード ポイント (16 ブロック) から最大 65,536 コード ポイント (補足私用領域-A および -B、これらは面 15 と 16 の全体を構成します)。将来の使用に備えて、ほとんどの既知の現在および古代の書記体系に対して文字の範囲が暫定的にマッピングされています。
コンテンツ
1 概要
1.1 割り当てられたキャラクター
2 基本多言語面
3 補助多言語面
4 補助表意面
5 三次表意文字面
6 未割り当ての平面
7 補助専用機
8 専用エリアプレーン
9 参考文献

概要
·

割り当てられたキャラクター
飛行機
割り当てられたコード ポイント バージョン 15.0 割り当てられたキャラクター
 0BMP 65,520 55,634  1 SMP 26,160 23,276  2 SIP 60,912 60,873  3 ヒント 9,136 9,131 14 SSP 368 337 15 スプア-A 65,536
0 (定義による)
16 スプアB 65,536
0 (定義による)
合計293,168 149,251
^ Unicode ブロックに割り当てられたコード ポイント。

基本多言語面

基本多言語面のマップ。番号付きの各ボックスは 256 個のコード ポイントを表します。
最初のプレーンであるプレーン 0 の基本多言語プレーン( BMP )には、ほぼすべての現代言語の文字と多数の記号が含まれています。BMP の主な目的は、以前の文字セットと書き込み用の文字の統一をサポートすることです。BMP で割り当てられたコード ポイントのほとんどは、中国語、日本語、および韓国語 ( CJK ) 文字をエンコードするために使用されます。
高サロゲート ( U+D800–U+DBFF ) コードと低サロゲート ( U+DC00–U+DFFF ) コードは、16ビットコードのペアを使用してUTF-16 で非 BMP 文字をエンコードするために予約されています。そして 1 つの低位サロゲート。単一のサロゲート コード ポイントに文字が割り当てられることはありません。
このプレーンの 65,536 コード ポイントのうち 65,520 はUnicode ブロックに割り当てられており、単一の未割り当て範囲 (2FE0..2FEF) には 16 コード ポイントだけが残っています。
Unicode 15.0 の時点で、BMP は次の 164 ブロックで構成されています。
基本ラテン語( ISO/IEC 8859-1の下半分: ISO/IEC 646:1991-IRV別名ASCII ) (0000–007F)
Latin-1 補足( ISO/IEC 8859-1の上半分) (0080–00FF)
ラテン語拡張-A (0100–017F)
ラテン語拡張-B (0180–024F)
IPA 内線番号(0250–02AF)
間隔修飾文字(02B0 ~ 02FF)
発音区別符号の結合(0300–036F)
ギリシャ語とコプト語(0370–03FF)
キリル文字(0400–04FF)
キリル文字の補足(0500–052F)
アルメニア語(0530–058F)
アラム語文字:
ヘブライ語(0590–05FF) アラビア語(06:00–06FF) シリア語(07:00–074F) アラビア語サプリメント(0750–077F) ターナ(0780–07BF) N’Ko (07C0–07FF) サマリア人(08:00–083F) マンダイク(0840–085F) シリアサプリメント(0860–086F) アラビア語拡張-B (0870–089F) アラビア語拡張-A (08A0–08FF)
ブラーフミー文字:
デヴァナーガリー(09:00–097F) ベンガル語(0980–09FF) グルムキ(0A00–0A7F) グジャラート語(0A80–0AFF) オリヤ(0B00–0B7F) タミル語(0B80–0BFF) テルグ語(0C00–0C7F) カンナダ語(0C80–0CFF) マラヤーラム語(0D00–0D7F) シンハラ語(0D80–0DFF) タイ語(0E00–0E7F) ラオ語(0E80–0EFF) 中国チベット語(0F00–0FFF) ミャンマー(1000–109F)
グルジア語(10A0–10FF)
ハングル文字文字(1100–11FF)
エチオピア(1200–137F)
エチオピアサプリメント(1380–139F)
チェロキー(13A0–13FF)
カナダ先住民アボリジニ音節の統一(1400 ~ 167F)
オガム(1680–169F)
ルーン文字(16A0–16FF)
フィリピン文字:
タガログ語(1700–171F) ハヌノオ(1720–173F) ブヒッド(1740–175F) タグバンワ(1760–177F)
クメール語(1780–17FF)
モンゴル語(1800–18AF)
カナダ先住民アボリジニ拡張音節の統一(18B0–18FF)
ブラーフミー文字:
リンブー(1900–194F)
タイ語スクリプト:
タイ・レ(1950–197F) ニュー・タイ・ルー(1980–19DF) クメール文字(19E0 ~ 19FF) ブギナ語(1A00–1A1F) タイタム(1A20–1AAF)
拡張発音記号の結合(1AB0 ~ 1AFF)
インドネシア語の文字:
バリ料理(1B00–1B7F) スンダ語(1B80–1BBF) バタク(1BC0–1BFF)
レプチャ(1C00–1C4F)
オルチキ(1C50~1C7F)
キリル拡張 C (1C80–1C8F)
拡張グルジア語(1C90–1CBF)
スンダ語サプリメント(1CC0–1CCF)
ヴェーダ拡張機能(1CD0–1CFF)
ラテン語のサプリメント:
音声拡張子(1D00–1D7F) 音声拡張子の補足(1D80–1DBF) 発音区別記号の結合に関する補足(1DC0 ~ 1DFF) ラテン拡張追加(1E00–1EFF)
拡張ギリシャ語(1F00–1FFF)
記号:
一般的な句読点(2000–206F) 上付き文字と下付き文字(2070–209F) 通貨記号(20A0 ~ 20CF) 記号の発音区別符号の結合(20D0 ~ 20FF) 文字のようなシンボル(2100–214F) ナンバーフォーム(2150–218F) アロー(2190–21FF) 数学演算子(2200–22FF) その他のテクニカル(23:00–23FF) コントロールピクチャ(2400–243F) 光学式文字認識(2440–245F) 囲まれた英数字(2460–24FF) ボックス図面(2500–257F) ブロック要素(2580–259F) 幾何学的形状(25A0 ~ 25FF) その他のシンボル(2600–26FF) 絵文字(2700–27BF) その他の数学記号-A (27C0–27EF) 補足の矢-A (27F0–27FF) 点字パターン(2800–28FF) 補足アローB (2900-297F) その他の数学記号-B (2980–29FF) 補足数学演算子(2A00 ~ 2AFF) その他の記号と矢印(2B00 ~ 2BFF)
グラゴル酸(2C00–2C5F)
ラテン拡張-C (2C60–2C7F)
コプト語(2C80–2CFF)
グルジア語補足(2D00–2D2F)
ティフィナグ(2D30–2D7F)
エチオピア拡張(2D80–2DDF)
キリル拡張-A (2DE0–2DFF)
補足句読点(2E00–2E7F)
CJKスクリプトと記号:
CJK ラジカル補足(2E80–2EFF) 康熙急進派(2F00–2FDF) 表意文字の説明文字(2FF0 ~ 2FFF) CJK 記号と句読点(3000–303F) ひらがな(3040~309F) カタカナ(30A0~30FF) ボポモフォ(3100–312F) ハングル互換性 Jamo (3130–318F) 漢文(3190~319F) ボポモフォ拡張(31A0–31BF) CJK ストローク(31C0–31EF) カタカナ音声拡張子(31F0 ~ 31FF) 同封された CJK の手紙と月(3200–32FF) CJK の互換性(3300–33FF) CJK 統一表意文字拡張 A (3400–4DBF) 易経の六芒星記号(4DC0 ~ 4DFF) CJK 統一表意文字(4E00–9FFF)
イ音節(A000–A48F)
イラジカル(A490–A4CF)
リス(A4D0–A4FF)
ヴァイ(A500~A63F)
キリル拡張 B (A640–A69F)
バムム(A6A0–A6FF)
修飾子音文字(A700 ~ A71F)
ラテン語拡張-D (A720–A7FF)
ブラーフミー文字:
シロティ ナグリ(A800–A82F) 共通のインド数字フォーム(A830 ~ A83F) ファグスパ(A840–A87F) サウラーシュトラ州(A880–A8DF) デヴァナーガリー拡張(A8E0–A8FF) カヤー・リー(A900–A92F) レジャン(A930~A95F)
ハングル文字墨拡張-A (A960–A97F)
ブラーフミー文字:
ジャワ語(A980–A9DF) ミャンマー拡張-B (A9E0–A9FF) チャム(AA00~AA5F) ミャンマー拡張-A (AA60–AA7F) タイ ベト(AA80–AADF) Meetai Mayek 拡張機能(AAE0–AAFF)
エチオピア拡張-A (AB00–AB2F)
ラテン語拡張-E (AB30–AB6F)
チェロキーサプリメント(AB70–ABBF)
ミーテイ・マエク(ABC0–ABFF)
ハングル音節(AC00–D7AF)
ハングル文字文字拡張-B (D7B0–D7FF)
サロゲート:
上位サロゲート(D800–DB7F) 高度な私用サロゲート(DB80 ~ DBFF) 低サロゲート(DC00 ~ DFFF)
プライベート使用エリア(E000~F8FF)
CJK 互換表意文字(F900–FAFF)
アルファベットのプレゼンテーションフォーム(FB00–FB4F)
アラビア語プレゼンテーションフォーム-A (FB50–FDFF)
バリエーションセレクター(FE00~FE0F)
縦型フォーム(FE10~FE1F)
ハーフマークの組み合わせ(FE20~FE2F)
CJK 互換性フォーム(FE30 ~ FE4F)
小型フォームのバリエーション(FE50 ~ FE6F)
アラビア語プレゼンテーションフォーム-B (FE70–FEFF)
半角および全角フォーム(FF00 ~ FFEF)
スペシャル(FFF0 ~ FFFF)

補助多言語面

補足多言語面の地図。番号付きの各ボックスは 256 個のコード ポイントを表します。
プレーン 1である補足多言語プレーン( SMP ) には、歴史的な文字 (CJK 表意文字を除く)、および特定の分野で使用される記号と表記法が含まれています。文字には、線形 B、エジプト象形文字、および楔形文字が含まれます。また、 ShavianやDeseretなどの英語改革正書法や、 Osage、Warang Citi、Adlam、Wancho、Totoなどのいくつかの現代文字も含まれています。記号と記譜法には、歴史的および現代の楽譜が含まれます。数学的英数字; 速記法。絵文字およびその他の絵文字セット。トランプ、麻雀、ドミノのゲームのシンボル。
Unicode 15.0 の時点で、SMP は次の 151 ブロックで構成されています。
古風なギリシャ語とその他の左から右へ書く文字:
線形 B 音節(10000 ~ 1007F) 線形 B 表意文字(10080–100FF) エーゲ数字(10100–1013F) 古代ギリシャの数字(10140–1018F) 古代のシンボル(10190–101CF) ファイストスディスク(101D0~101FF) リキア語(10280–1029F) カリアン(102A0–102DF) コプト語協定番号(102E0–102FF) 旧斜体(10300–1032F) ゴシック(10330–1034F) オールドペルミック(10350–1037F) ウガリット語(10380–1039F) 古ペルシア語(103A0–103DF) デゼレット(10400–1044F) シャビアン(10450–1047F) オスマニャ(10480–104AF) オーセージ(104B0–104FF) エルバサン(10500~1052F) 白人のアルバニア人(10530–1056F) ヴィスクキ(10570–105BF) リニアA(10600~1077F) ラテン語拡張-F (10780–107BF)
右から左へ記述するスクリプト:
キプロス音節文字(10800–1083F) 帝国アラム語(10840–1085F) パルミレン(10860–1087F) ナバテア人(10880–108AF) ハトラン(108E0–108FF) フェニキア人(10900–1091F) リディアン(10920~1093F) メロイティック象形文字(10980–1099F) メロイティック筆記体(109A0–109FF) カロシティ(10A00–10A5F) 古南アラビア語(10A60–10A7F) 古北アラビア語(10A80–10A9F) マニ教(10AC0–10AFF) アヴェスタン(10B00–10B3F) 碑文パルティア(10B40–10B5F) パフラヴィー語の碑文(10B60–10B7F) パフラヴィー詩篇(10B80–10BAF) 古チュルク語(10C00–10C4F) 古ハンガリー語(10C80–10CFF) ハニフィ・ロヒンギャ(10D00–10D3F) ルーミ数字記号(10E60~10E7F) ヤジディ教徒(10E80–10EBF) アラビア語拡張-C (10EC0–10EFF) 古ソグド語(10F00–10F2F) ソグド語(10F30–10F6F) 古ウイグル語(10F70–10FAF) コラスミアン(10FB0–10FDF) エリマイク(10FE0–10FFF)
ブラーフミー文字:
ブラーフミー(11000–1107F) カイティ(11080–110CF) ソラ・ソンペン(110D0–110FF) チャクマ(11100~1114F) マハジャニ(11150–1117F) シャラダ(11180–111DF) シンハラ語の古数字(111E0–111FF) ホジキ(11200~1124F) ムルタニ(11280–112AF) クダワディ(112B0–112FF) グランサ(11300~1137F) ネワ(11400~1147F) ティルフタ(11480–114DF) シッダム(11580–115FF) モディ(11600–1165F) モンゴル語サプリメント(11660–1167F) タクリ(11680–116CF) アホム(11700~1174F) ドグラ(11800~1184F) ワランシティ(118A0–118FF) ダイブアクル(11900~1195F) ナンディナガリ(119A0–119FF) ザナバザル広場(11A00~11A4F) ソヨンボ(11A50–11AAF)
カナダ先住民アボリジニ統一音節拡張-A (11AB0–11ABF)
ブラーフミー文字:
パウ・チンハウ(11AC0–11AFF) デヴァナーガリー エクステンデッド-A (11B00–11B5F) バイスキ(11C00–11C6F) メルヘン(11C70–11CBF) マサラム・ゴンディ(11D00–11D5F) グンジャラ・ゴンディ(11D60–11DAF) マカサル(11EE0–11EFF) カウイ(11F00~11F5F)
リスサプリメント(11FB0–11FBF)
タミル語サプリメント(11FC0–11FFF)
楔形文字(12000–123FF)
楔形文字の数字と句読点(12400–1247F)
初期王朝楔形文字(12480–1254F)
キプロ・ミノア(12F90–12FFF)
エジプトの象形文字(13000–1342F)
エジプト象形文字形式コントロール(13430–1345F)
アナトリア象形文字(14400–1467F)
バムムサプリメント(16800–16A3F)
ミスター(16A40–16A6F)
タンサ(16A70–16ACF)
バッサ ヴァ(16AD0–16AFF)
パハウ・モン族(16B00–16B8F)
メデファイドリン(16E40–16E9F)
ミャオ族(16F00–16F9F)
表意文字と句読点(16FE0 ~ 16FFF)
西夏(17000–187FF)
タングット コンポーネント(18800–18AFF)
契丹小文字(18B00–18CFF)
西夏サプリメント(18D00–18D7F)
かな拡張-B (1AFF0–1AFFF)
かな補足(1B000–1B0FF)
カナ拡張A(1B100~1B12F)
小さなかな拡張子(1B130–1B16F)
ヌシュ(1B170–1B2FF)
デュプロヤン(1BC00–1BC9F)
短縮形式コントロール(1BCA0 ~ 1BCAF)
記号:
楽譜:
ズナメニー楽譜(1CF00–1CFCF)
ビザンチン音楽記号(1D000–1D0FF)
音楽記号(1D100–1D1FF)
古代ギリシャの楽譜(1D200–1D24F)
カクトビック数字(1D2C0–1D2DF) マヤ数字(1D2E0–1D2FF) 数学記号:
Tai Xuan Jing シンボル(1D300–1D35F)
棒数字の数え方(1D360–1D37F)
数学的英数字記号(1D400–1D7FF)
サットン サインライティング(1D800–1DAAF)
ラテン語拡張-G (1DF00–1DFFF)
唾液腺炎のサプリメント(1E000–1E02F)
キリル拡張-D (1E030–1E08F)
ニャケン・プアチュ・モン族(第一紀100年~第一紀14年)
トト(1E290–1E2BF)
ワンチョ(1E2C0–1E2FF)
ナグ・ムンダリ(1E4D0–1E4FF)
エチオピア拡張-B (1E7E0–1E7FF)
面出企画(1E800–1E8DF)
アドラム(第 1E900–1E95F)
記号:
インドのシヤク語番号(1EC70–1ECBF) オスマン帝国のシヤク語番号(1ED00–1ED4F) アラビア数学アルファベット記号(1EE00–1EEFF) ゲームタイルとカード:
麻雀牌(1F000~1F02F)
ドミノ タイル(1F030–1F09F)
トランプ(1F0A0–1F0FF)
同封の英数字補足資料(1F100–1F1FF) 同封の表意文字付録(1F200–1F2FF) その他の記号と絵文字(1F300–1F5FF) 絵文字(1F600~1F64F) 装飾用絵文字(1F650–1F67F) 交通および地図のシンボル(1F680–1F6FF) 錬金術シンボル(1F700–1F77F) 幾何学的形状の拡張(1F780–1F7FF) 補足アローズ-C (1F800–1F8FF) 補足の記号と絵文字(1F900–1F9FF) チェスのシンボル(1FA00 ~ 1FA6F) 記号と絵文字拡張-A (1FA70–1FAFF) レガシー コンピューティングのシンボル(1FB00 ~ 1FBFF)

補助表意面

補助表意面の地図。番号付きの各ボックスは 256 個のコード ポイントを表します。
プレーン 2、補足表意文字プレーン( SIP ) は、以前の文字エンコーディング標準には含まれていなかったCJK 表意文字 (主にCJK Unified Ideographs)に使用されます。
Unicode 15.0 の時点で、SIP は次の 6 つのブロックで構成されています。
CJK 統一表意文字拡張 B (20000–2A6DF)
CJK 統一表意文字拡張 C (2A700–2B73F)
CJK 統一表意文字拡張 D (2B740–2B81F)
CJK 統一表意文字拡張 E (2B820–2CEAF)
CJK 統一表意文字拡張 F (2CEB0–2EBEF)
CJK 互換表意文字補足(2F800–2FA1F)

三次表意文字面

第三次表意文字面の地図。番号付きの各ボックスは 256 個のコード ポイントを表します。
プレーン 3は、Tertiary Ideographic Plane (TIP) です。CJK Unified Ideographs Extension G は、 2020 年 3 月にリリースされた Unicode 13.0 の TIP に追加されました。また、Oracle Bone ScriptおよびSmall Seal Scriptにも暫定的に割り当てられています。
Unicode 15.0 の時点では、TIP は次の 2 つのブロックで構成されています。
CJK 統一表意文字拡張 G (30000–3134F)
CJK 統一表意文字拡張 H (31350–323AF)

未割り当ての平面
プレーン 4 ~ 13 ( 16 進数のプレーン4~
D ): プレーン 4 ~ 13 にはまだ文字が割り当てられていない、または割り当てが提案され

補助専用機

補足専用機のマップ。番号付きの各ボックスは 256 個のコード ポイントを表します。
プレーン 14 ( 16 進数のE ) は、補足特殊目的プレーン( SSP )として指定されます。Unicode 15.0 では、次の 2 つのブロックで構成されています。
タグ(E0000 ~ E007F)
バリエーション セレクター サプリメント(E0100 ~ E01EF) – 文字の代替グリフを示すために使用されます。

専用エリアプレーン
「自家用飛行機」民間航空機については、「民間航空」、「ビジネス航空」、「一般航空」、および「民間航空」を参照して
2 つのプレーン 15 と 16 (16 進数ではプレーン Fと 10 ) にはそれぞれ「私用領域」が含まれています。これらには、Supplementary Private Use Area-A ( PUA-A ) および-B ( PUA-B )という名前のブロックが含まれています。私用領域は、ISO および Unicode (私用文字エンコーディング) の外部の当事者が使用できます。

参考文献
^ 「用語集」 . www.unicode.org 。2021年9月27日閲覧。
^ Unicode 標準の表 3.5「UTF-16 ビット分布」を参照https://www.unicode.org/versions/Unicode6.0.0/UnicodeStandard-6.0.pdf ^ Unicode 標準の表 3.6「UTF-8 ビット分布」を参照https://www.unicode.org/versions/Unicode6.0.0/UnicodeStandard-6.0.pdf ^ “”Unicode へのロードマップ”” . www.unicode.org 。2021年9月27日閲覧。
^ Unicode, Inc. 「Unicode 標準バージョン 13.0 の発表」。
|first1=には一般的な名前があります ( help ) ^ “”提案された新キャラクター: パイプライン”” . www.unicode.org。”