C0およびC1制御コード


C0_and_C1_control_codes

「DC1」は飛行機については、DC-1を参照してください
。ロケット船については、デルタクリッパーを参照してください 「グループ区切り文字」は数字を多数グループ化するために使用される区切り文字については、小数点記号§数字のグループ化を参照してください
 「C0およびC1制御コード」  
C0及びC1制御コードまたは制御文字セットは、コンピュータシステムによってテキストに使用するための制御コードを定義する使用ASCIIおよびASCIIの誘導体。コードは、カーソルの位置、新しい行を開始するための指示、またはテキストが受信されたことを示すメッセージなど、テキストに関する追加情報を表します。
C0コードは00の範囲であるHEX -1F HEXとデフォルトC0セットは元々で定義されたISO 646(ASCII)。C1コードは80の範囲であるHEX -9F HEXとデフォルトC1セットは元々で定義されたECMA-48(ISO 6429と後調和します)。ISO / IEC 2022コントロールとグラフィック文字を指定するシステムは、他のC0とC1セットは特殊な用途のために利用可能にすることができますが、彼らはほとんど使用されません。

コンテンツ
1 C0コントロール
1.1 基本的なASCII制御コード 1.2 カテゴリ番号名 1.3 変更されたC0制御コードセット 1.4 その他のC0制御コードセット
2 C1コントロール
2.1 一般的なC1制御コード 2.2 書誌使用のためのC1制御コード 2.3 その他のC1制御コードセット 3 Unicode 4 も参照してください
5 脚注
6 参考文献

C0コントロール
ASCIIで定義された32の制御文字に加えて、DEL文字、7F HEX、または01111111 BINに必要な追加文字(紙テープのすべての穴を打ち抜いて消去する必要があります)。
マルチバイト制御では端末にステートマシンを実装する必要があるため、この多数のコードは当時望ましいものでした。これは、現代の電子機器や機械端末では非常に困難でした。それ以来、元のコントロールのいくつかだけがそれらの使用を維持しています。BS、TAB、LF、VT、FF、およびCRの「空白」範囲。BELコード; およびESC(ただし、ほとんどの場合、ESCの一部として、 ‘[‘ CSI表現がANSIエスケープシーケンスを開始します)。その他は未使用であるか、NULがC文字列ターミネータであるなどの異なる意味を取得しています。
ANPA-1312、Kermit、XMODEMなどの一部のシリアル伝送プロトコルでは、元の定義に近い目的で、制御文字SOH、STX、ETX、EOT、ACK、NAK、SYNを多用しています。

基本的なASCII制御コード
これらは、ANSIX3.4で最初に定義された標準のASCII制御コードです。ISO / IEC 2022拡張メカニズムを使用する場合、それらはオクテットシーケンス0x1B 0x21 0x40(ESC ! @)でアクティブなC0制御文字セットとして指定されます。
キャレット記法
10進数
16進数 シンボル
名前
Cエスケープ
説明
^@00 00NUL ␀
ヌル
もともとは、編集のために紙テープに隙間を残すために使用されていました。後で、端末の処理に時間がかかる可能性のあるコードの後のパディングに使用されます(たとえば、キャリッジリターンや印刷端末での改行)。現在、特にプログラミング言語Cで、文字列ターミネータとしてよく使用されています。
^A01 01SOH ␁
見出しの開始
メッセージ送信で、メッセージヘッダーの開始を区切ります。このヘッダーの形式は、ジャーナリズムテキスト送信用のIPTC 7901などの該当するプロトコルで定義でき、通常はSTXで終了します。でHadoopのは、それは、しばしば、フィールドセパレータとして使用されます。
^B02 02STX ␂
テキストの開始
メッセージテキストの最初の文字。メッセージの見出しを終了するために使用できます。
^C03 03ETX ␃
テキストの終わり
メッセージ送信で、メッセージの本文の終わりを区切ります。該当するプロトコルまたは追加のテキストによって定義された「ポストテキスト情報」(つまり、構造化されたフッター)の後にEOTが続く場合が キーボード入力で、プログラムまたはプロセスを中断または終了するための「ブレーク」文字(Ctrl-C)としてよく使用されます。
^D04 04EOT ␄
送信の終了
送信されたメッセージの終わりを区切ります。これには、ヘッダー、メッセージテキスト、ポストテキストフッター、または複数のテキストと関連する見出しが含まれる場合が端末をスタンバイにするためにも使用できます。 Unixでよく使用され、端末のファイルの終わりを示し、シェルによってコマンドexitまたはlogout。として解釈されます。
^E05 05ENQ ␅
問い合わせ
受信側で応答をトリガーし、それがまだ存在するかどうかを確認することを目的とした信号。
^F06 06ACK ␆
認めます
ENQへの応答、またはメッセージの正常な受信の表示。
^G07 07 ベル ␇ ベル、アラート
a もともとは端末のベルを鳴らすために使用されていました。後で、物理的なベルがないシステムのビープ音に使用されました。インバースビデオ(ビジュアルベル)のオンとオフをすばやく切り替えることもできます。
^H08 08BS ␈
バックスペース
b カーソルを1つ左に移動します。入力時に、カーソルの左側の文字が削除される場合が初期のコンピューター技術では、一度印刷された文字を消去できなかった出力では、バックスペースを使用して、ASCIIでアクセント付き文字を生成することがありました。たとえばà、3文字のシーケンスa BS `を使用して(または、文字の16進値を使用して0x61 0x08 0x60)生成できます。現在、この使用法は一般的にサポートされていません(たとえば、ISO / IEC 8859では禁止されています)。バックスペースの2つの潜在的な使用法のあいまいさを解消するために、キャンセル文字制御コードが標準のC1制御セットの一部になりました。
^I09 09HT ␉
文字集計、水平集計
t 次の文字タブストップに移動します。^J 10 0A LF ␊
改行
n 上のタイプライター、プリンタ、およびいくつかの端末エミュレータ、その列の位置に影響を与えることなく、一行下にカーソルを移動させます。Unixでは、行末をマークするために使用されます。でDOS、Windowsの、さまざまなネットワーク標準、LFが行末マークの一部としてCRを次のように使用されます。^K 11 0B VT ␋
線の集計、垂直の集計
v フォームを次の行のタブストップに配置します。^L 12 0C FF ␌
フォームフィード
f プリンタで、次のページをロードします。多くのプログラミング言語では空白として扱われ、コード内の論理的な分割を区切るために使用される場合が一部のターミナルエミュレータでは、画面がクリアされます。IETFによって公開されているRFCなど、一部の一般的なプレーンテキストファイルでは、ページ分割文字として表示されます。^M 13 0D CR ␍
キャリッジリターン
r もともとは、同じ行に留まりながらカーソルを列0に移動するために使用されていました。上の古典のMac OS(前のMac OS X)、ならびになど、以前のシステムでのApple IIとコモドール64のマークに使用される、エンド・オブ・ライン。でDOS、Windowsの、さまざまなネットワーク標準、それは行末マークの一環として、LFの前に使用されています。キーボードのEnterキーまたはReturnキーはこの文字を送信しますが、ターミナルプログラムによって別の行末シーケンスに変換される場合が^N 14 0E
それで ␎ シフトアウト
別の文字セットに切り替えます。^O 15 0F SI ␏
シフトイン
ShiftOut後に通常の文字セットに戻ります。
^P16 10DLE ␐
データリンクエスケープ
限られた数の連続するオクテットを何らかの異なる方法で解釈します。たとえば、(制御コードやグラフィック文字ではなく)生データとして解釈します。この詳細は実装によって異なります。(現在廃止されている)ECMA-37などの標準は、追加の伝送制御機能にアクセスするためのデータリンクエスケープ文字の特定のアプリケーション用に存在していました。Unicodeの標準圧縮方式では、SCSUによるC0バイトの転用によって混乱するシステムを介して、SCSUデータを送信する必要がある場合は、すべてのC0範囲バイトをDLEに置き換え、その後にそのバイトに0x40を加えたものに置き換えることをお勧めします。Q17 11 DC1 ␑
デバイスコントロールワン(XON)
これらの4つの制御コードはデバイス制御用に予約されており、解釈は接続先のデバイスによって異なります。DC1とDC2は主にデバイスのアクティブ化を示すことを目的としており、DC3とDC4は主にデバイスの一時停止またはオフを示すことを目的としています。DC1とDC3(この使用法ではそれぞれXONとXOFFとも呼ばれます)は、ASCIIテレックスネットワークの「リモートペーパーテープリーダーの開始と停止」機能として始まりました。このテレプリンターの使用状況となった事実上の標準のためのソフトウェアフロー制御。
^R18 12DC2 ␒
デバイス制御2
^S19 13DC3 ␓
デバイス制御3(XOFF)
^T20 14DC4 ␔
デバイスコントロール4
^U21 15NAK ␕
否定的な承認
接続が設定されているステーションへの否定応答としてステーションから送信されます。バイナリ同期通信プロトコルでは、NAKは、以前に受信したブロックでエラーが検出されたこと、および受信者がそのブロックの再送信を受け入れる準備ができていることを示すために使用されます。マルチポイントシステムでは、NAKは投票への準備ができていない応答として使用されます。
^V22 16SYN ␖
同期アイドル
同期伝送システムで使用され、特に他の文字が伝送されていないときに、データ端末装置間で同期補正を実行できる信号を提供します。
^W23 17ETB ␗
送信ブロックの終わり
データが送信目的でそのようなブロックに分割されたときに、データの送信ブロックの終わりを示します。 別の目的で使用されていない場合、IPTC7901はETBを段落の終わりの文字として解釈することをお勧めします。
^X24 18 できる ␘ キャンセル
その前のデータにエラーがあるか、無視されることを示します。
^Y25 19EM ␙
ミディアムの終わり
テープの使用可能な部分の終わりに到達したことを紙または磁気テープに示す手段として意図されています。また、媒体の使用済み部分の終わりを示す場合があり、必ずしも媒体の物理的な終わりに対応しているとは限りません。別の目的で使用されていない場合、IPTC 7901は、段落の最初の行をインデントするためのemスペースとしてEMを転用することをお勧めします(EMSPも
参照)。^Z 26 1A
サブ ␚ 代わりの
もともとは、文字化けまたは無効な文字が受信されたことを示すための送信制御文字として使用することを目的としています。それが提供するエラーの帯域内信号方式が不要な場合、特にエラー検出と訂正の堅牢な方法が使用される場合、またはエラーが他の目的をお勧めします。でDOS、Windowsの、CP / M、および誘導体ディジタル・イクイップメント・コーポレーションオペレーティングシステム、両方の際に、端末に入力し、時々ディスクに格納されているテキストファイルで、ファイルの終わりを示すために使用されます。
^[ 271B ESC ␛
逃れる e
キーボードのEscキーを使用すると、ほとんどのシステムでこの文字が送信されます。これは、ソフトウェアユーザーインターフェイスで使用して画面、メニュー、またはモードを終了したり、デバイス制御プロトコル(プリンターや端末など)で使用して、その後に続くものが通常のテキストではなく特別なコマンドシーケンスであることを通知できます。ISO / IEC 2022に基づくシステムでは、別のC0制御コードのセットが使用されている場合でも、このオクテットは常にエスケープ文字を表す必要が 28 1C FS ␜
ファイル区切り文字
データ構造のフィールドをマークするための区切り文字として使用できます。階層レベルに使用する場合、USは最低レベル(プレーンテキストデータアイテムの分割)ですが、RS、GS、およびFSは、その下のレベルのアイテムで構成されるグループを分割するためにレベルが高くなります。Unixの情報フォーマットは、ノードの始まりをマークするために、オプションでフォームフィードや改行に続いて、米国を使用しています。MARC 21は、サブフィールド区切り文字としてUS、フィールドターミネーターとしてRS、レコードターミネーターとしてGSを使用します。IPTC 7901の現在のエディションでは、他の目的で使用されない場合、USはテーブルの列区切り文字として、FSはテーブルの「中央フィールド区切り文字」として、GSとRSはそれぞれ次のスペースをマークするために使用することをお勧めします。またはハイフンマイナスを
それぞれ非区切り文字または
ソフト文字として(明示的なNBSPおよびSHY文字を提供しない文字セットの場合)。Pythonのsplitlines文字列メソッドは、FS、GS、RSを扱いますが、USは扱いませんが、改行文字に加えて区切り文字として扱います。
^]29 1D GS ␝
グループセパレータ
^^30 1E RS ␞
レコード区切り文字^_ 31 1F
我ら ␟ ユニットセパレータ
技術的にはC0制御文字範囲の一部ではありませんが、次の2つの文字は、登録されている制御文字とグラフィック文字のセットに関係なく、常に使用可能であるとISO / IEC2022で定義されています。それらは、制御文字のいくつかの特性を持っていると考えることができます。32 20SP ␠ 空
スペースはグラフィック文字です。グラフィックシンボルがないことからなる視覚的表現がこれにより、アクティブな位置が1文字位置進みます。一部のアプリケーションでは、スペースは、隣接する区切り文字とともに使用される最下位レベルの「単語区切り文字」と見なすことができます。
^?127 7F DEL ␡
消去
技術的にはC0制御文字範囲の一部ではありませんが、これは元々、紙テープで削除された文字をマークするために使用されていました。上のVT100互換端末、これは通常と呼ばれるラベルの付いたキーによって生成された文字⌫、あるバックスペース現代のマシン上、およびPCに対応していない削除キー。

カテゴリ番号名
基本的なASCII制御コードのいくつかはいくつかのカテゴリに分類され、そのカテゴリと番号で構成される代替の省略名が付けられることも
伝送制御: TC 1(SOH)、TC 2(STX)、TC 3(ETX)、TC 4(EOT)、TC 5(ENQ)、TC 6(ACK)、TC 7(DLE)、TC 8(NAK)、TC 9(SYN)、TC 10(ETB)。
フォーマットエフェクター: FE 0(BS)、FE 1(HT)、FE 2(LF)、FE 3(VT)、FE 4(FF)、FE 5(CR)。
デバイスコントロール: DC 1、DC 2、DC 3、DC 4。
情報区切り文字: IS 1(US)、IS 2(RS)、IS 3(GS)、IS 4(FS)。
ロックシフト: LS 0(SI)、LS 1(SO)。
その他:NUL、BEL、CAN、EM、SUB、ESC。
ISO / IEC 2022(ECMA-35)は、C0ロッキングシフトを8ビット環境ではLS0およびLS1と呼び、7ビット環境ではSIおよびSOと呼びます。
ASCIIの最初の1963年版は、DLEを伝送制御ではなくデバイス制御として分類
し、略語DC0(「データリンクエスケープ用に予約されたデバイス制御」)を付けました。
フォーマットエフェクタ(FE)コードは、ハードウェアデバイスの他の機能を制御したり、他の副作用を引き起こしたりするのではなく、グラフィック文字のレイアウトとレンダリングの方法に影響を与えるフォーマット(改行など)を定義および操作します。C0形式のエフェクターは、ISO / IEC 6429 DCS、 OSC、 PM、および
APCシーケンスで許可されてい
ます。情報セパレーターとC0フォーマットエフェクター(マイナス
BS)は、Unicode標準で定義されたセマンティクスを持つ唯一のC0制御コードであり、残りのC0制御の解釈は上位レベルのプロトコルに委ねられています。
ISO / IEC 2022(ECMA-35)では、C0制御コードセットに10個のASCII伝送制御(TC)コードが含まれている場合、それらをASCIIの場所でエンコードする必要がまた、これらの10個の送信制御をC1制御コードセットに含めることを禁止し、これらの10個以外の送信制御をC0制御セットに含めることを禁止します。

変更されたC0制御コードセット
Videotex文字セット§C0制御コード
C0制御コードセットは通常、ほとんどのASCII制御コードを変更せずに保持しますが、特定の制御機能を代替のものに置き換える番号が登録されています。ビデオテックスに関連するものを除いて、これらの選択を以下に示します。
シーケンス 12月 六角 交換済み コードセット内 略語 名前 説明
^I09 09 HT NATS、 IPTC FO フォーマット 表形式のデータで次の表形式の位置に移動するために使用され(この点で「タブ」セマンティクスを保持)、次のフェーズを示すために標準形式で使用されます。現在のIPTC仕様では、代わりに通常のASCII C0コントロールを使用し、USコントロールをテーブルの列区切りとして使用することを推奨し ています。^K 11 0B VT
NATS、 IPTC ECD 指示の終わり 植字装置を対象とした誤植命令の終わりを区切ります。^L 12 0C FF
NATS、 IPTC SCD 指導開始 植字装置を対象とした誤植命令の開始を区切ります。^M 13 0D CR
NATS、 IPTC QL クワッドレフト 行を終了し、左揃えにする必要があることを示します。現在のIPTC仕様では、代わりに通常のASCII C0コントロールを使用し、この関数を< CR LFシーケンスで表すことを推奨しています。^N 14 0E
それで NATS あなたは
アッパーレール テキストの強調された領域を開始します。1975年現在、スカンジナビアのジャーナリズムテキスト送信で使用されています。 1976年のIPTC勧告では、代わりにFT2とFT3が使用されていました(以下を参照)。現在のIPTC仕様では、代わりに通常のASCII C0コントロールを使用し、この関数を^文字でマークアップすることを推奨しています。^O 15 0F SI NATS LR
下部レール テキストの強調された領域を終了します。1975年現在、スカンジナビアのジャーナリズムテキスト送信で使用されています。 1976年現在のIPTCの推奨事項では、代わりにFT1が使用されていました(以下を参照)。現在のIPTC仕様では、代わりに通常のASCII C0コントロールを使用し、この関数を@文字でマークアップすることを推奨しています。
^Q17 11DC1 IPTC FT1
フォントワン 通常の書体に切り替えます。つまり、太字または斜体を無効にします。
^R18 12DC2 IPTC FT2
フォント2 イタリック体に切り替えます。
^S19 13DC3 IPTC FT3
フォント3 太字に切り替えます。
^X24 18 できる
NATS、 IPTC KW キルワード 前の単語を削除します(最後のスペースに戻って削除するか、前の改行に戻って除外します)。この点で「キャンセル」セマンティクスを保持しますが、より具体的な機能が
^Y25 19 EM T.61 / T.51、スタンドアロン SS2 シングルシフト2
G2の非ロックシフトコード; 7ビット環境で1バイトで表現できるC0表現。
^ 28 1C FS NATS、 IPTC、スタンドアロン SS、SS2 スーパーシフトまたはシングルシフト2
ノンロックシフトコード。
JIS C 6225 CEX コントロール拡張 後のソースでJISX0207と指定されている現在廃止されているJISC6225で指定されている制御シーケンスを導入します。これらには、垂直方向のテキストの動作、上付き文字および下付き文字を制御し、カスタム文字グラフィックスを送信するためのシーケンスが含まれていました。
^] 29 1D GS NATS、 IPTC QC クワッドセンター 線を終了し、中央に配置する必要があることを示します。
T.61 / T.51 SS3 シングルシフトスリー
G3の非ロックシフトコード; 7ビット環境で1バイトで表現できるC0表現。
^^30 1E RS
NATS、 IPTC QR クワッドライト 行を終了し、右揃えにする必要があることを示します。^_ 31 1F
我ら
NATS、 IPTC JY 正当化する 正当化される行を終了します。

その他のC0制御コードセット
文字放送文字セット§制御文字
文字放送は、まったく異なる制御コードのセットを定義します。ECMA-48のC0制御コードとの互換性が必要とされないフォーマットでは、これらの制御コードは、Unicode C0制御コード範囲(U +0000からU + 001F)に透過的にマッピングされる場合が

C1コントロール
米国発のASCIIに加えてコードの国内バージョンの概念を導入するために規格を改訂したISO646の1972年版の開発と並行して、ASCIIの拡張メカニズムを定義する目的で作業も進行中でした。公開される7ビット、8ビット環境の両方に適用ECMA-35及びISO 2022。
これらのメカニズムは、準拠する8ビットコードを対応する7ビットコードに変換できるように、またはその逆に変換できるように設計されています。 7ビット環境では、Shift Out( SO)コントロールは、94バイトの意味を変更して(つまり、スペースを除くグラフィックコード)、代替セットから文字を呼び出し、Shift In( SI)制御はそれらを元に戻します。 8ビット環境では、シフトコードを使用する代わりに、追加のグラフィック文字セットを参照するバイトに8番目のビットが設定されました。これは、追加のグラフィック文字にバイトスルーが使用されたことを意味します。C0制御文字は、7ビットコードのシフト状態の影響を受けず、常に8ビットが設定されていない8ビットコードで表される必要がありました。範囲内の結果としてそうでない場合、未使用バイトまでは、その代わりとして表現される追加の制御コードのために使用することができるスルー(貫通7ビットコードで)。これらの追加の制御コードは、C1制御コードとして知られるようになります。7ビット表現、バイトの挙動との互換性を保持すると、もともと定義されていないままにしました。0x210x7E0xA10xFE0x800x9F0x1B 0x400x1B 0x5FESC @ESC _0xA00xFF
ISO2022で使用するために登録された最初のC1制御コードセットはDIN31626であり、 1979年に登録された書誌使用専用のセットです。汎用ISO / IEC6429セットは1983年に登録されました。それが基づいていたECMA-48仕様は1976年に最初に公開されましたが。
規格のさらなる版は、規定をある程度変更しました。たとえば、1985年のECMA-35およびISO 2022のさらなる改訂により、96コードのグラフィカル文字セットの概念が導入されました。から8ビットのコードでは、これは、全体の範囲を可能に0xA0する0xFFグラフィカル文字のために使用されます。96コードセットの使用は、コードがシフトイン状態でない限り、バイト0x20および0x7F対応する7ビットコードの意味が「スペース」および「削除」と異なる可能性があることも意味しました。 G0(シフトイン)セットに96コードセットを使用することはできませんでした。
この改訂された8ビットISO2022コード構造に従って、ISO 8859は、0xA0–FFでエンコードされる文字のセットを0x20–7EでのASCIIグラフィック文字と組み合わせて定義し、これらの範囲外のバイトを次のように使用するために予約します。 ISO6429などの他の仕様による非グラフィカルコード。 UnicodeはISO8859-1から最初の256コードポイントを継承するため、C1制御コードセット用に予約された範囲も組み込まれますが、ほとんどの場合、機能は定義されません。ISO / IEC 6429がデフォルトとして提案されている、より高いレベルのプロトコルによる。

一般的なC1制御コード
これらは最も一般的な拡張制御コードであり、ISO / IEC 6429、ECMA -48、およびJIS X 0211(以前のJIS C 6323)で定義されています。 ISO / IEC 2022拡張メカニズムを使用する場合、それらはシーケンス0x1B 0x22 0x43(ESC ” C)でアクティブなC1制御文字セットとして指定されます。が、Unicodeは、より高いレベルのプロトコルによって指定されるその解釈を残して、特定のC1制御コードセットを必要とし、唯一のU + 0085の動作を指定しない、それはISO / IEC 6429で指定されC1制御コードを解釈を示唆しています他の目的での使用がない場合。また、以下にISO / IEC 6429個のコードと一緒にリストされた3つの制御コードで表に記載されているRFC  1345は、実際にはISO / IEC 6429(で定義されていないPAD、 OPと
SGC)。
除いて SS2と SS3でEUC-JPのテキスト、および
NELからトランスコードのテキストではEBCDIC、これらのコードの8ビットのフォームを使用ことはほとんどないされています。
CSI、DCS、および
OSCは、
テキスト端末と端末エミュレーターを制御するために使用されますが、ほとんどの場合、7ビットのエスケープコード表現を使用します。それらのISO / IEC 2022準拠のシングルバイト表現はUTF-8では無効であり、対応するコードポイントのUTF-8エンコーディングはエスケープコード形式と同様に2バイト長です(たとえば、U + 009BのCSIはバイトとしてエンコードされます) 0xC2、UTF-8の0x9B)であるため、同等の2バイトのエスケープシーケンスではなく、これらを使用する利点はありません。これらのコードが最新のドキュメント、Webページ、電子メールメッセージなどに表示される場合、通常、C1コードを使用して提供するWindows-1252やMac OSRomanなどの独自のエンコーディングでその位置に文字を印刷することを目的としています。追加のグラフィック文字。
一部のC1コードの正式な英語名は、一般的な制御コードの標準(ISO 6429:1992またはECMA-48:1991)の最新版で、それらで使用されるグラフィック文字に関して中立になるように改訂されました。ラテン文字のように、行が上から下にページに書かれ、文字が左から右に行に書かれていると仮定しないで使用されている略語は変更されこれは、標準が他の言語に翻訳されたときにそれらが変更されないままであると標準がすでに指定しているためです。名前が変更されている場合は、略語の元となった元の名前も下の表の括弧内に示されています。
Esc + 12月 六角
アクロ
名前
説明 @128 80 パッド
パディング文字
ISO / IEC 6429(ECMA-48)の一部ではありません。ISO 10646の初期のドラフトでは、非ASCII文字をエンコードするために提案されたメカニズムの一部として使用されていました。この使用は、後のドラフトで削除されました。 それにもかかわらず、コードセット1および3の左パディングシングルバイト文字に対して、ISO-2022ベースのExtended Unix Code(EUC)の内部使用2バイト固定長形式で使用されますが、NULコードセット0および2に対して同じ機能を提供します。これは、通常の「パックされた」EUC形式では実行されません。A129 81 HOP
ハイオクテットプリセット
ISO / IEC 6429(ECMA-48)の一部ではありません。ISO 10646の初期のドラフトでは、最初のバイトを繰り返さずに、同じ最初のバイトを持つISO 2022準拠の複数バイト文字のシーケンスを導入する手段として意図されていたため、長さが短縮されました。この動作は、標準または公開された実装の一部ではありませんでした。その名前は、それにもかかわらずとして保持された RFC 1345の標準的なコード・ポイント名。  B130 82 BPH
ここで許可された休憩
改行が許可されているグラフィック文字の後に続きます。改行を示す手段が必ずしもハイフンである必要がないことを除いて、ソフトハイフンとほぼ同等です。ISO / IEC6429の初版の一部ではありません。ゼロ幅スペースも参照してC131 83 NBH
ここで休憩なし
壊れてはいけないグラフィック文字に従います。ISO / IEC6429の初版の一部ではありません。単語結合子も参照してD132 84 IND
索引
LFの意味に関するあいまいさを排除するために、アクティブ位置を1行下に移動します。1988年に廃止され、1992年にISO / IEC 6429から撤回されました(ECMA-48ではそれぞれ1986年と1991年)。E133 85 NEL
次の行
CR + LFに相当します。一部のIBMメインフレームで行末をマークするために使用されます。F134 86 SSA
選択したエリアの開始
ブロック指向の端末で使用されます。G135 87 ESA
選択したエリアの終わりH136 88 HTS
文字集計セット横集計セット
文字集計停止をアクティブ位置に設定します。I137 89 HTJ
正当化を伴う文字の集計正当化を伴う水平方向の集計 文字の集計と同様ですが、前の文字の後に次のタブストップに到達するまでスペースまたは行を配置する代わりに、スペースまたは行をアクティブフィールドの前に配置して、前のグラフィック文字を次のタブストップの直前に配置します。J 138 8A VTS
ライン集計セット垂直集計セット
ライン集計停止をアクティブ位置に設定します。K 139 8B PLD
パーシャルラインフォワードパーシャルラインダウン
プリンタなどでISO / IEC6429で下付き文字と上付き文字を作成するために使用されます。下付き文字は使用しますが、上付き文字はを使用します。PLD text PLUPLU text PLDL 140 8C PLU
パーシャルラインバックワードパーシャルラインアップM 141 8D RI
リバースラインフィードリバースインデックスN 142 8E SS2
シングルシフト2
次の文字は、G2またはG3グラフィックセットからそれぞれグラフィック文字を呼び出します。ISO / IEC 4873(ECMA-43)に準拠するシステムでは、デフォルト以外のC1セットが使用されている場合でも、これら2つのオクテットはこの目的にのみ使用できます。O 143 8F SS3
シングルシフト3P144 90 DCS
デバイス制御文字列
印刷可能な文字列(0x20から0x7E)とフォーマットエフェクター(0x08から0x0D)が続き、ST(0x9C)で終了します。これは、terminfoクエリなど、テキスト端末および端末エミュレーターの可変長制御シーケンスで使用 できます。Q145 91 PU1
私的使用1
データの送信者と受信者の事前の合意を条件として、必要に応じて私的使用のための標準化された意味のない機能のために予約されています。R146 92 PU2
私的使用2S147 93 STS
送信状態の設定T148 94 CCH
キャラクターをキャンセル
BSの意味についての曖昧さを排除することを目的とした破壊的なバックスペース 。U149 95 MW
メッセージ待機中 V150 96 スパ
保護地域の開始
ブロック指向の端末で使用されます。W151 97 EPA
保護地域の終わりX152 98 SOS 文字列の開始
ST(0x9C)で終了する制御文字列が続きます。これは、DCS、OSC、
PM、または APCによって開始される制御文字列 とは対照的に 、
SOSまたはST以外の任意の文字を含むことができます。ISO / IEC6429の初版の一部ではありません。MARC 21はUnicode形式のレコードでSOSとSTを使用して、照合目的で無視する必要のある文字列をマークアップしますが、MARC-8形式のレコードは同じ目的でNSBと
NSEを使用します Y153 99 SGC
シングルグラフィックキャラクターイントロデューサー
ISO / IEC 6429の一部ではありません。ISO10646の初期のドラフトでは、HOPモードから切り替えることなく単一のマルチバイト文字をエンコードするために使用されていました 。後のドラフトでは、この機能を除去し、名前にもかかわらずのように保持された RFC 1345の標準的なコード・ポイント名。  Z 154 9A SCI
シングルキャラクターイントロデューサー
単一の印刷可能な文字(0x20から0x7E)またはフォーマットエフェクター(0x08から0x0D)が続きます。その目的は、使用中のグラフィックまたは制御セットに関係なく使用できる制御機能またはグラフィック文字を定義できる手段を提供することでした。次のバイトが呼び出すものの定義は、国際標準では実装されISO / IEC6429の初版の一部ではありません。
[ 1559B CSI
コントロールシーケンスイントロデューサー
パラメータを取る制御シーケンスを導入するために使用されます。 156 9C ST
文字列ターミネーターDCS、 OS、 SC、
PM、または APCによって開始された可変長制御文字列を終了します 。] 157 9D OSC
オペレーティングシステムコマンド
印刷可能な文字列(0x20から0x7E)とフォーマットエフェクター(0x08から0x0D)が続き、ST(0x9C)で終了します。これらの3つの制御コードは、プロトコル情報の帯域内信号方式を可能にするために使用することを目的としていましたが、その目的で使用されることはめったにありません。xtermを含む一部のターミナルエミュレータは、ウィンドウタイトルを設定し、使用可能なカラーパレットを再構成するためのOSCシーケンスをサポートしています。また、標準のSTの非標準の代替手段として、BELを使用したOSCシーケンスの終了をサポートする場合もありAPCは、Kermitコマンドの送信に使用されることがありますが、セキュリティ上の理由から無効化またはフィルタリングされる場合が^ 158 9E
午後
プライバシーメッセージ_ 1599F APC
アプリケーションプログラムコマンド

書誌使用のためのC1制御コード
次の代替C1制御コードセットは、図書館システムなどの書誌アプリケーション用に定義されています。これは主に、文字列の照合と書誌フィールドのマークアップに関係しています。わずかに異なる変異体は、ドイツ規格で定義されているDIN 31626 (1978年に公開され、取り下げ以降)とISO規格ISO 6630、 後者はまたとしてドイツで採用されているDIN ISO6630。これらが異なる場合は、該当する場合は以下の表に記載されています。MARC-8は、このセットのNSBと
NSEのコーディングを
使用し、ISOバージョンで使用されていない場所にいくつかの追加のフォーマットエフェクターを追加します。ただし、MARC 21は、Unicode形式のレコードではなく、MARC-8レコードでのみこのコントロールセットを使用します。
ISO / IEC 2022拡張メカニズムを使用する場合、DIN 31626セットはシーケンス0x1B 0x22 0x45(ESC ” E)、でアクティブなC1制御文字セットとして指定され、ISO 6630 / DIN ISO 6630セットはシーケンス0x1B 0x22 0x42(ESC ” B)で指定されます。 ISO 6630セットの1985年の拡張は、シーケンス0x1B 0x26 0x40 0x1B 0x22 0x42(ESC & @ ESC ” B)を使用して明示的に指定することもできます。
Esc + 12月 六角
アクロ
名前
説明
@…F128…134 80…86 -(予約済み)G135 87 CUS
並べ替えのクローズアップ(DIN 31626、ISO 6630)スペースまたは区切り文字で区切られた2つの連続する文字シーケンスは、照合の目的で1つの単語として扱われる必要があることを宣言します。H136 88 NSB
非ソート文字の開始(DIN 31626、ISO 6630、MARC 21)照合の目的で無視される文字のシーケンスの開始をマークします。MARC 21は、MARC-8レコードでこの文字を使用しますが、同じ目的でUnicodeレコードで0x98(SOS)を使用
します。 I137 89 NSE
非ソート文字の終了(DIN 31626、ISO 6630、MARC 21)照合の目的で無視される文字のシーケンスの終わりをマークします。MARC 21は、MARC-8レコードでこの文字を使用しますが、同じ目的でUnicodeレコードで0x9C(ST)を使用します
。 J 138 8A FIL
フィラー文字(DIN 31626)フィールド内の必須の英数字の代わりに使用します。K 139 8B TCI
コンテキストインジケータのタグ(DIN 31626)書誌フィールド内で、タグ番号によって別の書誌フィールドのデータを参照するために使用されます。 PLD 部分的なラインダウン(ISO 6630)ISO6630の元の版にはありません。 ISO 6630の1985年版では、部分的なラインダウンに使用されました( 上記のPLDを参照)。L 140 8C ICI
コンテキストインジケータの識別番号(DIN 31626)書誌フィールド内で、ID番号によって別の書誌レコードのデータを参照するために使用されます。 PLU 部分的なラインナップ(ISO 6630)ISO6630の元の版にはありません。 ISO 6630の1985年版では、部分的なラインナップに使用されました( 上記のPLUを参照)。M 141 8D OSC
オプションの音節化制御(DIN 31626)長い単語の音節境界をマークします。ソフトハイフンも参照してください 。 ZWJ ジョイナー(MARC 21)MARC-8では、ゼロ幅接合子に使用されますが、U + 200DはUnicode形式のMARCレコードで使用されます。 N 142 8E SS2
シングルシフト2(DIN 31626)非ロックシフトコード。上記のSS2を参照してください 。 ZWNJ 非参加者(MARC 21)MARC-8では、ゼロ幅非接合子に使用されますが、U + 200CはUnicode形式のMARCレコードで使用されます。 O 143 8F SS3
シングルシフト3(DIN 31626)非ロックシフトコード。上記のSS3を参照してください 。P144 90 -(予約済み)Q145 91 EAB
埋め込まれた注釈の始まり(DIN 31626、ISO 6630)コンテンツ指定を使用して分離するのではなく、書誌フィールド内に埋め込まれる可変長注釈の開始をマークします。R146 92 EAE
埋め込みアノテーション終了(DIN 31626、ISO 6630)可変長の埋め込み注釈の終わりを示します。S147 93 ISB
アイテム仕様開始(DIN 31626)キーワードまたは順列文字列以外の、ある説明の特定の情報の文字列の開始をマークします。T148 94 ISE
アイテム仕様終了(DIN 31626)特定の情報の文字列の終わりを示します。U149 95 SIB
ソート補間開始(ISO 6630)照合目的でのみ使用される文字のシーケンスの開始をマークします。V150 96 SIE
補間終了の並べ替え(ISO 6630)照合目的でのみ使用される一連の文字の終わりを示します。W151 97 SSB
二次ソート値の始まり(ISO 6630)下位の照合値で文字列の開始をマークします。X152 98 SSE 二次ソート値終了(ISO 6630)文字列の終わりを従属照合値でマークします。Y153 99 INC
非標準文字のインジケータ(DIN 31626)次の非標準文字を識別します。Z 154 9A -(予約済み)
[ 1559B -(予約済み) 156 9C KWB
キーワードの始まり(DIN 31626、ISO 6630)書誌フィールド内のキーワードの開始をマークします。] 157 9D KWE
キーワード終了(DIN 31626、ISO 6630)書誌フィールド内のキーワードの終わりをマークします。^ 158 9E PSB
順列文字列の始まり(DIN 31626、ISO 6630)参照またはインデックスが生成されるときに要素の前に並べ替えられる文字列の開始をマークします。PSEまたは要素の終わりによって終了します。_ 1599F PSE
順列文字列終了(DIN 31626、ISO 6630)要素の前に並べ替えられる文字列の終わりをマークします。

その他のC1制御コードセット
EBCDIC§非ASCII EBCDICコントロールの定義、および
Videotex文字セット§C1コントロールコード
EBCDICは、ASCIIに存在するものに加えて、16の追加の制御コードを定義します。UnicodeまたはISO8859にマップされる場合、これらのコードは、IBMの文字データ表現アーキテクチャー(CDRA)で指定された方法でC1制御文字にマップされます。
New Line(NL)コントロールのデフォルトのマッピングはISO / IEC 6429 NEL(0x85; UNIXのライン終了規則に従ってマッピングがLFと交換されることがあります)に対応してい
ますが、残りの制御コードはISO / IEC 6429に対応したとえば、EBCDIC制御
SPS(0x09、0x8Dにマップ)とECMA-48制御
PLU(0x8C)は両方とも、上付き文字の開始または下付き文字の終了に使用されますが、1つにはマップされません。別。したがって、拡張ASCIIマップEBCDICは、ISO / IEC 2022で使用するためのISO-IRレジストリに登録されていませんが、独自のC1セットを持っていると見なすことができます。
さまざまな特殊なC1制御コードセットが、さまざまなVideotex形式で使用するために登録されています。

Unicode
Unicode制御文字
Unicodeは、ISO / IEC 2022との互換性のために、一般カテゴリ「Cc」(制御)に65のコードポイントを確保します。このカテゴリの制御コードは、U + 0000-U + 001F(C0コントロール)、U + 007F(削除)、およびU + 0080-U + 009F(C1コントロール)を対象としています。Unicodeは、U + 0009〜U + 000D、U + 001C〜U + 001F、およびU +0085のセマンティクスのみを指定します。残りの制御コードはUnicodeに対して透過的であり、それらの意味は上位レベルのプロトコルに委ねられています。
Unicodeには、C0とC1以外に割り当てられたカテゴリ「Cc」コードポイントはありません。ただし、明示的な双方向フォーマット用のマーク、埋め込み、分離、ポップ、合字の使用を制御するためのゼロ幅ジョイナーと非ジョイナーなど、C0およびC1コントロールセットの文字以外に追加のフォーマットエフェクター文字が含まれています。これらには、「Cc」ではなく「Cf」(フォーマット)という一般的なカテゴリが与えられます。

も参照してください
コントロールの写真
ANSIエスケープコード

脚注
^ BELLという名前は、Unicodeによって無関係の絵文字文字 (U + 1F514)に割り当てられています。当時、C0およびC1制御文字は、Unicode標準自体によって正式に名前が付けられていませんでしたが、これは、以前のバージョンのUTS#18(Unicode正規表現標準)に続くソフトウェアでのこの制御文字の名前としてのBELLの既存の使用と衝突しました。 、 例: Perl。 Unicodeは、制御文字の正式なエイリアスとしてALERTとBEL(BELLではない)を受け入れるようになりました。ただし、コードチャートにはISO6429エイリアスとしてBELLがリストされています。対応する制御画像のコードポイントは呼び出されます。ベルのシンボル。その後、Perlはバージョン5.18で絵文字にBELLを使用するように切り替えました。
^ ‘e’エスケープシーケンスは、ISOCおよび他の多くの言語仕様の一部ではありません。ただし、 GCCを含むいくつかのコンパイラによって理解されます。
^ ISO / IEC 6429 C1コードセットのオペレーティングシステムコマンド(OSC)と同じではありません

^ ISO-IR-040ドキュメントでは「Syllabication 」と綴られ、説明では「syllable」と「syllabe 」と綴られています。これらはおそらく誤植です。

参考文献
^ ISO / TC 97 / SC 2(1975)。ISO 646(PDF)の制御文字のセット。ITSC​​J / IPSJ。ISO-IR-1。
^ k IPTC(1995)。IPTC推奨メッセージ形式(PDF)(第5版)。IPTC TEC7901。
^ “送信終了文字(EOT)”。連邦規格1037C。1996年。
^ ウィリアムソン、カール。”Re:PRI#202:Unicode6.1.0″のNameAliases.txtの拡張。
^ ケンウィスラー
「制御文字の正式な名前エイリアス、L2 / 11-281」。ユニコードコンソーシアム。
^ “名前エイリアス”。Unicode文字データベース。ユニコードコンソーシアム。
^ 「C0コントロールと基本ラテン文字」(PDF)。ユニコードコンソーシアム。
^ 「charnames」。Perlプログラミングドキュメント。
^ ISO / IEC JTC 1 / SC 2(1998-02-12)。DIS 8859-10の最終テキスト、情報技術— 8ビットシングルバイトコード化グラフィック文字セット—パート10:ラテンアルファベットNo. 6(PDF)。ISO / IEC FDIS 8859-10:1998、JTC1 / SC2 N2992、WG3N415。
^ 「データリンクエスケープ文字(DLE)」。連邦規格1037C。1996年。
^ 「補足的な伝達制御機能(データ通信システムのための基本的なモード制御手順の拡張)」。欧州コンピュータ製造業者協会。1972年。ECMA-37。
^ オオカミ、ミシャ; ウィスラー、ケン; ウィックスティード、チャールズ; デイビス、マーク; フライターク、アスムス; Scherer、Markus(2005-05-06)。「10.1制御バイト値の回避」。Unicodeの標準圧縮スキーム。ユニコードコンソーシアム。UTS#6。
^ 「Ctrl-Sのポイントは何ですか?」。UnixとLinuxのスタック交換。
^ フォックス、ブライアン。「情報への新しいノードの追加」。情報:オンラインのメニュー方式のGNUドキュメンテーションシステム。GNUプロジェクト。
^ “制御機能コード”。レコード構造、文字セット、およびExchangeメディアのMARC21仕様。アメリカ議会図書館。2007-12-04。
^ 「組み込み型§str.splitlines」。Python標準ライブラリ。Python SoftwareFoundation。
^ ECMA(1994)。「7.3:文字セットコード要素の呼び出し」。文字コードの構造と拡張技術(PDF)(ECMA標準)(第6版)。p。14.ECMA-35。
^ アメリカ標準協会(1963年)。情報交換のためのアメリカ標準コード:4。凡例。p。6. ASAX3.4-1963。
^ ユニコードコンソーシアム(2019)。23.1:制御コード(PDF)。Unicode標準(12.0.0版)。pp。868–870。ISBN
 978-1-936213-22-1。
^ ECMA(1994)。「6.4.2:コード化された制御機能の主要なセット」。文字コードの構造と拡張技術(PDF)(ECMA標準)(第6版)。p。11.ECMA-35。
^ ECMA(1994)。「6.4.3:コード化された制御機能の補足セット」。文字コードの構造と拡張技術(PDF)(ECMA標準)(第6版)。p。11.ECMA-35。
^ k l m Sveriges Standardiseringskommission(1975)。新聞のテキスト送信用のNATSコントロールセット(PDF)。ITSC​​J / IPSJ。ISO-IR-7。
^ k l m n IPTC(1976)。新聞のテキスト送信用のコントロールセット(PDF)。ITSC​​J / IPSJ。ISO-IR-26。
^ ITU(1985)。Teletexプライマリ制御機能セット(PDF)。ITSC​​J / IPSJ。ISO-IR-106。
^ Úřadpronormalizaciaměřeni(1987)。EMがSS2に置き換えられたISO646の制御文字のセット(PDF)。ITSC​​J / IPSJ。ISO-IR-140。
^ ISO / TC 97 / SC 2(1977)。ISO 646の制御文字のセット。IS4はG2のシングルシフト(SS2)に置き換えられています(PDF)。ITSC​​J / IPSJ。ISO-IR-36。
^ ISO / TC 97 / SC 2(1982)。日本規格JISC 6225-1979の制御文字のC0セット(PDF)。ITSC​​J / IPSJ。ISO-IR-74。
^ ISO / TC97 / SC2 / WG6。「ISO / TC97 / SC2 / WG8およびISO / TC97 / SC18 / WG8への連絡声明」(PDF)。ISO / TC97 / SC2 / WG6N317.rev。
^ Printronix(2012)。OKI®プログラマーズリファレンスマニュアル(PDF)。p。26。
^ イーウェル、ダグ(2020-10-16)。「テレテキストで区切られたモザイクグラフィック」。Unicodeメーリングリストアーカイブ。ユニコードコンソーシアム。
^ ECMA / TC 1(1973)。「簡単な歴史」。7ビット入出力コード化文字セット(PDF)(第4版)。ECMA。ECMA-6:1973。
^ ECMA / TC 1(1971)。「8.2:7ビットコードと8ビットコードの対応」。7ビットコード化文字セット(PDF)の拡張(第1版)。ECMA。pp。21–24。ECMA-35:1971。
^ ECMA / TC 1(1973)。「4.2:特定の制御文字」。7ビット入出力コード化文字セット(PDF)(第4版)。ECMA。p。16. ECMA-6:1973。
^ ECMA / TC 1(1974)。「5:表1に関する注記」。8ビットコード化文字セット(PDF)(第1版)。ECMA。pp。4–5。ECMA-43:1974。
^ エスケープシーケンスで使用されるコード化文字セットのISO / IEC国際レジスタ(PDF)、ITSCJ / IPSJ、ISO-IR
^ DIN(1979-07-15)。ドイツ規格DIN31626(PDF)に準拠した書誌使用のための追加の制御コード。ITSC​​J / IPSJ。ISO-IR-40。
^ ISO / TC97 / SC2(1983-10-01)。ISO 6429:1983のC1制御セット(PDF)。ITSC​​J / IPSJ。ISO-IR-77。
^ ECMA / TC 1(1979)。「簡単な歴史」。文字イメージングI / Oデバイスの追加制御機能(PDF)(第2版)。ECMA。ECMA-48:1979。
^ ECMA / TC 1(1985)。「5.3.8:96個のグラフィック文字のセット」。コード拡張テクニック(PDF)(第4版)。ECMA。pp。17–18。ECMA-35:1985。
^ ECMA / TC 1(1985)。「5.2.1:ロッキングシフト機能の使用」。コード拡張テクニック(PDF)(第4版)。ECMA。pp。9–10。ECMA-35:1985。
^ ISO / IEC JTC 1 / SC 2 / WG 3(1998-02-12)。DIS 8859-1の最終テキスト、8ビットのシングルバイトコード化グラフィック文字セット-パート1:ラテンアルファベットNo.1(PDF)。ISO / IEC FDIS 8859-1:1998; JTC1 / SC2 / N2988; WG3 / N411。このコード化されたグラフィック文字のセットは、レベル1のISO / IEC2022またはISO / IEC 4873に準拠した8ビットコードのバージョンと見なすことができます。コードテーブルの影付きの位置は、そうでないビットの組み合わせに対応します。グラフィック文字を表します。それらの使用はISO / IEC8859の範囲外です。ISO / IEC6429などの他の国際規格で指定されています。
^ 「JISX02xx測」。
^ ケンウィスラー(2015-10-05)。「なぜこれまで何も消えない」。Unicodeメーリングリスト。
^ ECMA(1991)。コード化された文字セットの制御機能。標準ECMA-48。
^ Lunde、Ken(2008)。CJKV情報処理:中国語、日本語、韓国語、ベトナム語のコンピューティング。オライリー。p。244. ISBN  9780596800925。
^ モイ、エドワード; ギルデア、スティーブン; ディッキー、トーマス。「デバイス制御機能」。XTerm制御シーケンス。
^ “コードテーブル拡張ラテン(ANSEL)”。レコード構造、文字セット、およびExchangeメディアのMARC21仕様。アメリカ議会図書館。2007-12-05。
^ モイ、エドワード; ギルデア、スティーブン; ディッキー、トーマス。「オペレーティングシステムコマンド」。XTerm制御シーケンス。
^ フランク・ダ・クルーズ; Christine Gianone(1997)。C-Kermitを使用します。デジタルプレス。p。278. ISBN  978-1-55558-164-0。
^ 「情報処理;書誌制御文字」。Beuth:DINの公開。DIN 31626:1978-12。
^ ISO / TC 46(1983-06-01)。国際標準ISO6630(PDF)に準拠した書誌使用のための追加の制御コード。ITSC​​J / IPSJ。ISO-IR-67。
^ ISO / TC 46(1986-02-01)。国際標準ISO6630(PDF)に準拠した書誌使用のための追加の制御コード。ITSC​​J / IPSJ。ISO-IR-124。
^ 「DINISO6630 1997年12月」。AFNORエディションオンラインストア。
^ Umamaheswaran、VS(1999-11-08)。「3.3ステップ2:バイト変換」。UTF-EBCDIC。ユニコードコンソーシアム。Unicodeテクニカルレポート#16。64個の制御文字、ASCII DELETE文字(U + 007F)は、IBM文字データ表現アーキテクチャ(CDRA)で定義されているように、EBCDIC規則に従ってマッピングされます。行制御文字は、CDRAのデフォルトのペアからISO / IEC 6429改行(U + 000A)および次行(U + 0085)制御文字に交換されます。
^ スティール、ショーン(1996-04-24)。cp037_IBMUSCanadaからUnicodeテーブルへ。Microsoft / Unicodeコンソーシアム。
Unicode標準
C0コントロールと基本ラテン文字
C1コントロールとラテン1サプリメント
コントロールの写真
Unicode標準、バージョン6.1.0、第16章:特殊領域とフォーマット文字
ATIS Telecom Glossary 2007
De litteris regentibus C1 quaestionesseptemまたはC1文字はXHTML1.0で合法ですか?
W3C I18N FAQ:HTML、XHTML、XML、および制御コード
エスケープシーケンスで使用されるコード化文字セットの国際レジスタ