DBCS


DBCS

その他の使用法については、
DBCSを参照して
ダブルバイト文字セット(DBCS )は、すべての文字(制御文字を含む)が2バイトでエンコードされるか、付随するシングルバイト文字セット(SBCS)で表現できないすべてのグラフィック文字がエンコードされる文字エンコードです。 2バイト(通常、漢字はこれらの2バイト文字のほとんどを構成します)。DBCSは、多くの固有の文字または記号を含む各国語をサポートします(1バイトで表現できる文字の最大数は256文字ですが、2バイトは最大65,536文字を表すことができます)文字)。そのような言語の例には、日本語と中国語が含まれます。韓国語のハングルにはそれほど多くの文字が含まれていませんが、KS X 1001はハングルと漢字の両方をサポートし、1文字あたり2バイトを使用します。

コンテンツ
1 CJK(中国語/日本語/韓国語)コンピューティング
2 あいまいさ 3 TBCS 4 も参照してください
5 外部リンク

CJK(中国語/日本語/韓国語)コンピューティング
DBCSという用語は、従来、各グラフィック文字が2バイトでエンコードされる文字エンコードを指します。
Big-5やShiftJISなどの8ビットコードでは、DBCSの文字は、最上位ビットが設定された(つまり、7ビットより大きい)先頭(最初の)バイトで表され、ペアになります。 1バイト文字セット(SBCS)。変更されていない既製のソフトウェアとの互換性を維持するための実用的な理由から、SBCSは半角文字に関連付けられ、DBCSは全角文字に関連付けられています。ISO-2022-JPなどの7ビットコードでは、エスケープシーケンスまたはシフトコードを使用してSBCSとDBCSを切り替えます。
「DBCS」という用語の使用は、 ISO2022に準拠していない基本構造を意味する場合がたとえば、「DBCS」は、特にExtended Unix Code(EUC)ではない2バイトエンコーディングを意味する場合が
DBCSのこの本来の意味は、今日の正しい使用法と見なされているものとは異なります。EUC-JP、EUC-KR、EUC-TW、GB18030、UTF-8などの文字エンコーディングは2つ以上を使用するため、これらの文字エンコーディングは適切にマルチバイト文字セット(MBCS)または可変幅エンコーディングと呼ばれると主張する人もいます。一部の文字ではバイト、他の文字では1バイトをサポートします。

あいまいさ
DBCSを使用してUTF-16およびUTF-8エンコーディングを意味する人もいれば、DBCSという用語を使用して、文字ごとに1バイト以上を使用する古い( Unicode以前の)文字エンコーディングを意味する人もいます。Shift JIS、GB2312、およびBig5は、1文字あたり複数のバイトを含むことができるいくつかの文字エンコードですが、これらの文字エンコードは実際には可変幅のエンコードであるため、これらの文字エンコードにDBCSという用語を使用しても、誤った用語です(両方のUTF- 16およびUTF-8)。一部のIBMメインフレームには、マルチバイトコードページの2バイト部分のみを含む真のDBCSコードページが
ソフトウェアの国際化に「DBCSイネーブルメント」という用語を使用する場合、あいまいな用語を使用しています。彼らは、コードページを備えた古いテクノロジーを使用して東アジア市場向けのソフトウェアを作成したい、またはUnicodeの使用を計画していることを意味します。この用語は、東アジア言語への翻訳を意味する場合も通常、「Unicodeの有効化」とは、Unicodeを使用してソフトウェアを国際化することを意味し、「DBCSの有効化」とは、ソフトウェアを国際化するために東アジアのさまざまな国に存在する互換性のない文字エンコードを使用することを意味します。Unicodeは、他の多くの文字エンコードとは異なり、東アジアのすべての主要言語をサポートしているため、Unicodeを使用するソフトウェアを有効にして保守する方が一般的に簡単です。DBCS(非Unicode)の有効化は、通常、はるかに古いオペレーティングシステムまたはアプリケーションがUnicodeをサポートしていない場合にのみ必要です。

TBCS
トリプルバイト文字セット(TBCS)は、文字(制御文字を含む)が3バイトでエンコードされる文字エンコードです。

も参照してください
可変幅エンコーディング
DOS / V

外部リンク
Microsoftの「2バイト文字セット」の定義
Wayback MachineでのIBMの「2バイト文字セット」の定義(2018年10月18日アーカイブ)