文字数・バイト数カウンター
文字列を入力すると、文字数(桁数)と指定した文字エンコーディングでのバイト数を表示します。
文字列の入力
# | 文字エンコーディング | 別名 | 説明 |
---|---|---|---|
1 | UTF-8 | Unicodeの文字を1~6バイトの可変長で表現するエンコーディング方式で、ASCIIとの互換性を持ち、世界中の多くのソフトウェアで使われています。また、任意の位置から文字の判定が可能で、その柔軟性と効率性から広く採用されています。 | |
2 | UTF-16 | Unicodeの文字を表現するための可変長文字エンコーディングであり、基本的に2バイトまたは4バイトの符号単位で文字を表します。Windows環境でよく利用され、JavaやC#、JavaScriptなどのプログラミング言語でも扱うことができます。 | |
3 | UTF-32 | Unicodeの文字を表現するための固定長文字エンコーディングで、各文字を32ビット(4バイト)の符号単位で表現します。これにより、すべてのUnicode文字を一貫して4バイトのコードユニットで表現できます。 | |
4 | Shift_JIS | シフトJIS | 日本語の文字エンコーディング方式で、1バイトまたは2バイトの可変長文字エンコーディングです。ASCII文字や半角カタカナは1バイトで表現され、日本語の漢字や全角ひらがな、全角カタカナなどは2バイトで表現されます。 |
5 | Microsoftコードページ932 | CP932、Windows-31J、MS932 | 日本語の文字エンコーディング方式で、ASCII文字は1バイトで表現され、日本語の漢字や全角ひらがな、全角カタカナおよび特殊文字は2バイトで表現されます。㈱などのIBM、NEC特殊文字を含む点がShift_JISとの違いでWindows環境でよく利用されます。 |
6 | EUC-JP | 日本語EUC | 日本語の文字をエンコードする可変長文字エンコーディング方式です。ASCII文字は1バイトで、日本語の漢字や全角ひらがな、全角カタカナなどは2バイトで表現されます。また半角カタカナが2バイト、特殊文字は3バイトで表現されることがあるのが特徴です。Unix系システムでよく利用されます。 |
7 | ISO-2022-JP | JISコード | 日本語の文字をエンコードする可変長文字エンコーディング方式であり、文字コードを7ビット単位で符号化しエスケープシーケンスという特殊な制御文字を挿入することにより複数の文字集合(いわゆる半角文字と全角文字など)を切り替えます。文字集合にはラテン文字、ギリシア文字、キリル文字も含まれ、インターネット聡明期から電子メールやテキスト通信に利用されています。 |
8 | ASCII | ASCIIコード | 英語アルファベット、数字、基本的な記号などの文字を表現するための7ビットの文字エンコーディング方式です。各文字は1バイト(7ビット)で表現され、128の異なる文字を含んでいます。ASCIIは、コンピュータ間のテキスト通信やデータの表現に広く使用され、基本的なテキストエンコーディングとして標準化されています。 |
9 | ISO/IEC 8859-1 | Latin-1 | 8ビット(1バイト)の文字エンコーディング方式の標準規格の一つで、主にヨーロッパ諸言語で使用される文字や記号が収録されています。Latin-1(ラテン1)が最も普及しフランス語、ドイツ語、スペイン語、イタリア語など西ヨーロッパのほとんどの言語をカバーしています。 |
10 | Windows-1252 | CP1252 | 欧州の言語を中心にした拡張ASCII文字セットを表現するための文字エンコーディング方式です。ISO/IEC 8859-1を拡張したもので各文字は1バイトで表現されアクセント付き文字や特殊文字が追加されており、Windows環境でよく利用されます。 |
11 | GB 2312 | 信息交换用汉字编码字符集・基本集 | 中華人民共和国で広く使用される簡体字中国語の文字エンコーディング方式です。各文字は2バイトで表現され、6763の基本漢字と682の非漢字文字を含んでいます。このエンコーディングは、簡体字中国語のテキストを表現するのに使用され、ASCII文字との互換性があります。 |
12 | GBK | 技術規範指導性文件、Code page 936(CP936)、MS936 | 中華人民共和国で広く使用される簡体字中国語の文字エンコーディング方式で、GB 2312の拡張版です。各文字は1バイトまたは2バイトで表現され、GB 2312に収録されていなかった追加の漢字や記号などを含んでいます。Unicode1.1との互換性を持ち、多言語のサポートも提供しています。 |
13 | GB 18030 | 信息技术 中文编码字符集 | 中華人民共和国で使用される文字エンコーディング方式で、広範な言語のサポートを提供します。各文字は1バイトまたは2バイト、または4バイトで表現され、GB 2312、GBK、Unicodeの文字を包括的にサポートしています。これにより、簡体字中国語だけでなく、伝統的な漢字、日本語、韓国語の文字もエンコード可能です。 |
14 | Big5 | 大五碼 | 繁体字中国語の文字エンコーディング方式で、台湾や香港、マカオなどで広く利用されています。各文字は2バイトで表現され、繁体字や特殊文字を包括的にサポートしています。ASCIIとの互換性があり、簡体字中国語とは異なる文字セットを持っています。 |
15 | KOI8-R | ロシア語のキリル文字を表現するための文字エンコーディング方式です。各文字は1バイトで表現され、ASCII文字との互換性がありロシア語の特殊文字や記号を含んでいます。Unix系システムでよく利用されます。 | |
16 | KOI8-U | キリル文字を使う言語であるウクライナ語をカバーするように設計された文字エンコーディング方式です。各文字は1バイトで表現され、ASCII文字との互換性があり、ウクライナ語の特殊文字や記号を含んでいます。Unix系システムでよく利用されます。 |
文字数・バイト数
文字数(桁数) | バイト数 |
---|---|
0 | 0 |