文字コード変換ツール
テキストのUTF-8バイト列(16進数)を表示し、文字化けのシミュレーションを行います。
UTF-8 バイト列
E3 81 93 E3 82 93 E3 81 AB E3 81 A1 E3 81 AF E4 B8 96 E7 95 8C
21 バイト | 7 文字
文字別の詳細
U+3053
UTF-8: E3 81 93 (3B)
U+3093
UTF-8: E3 82 93 (3B)
U+306B
UTF-8: E3 81 AB (3B)
U+3061
UTF-8: E3 81 A1 (3B)
U+306F
UTF-8: E3 81 AF (3B)
U+4E16
UTF-8: E4 B8 96 (3B)
U+754C
UTF-8: E7 95 8C (3B)
文字化けシミュレーション
UTF-8 → Shift_JISとして解釈
UTF-8でエンコードされたデータをShift_JISとして読んだ場合
縺薙s縺ォ縺。縺ッ荳也阜
UTF-8 → EUC-JPとして解釈
UTF-8でエンコードされたデータをEUC-JPとして読んだ場合
����<���
UTF-8 → Latin-1として解釈
UTF-8でエンコードされたデータをLatin-1として読んだ場合
ããã«ã¡ã¯ä¸ç
使い方
テキスト入力欄に文字コードを調べたい文字列を入力します。デフォルトでは「こんにちは世界」が入力されています。入力と同時に、UTF-8のバイト列(16進数表示)と各文字のUnicodeコードポイント・バイト数が表示されます。
「文字別の詳細」では各文字のUnicodeコードポイント(U+XXXX形式)とUTF-8バイト列を確認できます。「文字化けシミュレーション」では、UTF-8データをShift_JIS・EUC-JP・Latin-1として誤って読み込んだ場合の表示を再現します。文字化けの原因調査に活用できます。
よくある質問
関連知識
文字コードの歴史は1963年のASCII(7ビット・128文字)に始まります。日本語対応として1978年にJIS C 6226(JIS X 0208)、1982年にShift_JIS、1985年にEUC-JPが策定されました。1991年にUnicode 1.0が公開され、2008年頃からWebでのUTF-8普及が加速しました。
UTF-8は可変長エンコーディングで、ASCII(1バイト)、欧州文字(2バイト)、日本語(3バイト)、絵文字(4バイト)と文字によってバイト数が異なります。