文字コード変換ツール

テキストのUTF-8バイト列(16進数)を表示し、文字化けのシミュレーションを行います。

UTF-8 バイト列

E3 81 93 E3 82 93 E3 81 AB E3 81 A1 E3 81 AF E4 B8 96 E7 95 8C

21 バイト | 7 文字

文字別の詳細

U+3053

UTF-8: E3 81 93 (3B)

U+3093

UTF-8: E3 82 93 (3B)

U+306B

UTF-8: E3 81 AB (3B)

U+3061

UTF-8: E3 81 A1 (3B)

U+306F

UTF-8: E3 81 AF (3B)

U+4E16

UTF-8: E4 B8 96 (3B)

U+754C

UTF-8: E7 95 8C (3B)

文字化けシミュレーション

UTF-8 → Shift_JISとして解釈

UTF-8でエンコードされたデータをShift_JISとして読んだ場合

縺薙s縺ォ縺。縺ッ荳也阜

UTF-8 → EUC-JPとして解釈

UTF-8でエンコードされたデータをEUC-JPとして読んだ場合

�“�‚“��<��–�•Œ

UTF-8 → Latin-1として解釈

UTF-8でエンコードされたデータをLatin-1として読んだ場合

こんにちは世界

使い方

テキスト入力欄に文字コードを調べたい文字列を入力します。デフォルトでは「こんにちは世界」が入力されています。入力と同時に、UTF-8のバイト列(16進数表示)と各文字のUnicodeコードポイント・バイト数が表示されます。

「文字別の詳細」では各文字のUnicodeコードポイント(U+XXXX形式)とUTF-8バイト列を確認できます。「文字化けシミュレーション」では、UTF-8データをShift_JIS・EUC-JP・Latin-1として誤って読み込んだ場合の表示を再現します。文字化けの原因調査に活用できます。

よくある質問

関連知識

文字コードの歴史は1963年のASCII(7ビット・128文字)に始まります。日本語対応として1978年にJIS C 6226(JIS X 0208)、1982年にShift_JIS、1985年にEUC-JPが策定されました。1991年にUnicode 1.0が公開され、2008年頃からWebでのUTF-8普及が加速しました。

UTF-8は可変長エンコーディングで、ASCII(1バイト)、欧州文字(2バイト)、日本語(3バイト)、絵文字(4バイト)と文字によってバイト数が異なります。

関連ツール