問題
UTF-8で日本語1文字は通常何バイトか。
選択肢
- 13バイト
- 21バイト
- 32バイト
- 44バイト
正解
1. 3バイト
詳しい解説を見る解説を閉じる
解説
UTF-8は1文字を1〜4バイトの可変長で表現する文字符号化方式であり、ひらがな・カタカナ・常用漢字などの日本語1文字は通常3バイトで符号化される。ASCIIと互換の英数字・基本記号は1バイト、ギリシャ文字やキリル文字などは2バイト、絵文字や一部の追加漢字は4バイトとなる。したがって正解は3バイトである。誤答の1バイトはASCII文字の長さ、2バイトはShift_JISやUTF-16で日本語を表す場合の単位、4バイトは絵文字などに該当し、いずれもUTF-8における日本語の標準的な長さではない。基本情報では「UTF-8は可変長」「ASCIIと互換性がある」という特徴と、文字列のバイト数を計算させる問題が頻出である。
一問一答
科目A 180問+科目B 60問