[php] 文字コード表 シフトJIS(Shift_JIS)
본문
* シフトJISの1バイトコード(半角文字)のエリア
o 0x00~0x1f、0x7f は制御コードです
o 0x20~0x7e はASCII文字です
o 0xa1~0xdf は半角カタカナです
* シフトJISの2バイトコード(全角文字)のエリア(JIS X 0208の漢字エリア)
上位1バイト 0x81~0x9f、 0xe0~0xef
下位1バイト 0x40~0x7e、 0x80~0xfc
ですが機種に依存しない観点より、HTMLで以下の水色エリアは使用しないのが無難です
o 水色エリアはJIS X 0208 (1990) to Unicode 漢字コード表に存在しないコードです
o 0x8540~ 0x889e は機種依存文字の主なエリアです
o 0xeb40~ 0xeffc はMacOS では縦書用文字、Windows では特殊な外字エリアです
o 0xf040~ は外字エリアです(記載していません)
* perlでのシフトJISの文字化けについて
o perlで (0x5c) は「次につづく文字が何であるかを表す」特殊な意味合いを持ちます
o 下の全角文字のエリアの下位バイト5cの列の文字を用いると確実に文字化けします
o 5cの列の文字の後に ¥ をつける事により、¥¥ が ¥ を意味する事となり回避できます
o 0x00~0x1f、0x7f は制御コードです
o 0x20~0x7e はASCII文字です
o 0xa1~0xdf は半角カタカナです
* シフトJISの2バイトコード(全角文字)のエリア(JIS X 0208の漢字エリア)
上位1バイト 0x81~0x9f、 0xe0~0xef
下位1バイト 0x40~0x7e、 0x80~0xfc
ですが機種に依存しない観点より、HTMLで以下の水色エリアは使用しないのが無難です
o 水色エリアはJIS X 0208 (1990) to Unicode 漢字コード表に存在しないコードです
o 0x8540~ 0x889e は機種依存文字の主なエリアです
o 0xeb40~ 0xeffc はMacOS では縦書用文字、Windows では特殊な外字エリアです
o 0xf040~ は外字エリアです(記載していません)
* perlでのシフトJISの文字化けについて
o perlで (0x5c) は「次につづく文字が何であるかを表す」特殊な意味合いを持ちます
o 下の全角文字のエリアの下位バイト5cの列の文字を用いると確実に文字化けします
o 5cの列の文字の後に ¥ をつける事により、¥¥ が ¥ を意味する事となり回避できます
추천0
댓글목록 0
등록된 댓글이 없습니다.