• 追加された行はこの色です。
  • 削除された行はこの色です。
* use encoding [#o1debe37]
* 文字コードの宣言 - use utf8, use encoding[#b8e132f9]

** 効果 [#e2b879ba]
- Perlのソースコード自体の文字列を、UTF8フラグ付きにする。
- 標準入力と標準出力を指定した文字コードに変換する。
- その際、入力についてはUTF8フラグを付け、出力についてはUTF8フラグを落とす。
そのスクリプトファイルがUTF8フラグ付きである事、スクリプトファイルがどんな文字コードで書かれているかを宣言する。

** 使いどころ [#ob588d97]
Perlのソースコード内に日本語を書いて、それを加工するような時。
上のプログラムは正しく「あ」が表示される。下は化ける。

** 効果 [#e2b879ba]
(1) スクリプト内の文字列をすべてUTF8フラグ付きにする。
~(2) 標準入力と標準出力を指定した文字コードに変換する。
~(3) その際、入力についてはUTF8フラグを付け、出力についてはUTF8フラグを落とす。
*** use utf8 [#f0468f77]
 #!/usr/bin/perl
 
 use encoding 'euc-jp';
 
 $text = "あああ";
 print  substr($text,0,1),"\n";
 use encoding 'utf8';
ではなく、
 #!/usr/bin/perl
 use utf8;
とすると、(1)のUTF8フラグ付きにする効果は変わらないが、(2)(3)の効果はない。
*** PerlIOレイヤー [#q181506f]
(2)(3)の機能をPerlIOレイヤーと言う。標準入力・標準出力の文字コードを個別に設定する事も可能。この機能はuse encoding以外にもopen()等で使用できる。


** 例 [#caf98f4d]
*** スクリプト(EUC) → 標準出力(SJIS) [#x0407b27]
 #!/usr/bin/perl
 
 #use encoding 'euc-jp';
 
 $text = "あああ";
 print  substr($text,0,1),"\n";
 use encoding 'euc-jp', STDOUT => 'shift_jis';
 $text = '花鳥風月';
 @chars = split '',$text;
 foreach $c (@chars){
     print $c,"\n";
 }

** 注意点 [#b996384e]
- ファイルの入出力については効果がない。それにはuse openなどを使う。
- (標準出力に)print()する文字列はUTF8フラグがあってはならない(Perlがwarningを出す)。そのため、出力時にUTF8を落とすのは必要なこと。

** 文字コードの変換 [#caf98f4d]
以下のようにすると、EUCからSJISへ変換して表示される。
*** 標準入力(EUC) → スクリプト(SJIS) → 標準出力(SJIS) [#h76657df]
EUCなターミナルから文字を入力すると、ターミナルにはSJISな文字が返ってくる。
 #!/usr/bin/perl
 
 use encoding 'euc-jp', STDOUT=>'shift_jis'
 while(<>){
     print $_;
 use encoding 'shiftjis', STDIN=>'euc-jp';
 while (<>) {
     ($char) = split '', $_;
     print $char,"\n";
 }

**use utf8 [#o15c2b2e]
use utf8は、use encoding 'utf8'と同じ意味。


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS