next up previous contents index
: 記号 : データ型 : 虚数   目次   索引

文字データ

文字データは次のように表記される.

#\$c$
ここで,$c$は任意の文字である. スペース,改行,タブ,改ページ,エスケープ文字はそれぞれ次のように表記される.
#\space
#\newline
#\tab
#\newpage
#\escape
TUTSchemeは1バイトのASCII文字と2バイトの日本語文字をサポートしている. 内部的にもASCII文字には8ビット,日本語文字には16ビットの文字コードを使 用して区別している.また,日本語文字のコード系としてEUC(拡張UNIXコード), SJIS(シフトJIS),JISが使用でき,内部表現にはEUCを使用している. 整数を文字コードとして扱う場合(例えば integer->charへの引数として 渡す場合),その整数を$2$進数で表した場合の下位16ビットのみが意味を持つ. 逆に,文字データから文字コードを取り出す場合(例えば char->integer を呼び出した場合),下位16ビットを文字コードとし,それ以外のビットが0である 非負整数が使われる.



Tsuneyasu KOMIYA 平成14年2月22日