トシちゃん先生の海釣り:3月12日 C言語

2024年03月17日

3月12日 C言語

Ｑ：Ｃ言語ではエスケープ文字としてバックスラッシュを使いますが、
　　日本語では円記号を使うのは何故ですか。

Ａ:これは、バックスラッシュのASCIIコードが 16進数の5C（0x5c、5Ch）
　　であることと、日本語のJISコードにおいては円記号がASCIIコードの 5Ch
　　に割り当てられていることによります。
　　つまり、コードが一致しているからです。

Ｑ：Ｃ言語では文字も数字も一緒くたに扱われているように思えます。
　　　初心者には紛らわしいのですが。

Ａ:
　　私たちが画面で見る文字も数字も、最小情報量であるビット(0 か 1)
　　の組み合わせで表現されます。
　　　例えば、ASCIIコードでは、英字のＡは41h(0x41)という値で表現されます。
　　　最も機械に近いレベルで表現すると　01000001　です。
　　　つまり、'A'も0x41も機械内部では 01000001 であり、画面上では英字のＡです。
　　したがって、Ｃ言語では、変数をＸとして、Ｘ＝'A'とするのと、Ｘ＝0x41
　　とするのは同じことになります。
　　紛らわしく感じるのは、画面上の数字や文字をそのまま受け取るからです。

　　　次のように考えると良いでしょう。私たちは文字「Ａ」を文字そのものとして
　　理解していますが、コンピュータが扱う最小情報量はビットで 0 か 1ですから、
　　「Ａ」そのものは認識できません。そこで、「Ａ」を 01000001 に当てはめ、機
　　械で「Ａ」という文字を処理できるようにしているのです。ただし、0 と１の並
　　びは人間にわかりにくいので、通常は16進数で表現されます。Ａは 01000001
　　ですから、16進数で41となります。
　　

　　　　　コンピュータでの表現　　　　画面での英数字　　
　　　------------------------------------------------------------
　　　16進数の　48 65 6C 6C 6F 　　英字で H e l l o
　　　16進数の　31 32 33 34 35 　　数字の 1 2 3 4 5

　　とにかく、私たちが使う文字や数字が機械の内部ではどのように扱われているか、
　　ということに興味を持つことです。
　

Ｑ：よく「文字化けする」ということを耳にしますが、文字化けする原理を教えて下さい。

Ａ:まず、Ｃ言語との関連で説明しましょう。例えば、エスケープ文字は円記号（￥）で、
　　そのASCIIコードは 5Chです。ここで、漢字の「表」を例に取ると、シフトＪＩＳでは16進数
　　の 955C です。もうお分かりですね。もしコンパイラなどが 955C を漢字と認識せず、95と5C
　　と別々に読むと、5Ch は '\' ですから文字として認識されません。したがって、955Ch は 95
　　だけとして読まれてしまい、「表」はどこかへ消えます。古いコンパイラ（Lattice C ver.2
　　など）ではよくあった話です。現在のＣコンパイラは漢字を扱えますが、注意はしておく必要
　　があります。

　　次に、漢字コードの関係で文字化けが生じる原因を説明しましょう。漢字変換には、パソコン
　　ではＪＩＳコードやシフトＪＩＳコード、ワークステーションではＥＵＣコードが使われます。
　　例えば、「大学」を例にとると、
　　　　　　　　　　　　　　　　　　　　　大　学　
　　　　　　　　　　　　シフトＪＩＳでは、91E5 8A77
　　　　　　　　　　　　　　　ＪＩＳでは、4267 3358
　　と16進数の値が異なります。このように、同一漢字でも16進数が異なることから、漢字を認識
　　する方法も異なるということになります。ですから、異なる機種の間で通信する場合はコード
　　を自動的に判別するソフトでないと文字化けすることがあります。自分のパソコンがどの漢字
　　コードを用いているか、通信の相手がどのコードを用いているかを調べておくことも重要です。

　　試しに、図書館を呼び出して、図書検索をEUCコードと異なるコートでやってみて下さい。

　　　　

Ｑ：通信ではファイルをバイナリで送ったり(アップロード)、受け取ったり（ダウンロード）
　　するのが安全といわれますが何故ですか。

Ａ: Internet のＱ＆Ａに書いて有ります。そこをご覧下さい。

Ｑ：マスクとはどのようなことですか。

Ａ：例で示しましょう。
　　X & 0X00FF とは、数字X と 0X00FFとのビットごとのANDをとることです。
　　0X00FFをビットで示す（上段はビット、下段はビットフィールド）と、

0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1
　　　----------------------------------------------------------
　　 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0

　　となります。上位８ビットはゼロですから、Xと0X00FFとのANDをとった数も、
　　上位８ビットはゼロになります。つまり、上位８ビットはフィルターをかけ
　　て隠すことを意味しますので、マスクするというわけです。

　　その他の例
　　　　X & 0x7fff　　15ビット目をマスク
　　　　X & 0x003f　　 6ビット目以上をマスク
　　　　X & 0x000f　　 4ビット目以上をマスク

　（補足）
　　インターネットでは「サブネットマスク」が使われます。
　　サブネットマスクは十進数のオクテットで、
　　　255.255.0.0
　　　255.255.255.0
　　などと表されます。

　　10進数の255は、16進数の FF、2進数の 11111111　です。
　　10進数の 0 は、16進数の 00、2進数の 00000000　です。

　　これから、なぜ「マスク」というのか予想できますね。

　　「サブネットマスク」については、Internetのページに説明があ
　　ります。

Ｑ：ビットシフトとはどのようなことですか。

Ａ：例で示しましょう。
　　0XFF00 >> 8　の場合、右へ８ビットシフトすると、右側の８ビットは除か
　　れ、代わりに左側に８ビット分 0が詰められます。
　　図示しますと、

　　1111 1111 0000 0000　　・・・・　0XFF00
　　-----------------------------
　　　　　　 1111 1111　　・・・・　右の８ビット( 0000 0000)が除かれる
　0000 0000　　　　　　　・・・・　左に８ビット0が詰められる
　　-----------------------------
　　0000 0000 1111 1111　　・・・・　結局、0X00FF となる。

Ｑ：マスクやビットシフトはどのようなことに応用されますか。

Ａ：例で示しましょう。

　　例題：構造体の中に「年月日」を示す16ビットのビットフィールド
　　　　　が入っているものとします。
　　　　　Borland C++ Ver3.0 の　ffblk.ff_fdate　を例にとっています。　　
　　
　　　　ffblk.ff_fdate のビットフィールド・・・日：ビット 0-4
　　　　　　　　　　　　　　　　　　　　　　　　月：ビット 5-8
　　　　　　　　　　　　　　　　　　　　　　　　年：ビット 9-15
　　　　図示すると、

　　 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0　　
　|------- 年 --------------|---- 月 -----|---- 日 -------|

　　　　となります。

　　　ここで、年(1980年以降の年数)をy、月(1-12)をm、日(1-31)をd、としましょう。

　　　年を得るのは簡単ですね。ffblk.ff_fdate を９ビット右へシフトすればよい。　　
　　　　(「月日」の桁を削除し、残った「年」を右へ桁下げすると考えると分かり易い）
　　　　　結局
　　　　　　y = ffblk.ff_fdate >> 9;

　　　日を得るのはどうですか。ffblk.ff_fdate の左側11ビットをマスクすればよい。　　
0000 0000 0001 1111　は　0X001F　です。
　　　　　結局、
　　　　　　d = ffblk.ff_fdate & 0X001F;

　　　月を得るのは少々手強いです。月を得るのは、マスクとビットシフトの応用問題です。
　　　　　　まず、５ビット右へシフトさせて、日の５ビットを捨てましょう。
　　　　　　すると　00000年月　が　イメージとしてのビットフィールドになります。
　　　　　　次に、月(下位４ビット)だけ残すために、上位12ビットをマスクして隠します。
　　　　　　マスクするのは上位12ビットですから、
　　　　　　0000 0000 0000 1111　との AND をとればよい。（ 0X000F との　AND をとる。）
　　　　　　結局、
　　　　　　 m = ( ffblk.ff_fdate >> 5 ) & 0X000F
　　　　　　

　　　分かりましたか。初級者には、ビット操作は無理かもしれません。しかし、Ｃ言語の魅
　　　力の一つはこういったビット単位の操作が可能なことにあるのです。

Ｑ：最も簡単なプログラムを一つあげてＣのプログラムを説明して下さい。

Ａ：どの入門書でも、"Hello World" と表示するだけのものから始まります。

　　①最も簡単なプログラムは、以下のような５行のプログラムです。

　　　=====================================================
　　　#include "stdio.h"
　void main(void)
　　{
　　　　printf("\n Hello World \n");
　　}
　　　=====================================================

　　・Ｃプログラムは関数の集まりのような形をしています。
　　・　#include　は、プリプロセッサにヘッダファイル(stdio.h)を取り込ませる命令です。
　　　　　　stdio.h　は基本的な inputとoutputのきまりを指定したファイルです。
　　　　　　stdio.hの両端を右のようにくくります。＜stdio.h＞　もしくは　"stdio.h"
　　　　　　--------------------------------------------------------------------
　　　　　　注意： "＜" と "＞" は半角です！！　ここでは全角になっていますが、こ
　　　　　　　　　うしないと　netscape navigator はタグ(tag)と受け取り、画面に表
　　　　　　　　　示されなくなるからです。
　　　　　　--------------------------------------------------------------------
　　　　　　どのプログラムにもstdio.hは必要です。
　　　　　　プリプロセッサ制御命令にはセミコロン(;)はつけません。
　　　main()が必要です。中身は｛と｝の間に書きます。
　　　printf()は画面に表示する命令です。表示の中身は "Hello World" です。
　　　　"\n" は改行を意味します。
　　　　ですから、"\n Hello World \n" は、まず改行し、"Hello World" を表示し、改行する
　　　　ことを意味します。文の最後にセミコロン(;)をつけます。

　　②次は、画面消去後 "Hello World" と表示させます。

　　　=====================================================
　　　#include "stdio.h"
　void main(void)
　　{
　　　　　 printf("\x01b[2J");
　　　　printf("Hello World \n");
　　}
　　　=====================================================

　　　　printf("\x01b[2J") は画面消去命令です。\x01b はエスケープコードです。
　　　　　また、例えば画面を青くしたければ、
　　　　　　printf("\x01b[34m");
　　　　　とします。これはＤＯＳに対する命令の仕組みですので、こういう場合はこう命令
　　　　　するのだと覚えるのがＣ言語上達の近道です。
　　　　"Hello World \n" と、"Hello World" の前に \n がないのは、画面を消去したの
　　　　　で、改行する必要がないからです。

Ｑ：ポインタが分からなくてＣ言語から落ちこぼれる人が多いと聞きますが。

Ａ：そうらしいですね。
　ポインタは変数や関数のアドレスをもつ変数です。

　ポインタと配列との関係
　pがポインタ変数で、その内容が　"HELLO"であるとすると、以下のようになります。

p == "HELLO"
*p == p[0] == "H"
*(p+1) == p[1] == "E"
*(p+2) == p[2] == "L"
*(p+3) == p[3] == "L"
*(p+4) == p[4] == "O"

　文字列へのポインタの例を示します。
　　void string(*st)
　　{
　　int i = 0;
　　int count = 0;
　　char *str;

　　　 str = st; /*文字列の代入（アドレスを一致させる）*/

　　while( str[i] != '\0' ) {
　 printf( "str[%d] = %c\n", i, str[i] );
　 /*１文字ずつプリントする*/
　 i++;
　 count++;
　 }
　printf( "Number of Characters = %d \n", count );
　 /*文字数をプリントする*/
　　 }

同じカテゴリー（2024年）の記事画像

同じカテゴリー（2024年）の記事

12月17日　半田ごての購入
11月9日　　Sharp ラジオ&MD/CDプレーヤーの分解
MLB大谷選手の50-50の歴史的瞬間を見るのに数学の授業をサボル！
9月22日おもちゃの修理
8月17日　アマチュア無線の無線局免許状(再免許　1アマ)が届きました
8月15日　　読書です

Posted by トシちゃん先生の海釣り at 20:16│Comments(0) │2024年│パソコン

名前:
メール:
URL:
情報を記憶:
コメント:
	＜ご注意＞書き込まれた内容は公開され、ブログの持ち主だけが削除できます。確認せずに書込

このページの上へ▲