Linux Windows 初心者向け

【初心者向け】C言語の基本的な文法(後編)

C言語の基本的な文法をざっくり紹介します。

極力さらっと読める感じにしていますが、たまにマニアックな話題(中・上級者向けのネタ)に触れています。

後編では⑬標準入出力とエスケープシーケンス、⑭文字列操作、⑮ファイルI/O、⑯ビット演算、⑰コマンドライン引数、⑱ファイル分割、⑱読みやすいプログラム(可読性向上)、⑳その他を説明します。

環境

Windows10 Home(64bit)1903

VMware Player 15上で動くUbuntu18.04

この記事で解決できること

  • C言語の基本的な文法を知ることが出来る。

関連記事

【初心者向け】C言語の基本的な文法(前編)

【初心者向け】C言語の基本的な文法(中編)

【初心者向け】C言語の基本的な文法(後編)

⑬標準入出力とエスケープシーケンス、⑭文字列操作、⑮ファイルI/O、⑯ビット演算、⑰コマンドライン引数、⑱読みやすいプログラム(可読性向上)

⑬標準入出力とエスケープシーケンス

標準入出力

標準入出力は、標準入力(stdin)というキーボードからの文字入力と、標準出力(stdout)という画面への文字表示のことです。

<stdio.h>をインクルードすることで使えるようになります。

※標準エラー出力(stderr)は今回割愛します。

 

標準出力に文字を出すにはprintf()を使えばよいです。前編・中編でよく登場するので説明は割愛しあます。

では標準入力はどうすれば良いのでしょうか?いろいろありますがfgets()を使うことをお勧めします。※gets(), scanf()などは推奨しません。

 

解説します。

5行目:32バイトの文字列を保存するバッファを確保します。

6行目:stdin(標準入力)からfgetsで文字列を32文字取り込みます。正確には31文字+\0(終端)が読み込まれます。fgetsをstdinを指定して呼び出すとキーボード入力待ちになりますので文字を入力してください。

7行目:バッファをprintfで表示します。

これを実行すると、こうなります。

 command
$ gcc -g -o test test.c
$./test
(キーボード入力待ちになります)
1111111111222222222233333333334444444444 (あえて40文字入力します)
1111111111222222222233333333334 (31文字表示されました)

 

gets()、scanf()という関数でも標準入力を取り込むことができますが推奨されていません。理由はバッファオーバフローを考慮しない(できない)ためです。例えば、文字を入力するために10バイトの領域を確保してgets()、scanf()を呼び出し、11文字以上入力するといくらでも読み込もうとするので大変危険です。この脆弱性を悪用して大量の文字を入力させると最悪の場合システムが落ちてしまうでしょう。そのため入力文字数を指定できるfgetsをstdinで呼び出すのが安全です。

 

エスケープシーケンス

エスケープシーケンスとは特殊文字のことです。

printf()で文字列を表示するときに末尾に付けているオマジナイ\n(改行)もエスケープシーケンスの1つです。

エスケープシーケンス 意味
\a Bell(Beep音)
\b Backspace(バックスペース)
\f Formfeed(改ページ)
\n Newline(改行)
\r Return(復帰:先頭に戻る)
\t Tab(タブ)
\\ Backslash(バックスラッシュ、円マーク)
\' もしくは ’’ Single Quate(シングルクォート)
\” もしくは ”” Double Quate(ダブルクォート)
\0 Null(NULL文字)
\x[00-FF]

Hexadecimal representation(16進数表現)

例えば\x610x61。ASCIIコードの0x61は英小文字のa。

ASCIIコード表

赤字は制御文字のため印字できません。

printfのフォーマット(書式)

printfのfはフォーマット(書式)のf。何気なくつかっているprintf()の%d%sみたいなやつをフォーマット指定子といいます。

指定子 説明
%c char 1文字出力 "%c"
%s char* 文字列出力 "%s"
%d short, int 符号あり整数を10進出力 "%d"
%ld
long 符号あり長整数を10進出力 "%ld"
%o short, int, unsigned short, unsigned int 整数を8進出力 "%03o"
%x short, int , unsigned short, unsigned int 整数を16進出力 "%04x"
%f float 短精度実数を出力 "%4.2f
%e float 短精度実数を指数表示で出力 "%4.2e"
%g float 短精度実数を最適な表示で出力 "%g"
%u unsigned short, unsigned int 符号なし整数を10進出力 "%ld"
%lu unsigned long 符号なし長整数を10進出力 "%lu"
%lo long, unsingned long 長整数を8進出力 "%lo"
%lx long, unsigned long 長整数を16進出力 "%lx"
%lf double 倍精度実数を出力 "%lf"

 

表示桁数の指定

実数の場合 <全体の幅>.<小数点以下の桁数> で指定する。

文字列の場合 .<小数点以下の桁数> で最大文字数を指定する。デフォルトは右詰め

出力
printf( "[%8.3f"], 12345.6789 ); [12345.67]
printf( "[%8.3e]", 12345.6789 ); [1.234e+4]
printf( "[%10s]", "ABCDEFG" ); [   ABCDEFG]
printf( "[%.3s]", "ABCDEFG" ); [ABC]

 

ゼロ詰め

数値の場合、桁数指定の前に0を付加するとゼロ詰めを指定できる。

出力
printf( "[%05d"], 1 ); 00001

 

右詰め左詰め

デフォルトは右詰め。桁数指定の前に-(マイナス)を付加すると左詰めを指定できる。

出力
printf( "[%-5d"], 1 ); [1    ]

 

符号の指定

デフォルトは正の数に+符号が付かない。桁数指定の前に+(プラス)を付けることで符号をONにできる。

出力
printf( "[%+5d"], +123 ); [ +123]
printf( "[%+5d"], -123 ); [ -123]

 

⑭文字列操作

文字列とはchar型の配列に複数の文字を並べたものです。

文字列を操作するための便利関数が<string.h>に定義されています。

コピー

文字列コピーは strcpy( Dst, Src ); という構文です。

SrcサイズよりDstサイズが小さい場合、Dstの後ろの領域を破壊するので推奨しません。次に挙げるstrncpyを使いましょう。

 

解説します。

2行目:<string.h>をインクルードしました。これでstrcpy()が使えます。

6行目:コピー元(src)の文字列を定義(実体確保)。

7行目:コピー先(dst)のバッファを確保。

8行目:コピー元(src)をコピー先(dst)にstrcpy()でコピー。

9行目:コピー先(dst)をprintf()で表示。

文字列コピー(文字数指定)は strncpy( Dst, Src, 文字数 ); という構文です。コピーする文字数を指定するで安全です。

 

解説します。

8行目:コピー元(src)をコピー先(dst)にstrcnpy()で”ABCDE”+”\0”の合計6文字分コピー。

※他はstrcpy()と全く同じなので説明しません。

”\0”をコピーするのが重要です。

コピー先(dst)が0に初期化されていれば良いのですが、未初期化だとスタックメモリはたいてい不定値(ゴミ)が入ってます。

良い例:コピー元(src)の末尾が\0(終端)になってるので、6文字コピーするとコピー先(dst)の末尾に\0(終端)が付くのでprintf()で”ABCDE"と表示させることが可能。

悪い例:コピー元(src)の末尾\0(終端)になってるが、5文字しかコピーしないとコピー先(dst)の末尾に\0(終端)が付かないのでprintf()で表示すると”ABCDE・・・・・みたいに不定値エリアも表示しようとして文字化けする(奇跡的に"\0"が見つかればそこでSTOPするが期待できない)。

比較

文字列比較は strcmp( 文字列1, 文字列2 ); という構文です。

strcmpは文字列の大小(ASCIIコードの大きい方が大)で以下の戻り値を返します。

 

文字列1 > 文字列2 正の数

文字列1 < 文字列2 負の数

文字列1 = 文字列2 0(ゼロ)

 

解説します。

2行目:<string.h>をインクルードしました。これでstrcmp()が使えます。

3行目:文字列1(str1)に”ABCDE”を設定。

4行目:文字列2(str2)に”AAAAA”を設定。

5行目:文字列1”ABCDE”と文字列2”AAAAA”をstrcmp()で比較。文字列1の2文字目:B(0x42)、文字列2の2文字目:A(0x41)をASCIIコードで比較してB>Aになるので正の数が返ります。

文字列比較(文字数指定)は strncmp( 文字列1, 文字列2, 文字数 ); という構文です。

先頭から3文字だけ比較したい、みたいな用途で使えます。

 

連結

文字列連結は strcat( Dst, Src ); という構文です。

 

解説します。

2行目:<string.h>をインクルードしました。これでstrcat()が使えます。

3行目:文字列1(str1)に”ABC\0"を設定。

4行目:文字列2(str2)に”DEF\0"を設定。

5行目:連結文字列(dst)を定義。

6行目:連結文字列(dst)に文字列1(src1)を4文字分コピー。※”\0”を含む。

7行目:連結文字列(dst)に文字列2(src2)を連結。

以下のプログラムを実行すると”ABC””DEF”が連結されて”ABCDEF”という文字列が表示されます。

図にするとこんな感じ。

⑮ファイルI/O

例えばC言語のプログラムを記述している「test.c」をファイルと呼びます。

ファイルI/O(読み書き)は以下の手順で処理します。

ファイル読み出し

「test.c」を1行ずつ読み込んでprintf()するプログラムを書きました。

 

解説します。

1行目:<stdio.h>をインクルード。ファイルI/Oが使えるようになります。

6行目:ファイルポインタ(FILE *fp)を定義。

9行目:ファイル”./test.c”を読み出し専用モード”r”でオープン。

10行目:ファイルポインタ(fp)がNULLの場合、オープン失敗なので12行目でエラーメッセージを出して13行目でmain関数から抜ける。

17行目:ファイルから文字列を読み出すためのバッファを作成。

18行目:fgets()で1行読み出し。EOF(ファイル終端)になるとNULLを返すので、そこまで1行読み出しが続く。

19行目:fgets()で1行読み出したデータをprintf()する。

23行目:ファイルをクローズする。

ファイル書き込み

「test.c」を1行ずつ読み込んで「test2.c」にfputs()するプログラムを書きました。

 

解説します。

17行目:ファイル”./test2.c”を書き込み専用モード”w”でオープン。

27行目:fgets()で1行読み出したデータをfputs()する。

※1つ前の例と重複する説明は割愛しました。

 

ファイルオープンのモード

モード 動作 ファイルがある ファイルがない
"r" 読み出し専用 正常 エラー(NULL)
”w” 書き込み専用 サイズ0のファイルで上書き 新規作成
”a” 追記専用 末尾に追記 新規作成
"r+" 読み書き 正常 エラー(NULL)
”w+” 書き読み サイズ0のファイルで上書き 新規作成
”a+” 読み込みと追記 末尾に追記 新規作成

 

バイナリモード

バイナリモード 動作
デフォルト

テキストモード

0x1a:EOF(ファイル終端)

0x0d:\r(復帰)

0x0a:\n(改行)

”b”

バイナリモード

0x1a, 0x0d, 0x0aをそのまま読み書きする。

※バイナリファイルの読み書きはfread()、fwrite()で行います。

⑯ビット演算

ビット演算は組込CPUマイコンとかアプリケーションプロセッサ)のレジスタ制御を行うときによく使います。

以下はシフト演算の例です。解説します。

5行目:unsigned int型の変数aを定義し0x00000001を代入。

6行目:4ビットシフトします。

7行目:変数aをHEX(16進)表示します。

要はこういうことですね。

コンパイル&実行の結果は以下の通りです。

 command
$ gcc -g -o test test.c
$./test
0x00000010

 

ビットフィールド

構造体の各メンバにビット幅を指定することで、ビット単位の変数を管理できます。

コンパイル&実行の結果は以下の通りです。

 command
$ gcc -g -o test test.c
$./test
01010101b

⑰コマンドライン引数

main関数の引数argcargvの使い方を説明します。

入力パラメタ数+1がargcに入り、入力パラメタの文字列がargvに入ります。

 

解説します。

5~8行目:argcが2より小さい場合、コマンド名以外のパラメタは入力されていないので”no parameter.”と表示して抜けます。

10~12行目argc数分だけループを回してargvを表示します。argv[ 0 ]はプログラム名が入りargv[ 1 ]以降が実際のパラメタになります。

コンパイル&実行の結果は以下の通りです。

 command
$ gcc -g -o test test.c
$./test
no parameter.
$./test 1
param[test12.exe]param[1]
$./test A B C
param[test12.exe]
param[A]
param[B]
param[C]

⑱読みやすいプログラム(可読性向上)

インデント

インデントとは字下げのことです。字下げをすることでプログラムの読みやすさが向上します。

まずはインデントが無いプログラムを見てみます。かなり読みにくいと思いますが、いかがでしょうか?

次にインデントが有るプログラムを見てみます。だいぶ見やすくなりました。

C言語では4文字の字下げが一般的。HTMLは2文字の字下げが良いと聞いたことがあります。

 

コメント

コーディングしながらコメントを入れておくことをオススメします。

プログラムをコーディングして1週間もすると何を書いたか忘れてしまうことが多いため、備忘録として残しておくと良いです。

例えばプログラムを他の人に引き継ぐときにコメントを入れておくとイチイチ説明しなくても、そこそこ伝わることもあるので。

 

まとめ

おわりです。そのうち応用編書きます。

関連記事

【初心者向け】C言語の基本的な文法(前編)

【初心者向け】C言語の基本的な文法(中編)

【初心者向け】C言語の基本的な文法(後編)

  • この記事を書いた人
  • 最新記事

ペイヴメント

ペイヴメントのエンジニア塾(当ブログ)では20年以上の経験から得られたプログラミング系ノウハウについてベテランにも満足して頂けるような内容の濃いコンテンツを初心者にも分かりやすい形で日々発信しています。【経歴】ベンチャーのソフトハウスで4年勤務後、精密機器メーカーのソフト開発部門に勤務し今に至ります。

-Linux, Windows, 初心者向け

Copyright© ペイヴメントのエンジニア塾 , 2020 All Rights Reserved.