syscalls - Linux
のシステムコール
Linux のシステムコール。
システムコールは、アプリケーションと
Linux カーネルとの間の
基本的なインタフェースである。
システムコールとライブラリのラッパー関数¶
システムコールは一般には直接起動されず、
glibc
(や他の何らかのライブラリ)
経由で起動される。
システムコールの直接起動については、詳細は
intro(2) を参照のこと。
いつもという訳ではないが、普通は、ラッパー関数の名前はその関数が起動する
システムコールの名前と同じである。
例えば、glibc には
truncate()
という関数があり、この関数は
"truncate"
システムコールを起動する。
たいていの場合、glibc
のラッパー関数はかなり簡単なもので、
システムコールを起動する前に引き数を適切なレジスタにコピーし、
システムコールが返った後は
errno
を適切に設定する以外は、ほとんど処理を行わない
(これらは、ラッパー関数が提供されていない場合に
システムコールを起動するのに使用する
syscall(2)
により実行される処理と同じである)。
[注意]
システムコールは失敗を示すのに負のエラー番号を呼び出し元に返す。
失敗が起こった際には、ラッパー関数は返されたエラー番号を反転して
(正の値に変換し)、それを
errno
にコピーし、ラッパー関数の呼び出し元に
-1 を返す。
しかしながら、時には、ラッパー関数がシステムコールを起動する前に
何らかの追加の処理を行う場合がある。
例えば、現在、
二つの関連するシステムコール
truncate(2) と
truncate64(2)
があり、glibc
のラッパー関数
truncate()
は、カーネルがこれらのシステムコールのうちどちらを提供しているかをチェックし、
どちらを採用するかを決定する。
システムコールのリスト¶
以下は Linux
のシステムコールのリストである。
このリストで、
Kernel
の列は、Linux 2.2
以降で登場したシステムコールが
登場したカーネルバージョンを示す。
以下に詳細な説明を記す。
- *
- カーネルバージョンがない場合、そのシステムコールは
カーネル 1.0
もしくはそれ以前に登場した。
- *
- システムコールに
"1.2"
と書かれている場合、
そのシステムコールがおそらくバージョン
1.1.x
のカーネルで登場し、
安定版のカーネルでは
1.2
で初めて登場したことを意味する。
(バージョン 1.2
のカーネルは、カーネル
1.0.6 から分岐し、
バージョン 1.1.x
の不安定版のカーネル系列として開発された。)
- *
- システムコールに
"2.0"
と書かれている場合、
そのシステムコールがおそらくバージョン
1.3.x
のカーネルで登場し、
安定版のカーネルでは
2.0
で初めて登場したことを意味する。
(バージョン 2.0
のカーネルは、バージョン
1.2.10 あたりのカーネル
1.2.x
から分岐し、バージョン
1.3.x
の不安定版のカーネル系列として開発された。)
- *
- システムコールに
"2.2"
と書かれている場合、
そのシステムコールがおそらくバージョン
2.1.x
のカーネルで登場し、
安定版のカーネルでは
2.2.0
で初めて登場したことを意味する。
(バージョン 2.2
のカーネルは、カーネル
2.0.21 から分岐し、
バージョン 2.1.x
の不安定版のカーネル系列として開発された。)
- *
- システムコールに
"2.4"
と書かれている場合、
そのシステムコールがおそらくバージョン
2.3.x
のカーネルで登場し、
安定版のカーネルでは
2.4.0
で初めて登場したことを意味する。
(バージョン 2.4
のカーネルは、カーネル
2.2.8 から分岐し、
バージョン 2.3.x
の不安定版のカーネル系列として開発された。)
- *
- システムコールに
"2.6"
と書かれている場合、
そのシステムコールがおそらくバージョン
2.5.x
のカーネルで登場し、
安定版のカーネルでは
2.6.0
で初めて登場したことを意味する。
(バージョン 2.6
のカーネルは、カーネル
2.4.15 から分岐し、
バージョン 2.5.x
の不安定版のカーネル系列として開発された。)
- *
- カーネル 2.6.0
から開発モデルは変更され、新しいシステムコールが
個々の 2.6.x
のリリースでも登場するようになった。
その場合、このリストでは、システムコールが登場した
厳密なバージョン番号が記載されている。この慣習は、カーネル
2.6.39 の
後継となるバージョン
3.x
系列のカーネルでも継続されている。
- *
- 前の安定版カーネル系列から分岐した後に安定版カーネル系列にシステムコール
が追加された場合、以前の安定版カーネル系列にそのシステムコールが
移植 (backport)
されることがある。
例えば、2.6.x
で登場したシステムコールのいくつかは、
2.4.15 以降の 2.4.x
リリースにも backport
された。
この場合、システムコールが登場したバージョンとして、
両方の安定版系列のバージョンが記載されている。
カーネル 3.14
で利用可能なシステムコールのリストを以下に示す
(それ以前のカーネルでだけ利用可能なものも少数だが含まれる):
x86-32
を含む多くのプラットフォームでは、ソケット関連のシステムコールは
(glibc
のラッパー関数を介してだが)
すべて
socketcall(2)
経由に多重されている。
同様に、System V IPC
関連のシステムコールは
ipc(2)
経由に多重されている。
以下のシステムコールは、システムコールテーブルにスロットが予約されているが、
標準のカーネルには実装されていない:
afs_syscall(2),
break(2),
ftime(2),
getpmsg(2),
gtty(2),
idle(2),
lock(2),
madvise1(2),
mpx(2),
phys(2),
prof(2),
profil(2),
putpmsg(2),
security(2),
stty(2),
tuxcall(2),
ulimit(2),
vserver(2) (
unimplemented(2)
も参照)。 しかし、
ftime(3),
profil(3),
ulimit(3)
はライブラリルーチンとして
実装されている。
phys(2) 用の場所は 2.1.116
以降では
umount(2) 用に
使用されている;
将来においても
phys(2)
は実装されない。
getpmsg(2) と
putpmsg(2) は STREAMS
対応のパッチが適用された
カーネル用であり、標準のカーネルに登場することはないかもしれない。
set_zone_reclaim(2)
は少しの間だけ存在した。
Linux 2.6.13 で追加され、2.6.16
で削除された。このシステムコールがユーザ空間から使える状態になったことはない。
たいていは、
/usr/include/asm/unistd.h
で定義されている番号
__NR_xxx
のシステムコールのコードは、
Linux カーネルソースの
sys_xxx()
というルーチンに書かれている
(i386
における実行テーブルは
/usr/src/linux/arch/i386/kernel/entry.S
に書かれている)。
しかしこれには多くの例外がある。古いシステムコールは新版に置き換えられて
きたが、この置き換えはあまり体系立てて行われて来なかったからである。
parisc, sparc, sparc64, alpha
といったプロプリエタリなオペレーティングシステムのエミュレーション機能があるプラットフォームでは、多くの追加システムコールがある。
mips64 には、32
ビットシステムコールのフルセットも含まれている。
時間の経過とともに、いくつかのシステムコールではインタフェースの
変更が必要になってきた。
こうした変更の理由の一つは、システムコールに渡される構造体やスカラー値
のサイズを増やす必要があることだった。
これらの変更の結果、現在では、同様の処理を実行するが
引き数のサイズなどの詳細は異なる、一連のシステムコール群が
いくつか存在する
(例えば、
truncate(2) と
truncate64(2))。
(すでに述べたように、
一般にはアプリケーションがこのことを意識することはない。
glibc
のラッパー関数が、適切なシステムコールを起動し、古いバイナリに
対して ABI
レベルでの互換性を保持することを保証する処理を行っている。)
複数のバージョンが存在するシステムコールの例を以下に挙げる。
- *
- これまでに、 stat(2)
には 3
種類の異なるバージョンが存在する。
sys_stat() (スロットは
__NR_oldstat)、 sys_newstat()
(スロットは __NR_stat)、
sys_stat64() (カーネル 2.4
で導入; スロットは
__NR_stat64)。
3つのうち最後のものが最新である。
lstat(2) と fstat(2)
についても同様である。
- *
- また、 __NR_oldolduname, __NR_olduname,
__NR_uname
という定義は、それぞれ
sys_olduname(), sys_uname(), sys_newuname()
というルーチンを参照している。
- *
- Linux 2.0 では、 vm86(2)
の新バージョンが登場した。カーネルルーチンの
古いバージョン、新しいバージョンはそれぞれ
sys_vm86old(), sys_vm86()
という名前である。
- *
- Linux 2.4 では、 getrlimit(2)
の新バージョンが登場した。カーネルルーチンの
古いバージョン、新しいバージョンはそれぞれ
sys_old_getrlimit() (スロットは
__NR_getrlimit), sys_getrlimit()
(スロットは __NR_ugetrlimit)
という名前である。
- *
- Linux 2.4 で、ユーザ ID
とグループ ID
のサイズが 16
ビットから 32
ビットに増えた。
この変更に対応するため、いくつかのシステムコールが追加された
( chown32(2), getuid32(2), getgroups32(2),
setresuid32(2) など)。
これらのシステムコールが、末尾の
"32"
が付かない同名の
古いバージョンに代わって使われるようになった。
- *
- Linux 2.4 では、32
ビットアーキテクチャ上のアプリケーションが
大きなファイル
(つまり、32
ビットでは表現できないサイズや
ファイルオフセットが必要なファイル)
にアクセスできるようになった。
この変更に対応するため、ファイルオフセットとサイズを扱う
システムコールの置き換えが必要となった。その結果、
fcntl64(2), ftruncate64(2), getdents64(2),
stat64(2), statfs64(2)
と、ファイルディスクリプタやシンボリックリンクで同じ機能を持つ
システムコールが追加された。
これらのシステムコールが、末尾の
"64"
が付かない同名の
古いバージョンに代わって使われるようになった。
但し、"stat"
系のシステムコールはその限りではない。
64-bit
ファイルアクセスと
32-bit UID のみを持つ
新しいプラットフォーム
(alpha, ia64, s390x など) では、 *64
や *32
という名前のシステムコールはない。
*64 や *32
というシステムコールが存在する場合、
*64 や *32
がついていないシステムコールは廃止扱いである。
- *
- リアルタイムシグナル
( signal(7) 参照)
への対応を追加するために、
rt_sig*
系のシステムコールがカーネル
2.2 で追加された。
これらのシステムコールが、先頭に
"rt_"
が付かない同名の
古いバージョンに代わって使われるようになった。
- *
- select(2) と mmap(2) は
5つもしくはそれ以上の引き数を使用しており、
i386
では引き数の受け渡しに問題が生じる。
そのため、他のアーキテクチャでは
__NR_select と __NR_mmap
に対応する sys_select() と
sys_mmap()
が存在するが、i386
では代わりに old_select()
と old_mmap()
というルーチンがある
(これらのルーチンは引き数ブロックへのポインタを使用する)。
現在では
5つの引き数を渡すことはもはや問題ではなくなっており、
__NR__newselect は sys_select()
に直接対応するようになっている。
__NR_mmap2
についても同様である。
関連項目¶
intro(2),
syscall(2),
unimplemented(2),
libc(7),
vdso(7)
この文書について¶
この man ページは Linux
man-pages
プロジェクトのリリース
3.65 の一部
である。プロジェクトの説明とバグ報告に関する情報は
http://www.kernel.org/doc/man-pages/
に書かれている。