Linux是一种开源电脑
操作系统内核。它是一个用
C语言写成,符合
POSIX标准的类Unix
操作系统。
内核结构
操作系统是一个用来和硬件打交道并为
用户程序提供一个有限服务集的低级
支撑软件。一个
计算机系统是一个硬件和软件的
共生体,它们互相依赖,不可分割。计算机的硬件,含有外围设备、处理器、内存、硬盘和其他的
电子设备组成计算机的发动机。但是没有软件来操作和控制它,自身是不能工作的。完成这个
控制工作的软件就称为操作系统,在Linux的术语中被称为“内核”,也可以称为“核心”。Linux内核的主要模块(或组件)分以下几个部分:
存储管理、
CPU和
进程管理、文件系统、
设备管理和驱动、
网络通信,以及系统的初始化(引导)、
系统调用等。
版本号
Linux内核使用三种不同的版本编号方式。
第一种方式用于1.0版本之前(包括1.0)。第一个版本是0.01,紧接着是0.02、0.03、0.10、0.11、0.12、0.95、0.96、0.97、0.98、0.99和之后的1.0。
第二种方式用于1.0之后到2.6,数字由三部分“A.B.C”,A代表主版本号,B代表次版本号,C代表较小的末版本号。只有在内核发生很大变化时(历史上只发生过两次,1994年的1.0,1996年的2.0),A才变化。可以通过数字B来判断Linux是否稳定,偶数的B代表稳定版,奇数的B代表
开发版。C代表一些
bug修复,安全更新,新特性和驱动的次数。以版本2.4.0为例,2代表主版本号,4代表次版本号,0代表改动较小的末版本号。在版本号中,序号的第二位为偶数的版本表明这是一个可以使用的稳定版本,如2.2.5,而序号的第二位为奇数的版本一般有一些新的东西加入,是个不一定很稳定的
测试版本,如2.3.1。这样稳定版本来源于上一个测试版升级版本号,而一个稳定版本发展到完全成熟后就不再发展。
第三种方式从2004年2.6.0版本开始,使用一种“time-based”的方式。3.0版本之前,是一种“A.B.C.D”的格式。七年里,前两个数字A.B即“2.6”保持不变,C随着新版本的发布而增加,D代表一些bug修复,安全更新,添加新特性和驱动的次数。3.0版本之后是“A.B.C”格式,B随着新版本的发布而增加,C代表一些bug修复,安全更新,新特性和驱动的次数。第三种方式中不再使用偶数代表稳定版,奇数代表开发版这样的命名方式。举个例子:3.7.0代表的不是开发版,而是稳定版。
发展历史
Linux最早是由芬兰人Linus Torvalds设计的。当时由于UNⅨ的商业化,Andrew Tannebaum教授开发了
Minix操作系统以便于不受
AT&T许可协议的约束,为教学科研提供一个操作系统。当时发布在Internet上,免费给全世界的学生使用。Minix具有较多UNⅨ的特点,但与UNⅨ不完全兼容。1991年10月5日,Linus为了给Minix用户设计一个比较有效的UNⅨ PC版本,
自己动手写了一个“类Minix”的操作系统。整个故事从两个在终端上打印AAAA...和BBBB...的进程开始的,当时最初的
内核版本是0.02。Linus Torvalds将它发到了Minix
新闻组,很快就得到了反应。Linus Torvalds在这种简单的
任务切换机制上进行扩展,并在很多热心支持者的帮助下开发和推出了Linux的第一个稳定的工作版本。1991年11月,Linux0.10版本推出,0.11版本随后在1991年12月推出,当时将它发布在Internet上,免费供人们使用。当Linux非常接近于一种可靠的/稳定的系统时,Linus决定将0.13版本称为0.95版本。1994年3月,正式的Linux 1.0出现了,这差不多是一种正式的独立宣言。截至那时为止,它的用户基数已经发展得很大,而且Linux的核心开发队伍也建立起来了。
结构属性
在讨论大型而复杂的系统的
体系结构时,可以从很多角度来审视系统。体系
结构分析的一个目标是提供一种方法更好地理解源代码。
Linux 内核实现了很多重要的体系结构属性。在或高或低的层次上,内核被划分为多个子系统。Linux 也可以看作是一个整体,因为它会将所有这些基本服务都集成到内核中。这与
微内核的体系结构不同,后者会提供一些基本的服务,例如通信、
I/O、内存和
进程管理,更具体的服务都是插入到微内核层中的。
随着时间的流逝,Linux 内核在内存和 CPU 使用方面具有较高的效率,并且非常稳定。但是对于 Linux 来说,最为有趣的是在这种大小和复杂性的前提下,依然具有良好的
可移植性。Linux 编译后可在大量处理器和具有不同
体系结构约束和需求的平台上运行。一个例子是 Linux 可以在一个具有内存管理单元(MMU)的处理器上运行,也可以在那些不提供
MMU的处理器上运行。Linux 内核的
uClinux移植提供了对非 MMU 的支持。
开发规范
核心的开发和规范一直是由Linux
社区控制着,版本也是不重复的。实际上,操作系统的
内核版本指的是在Linus本人领导下的开发小组开发出的
系统内核的版本号。自1994年3月14日发布了第一个正式版本Linux 1.0以来,每隔一段时间就有新的版本或其修订版公布。
Linux将标准的
GNU许可协议改称
Copyleft,以便与Copyright相对照。通用的公共许可(GPL)允许用户销售、拷贝和改变具有Copyleft的
应用程序。当然这些程序也可以是Copyright的,但是你必须允许进一步的销售、拷贝和对其代码进行改变,同时也必须使他人可以免费得到修改后的源代码。事实证明,GPL对于Linux的成功起到了极大的作用。它启动了一个十分繁荣的商用Linux阶段,还为
编程人员提供了一种
凝聚力,诱使大家加入这个充满了慈善精神的Linux运动。
主要子系统
系统调用接口
SCI 层提供了某些机制执行从
用户空间到内核的
函数调用。正如前面讨论的一样,这个接口依赖于
体系结构,甚至在相同的处理器家族内也是如此。SCI 实际上是一个非常有用的函数调用
多路复用和多路分解服务。在 ./
linux/kernel 中您可以找到 SCI 的实现,并在 ./linux/arch 中找到依赖于体系结构的部分。
进程管理
进程管理的重点是进程的执行。在内核中,这些进程称为
线程,代表了单独的处理器虚拟化(线程代码、数据、
堆栈和 CPU
寄存器)。在
用户空间,通常使用进程 这个术语,不过 Linux 实现并没有区分这两个概念(进程和线程)。内核通过 SCI 提供了一个
应用程序编程接口(API)来创建一个新进程(
fork、exec 或 Portable Operating System Interface [POSⅨ] 函数),停止进程(kill、exit),并在它们之间进行通信和同步(signal 或者 POSⅨ 机制)。
进程管理还包括处理活动进程之间共享 CPU 的需求。内核实现了一种新型的
调度算法,不管有多少个线程在竞争 CPU,这种算法都可以在固定时间内进行操作。这种算法就称为 O⑴
调度程序,这个名字就表示它调度多个线程所使用的时间和调度一个线程所使用的时间是相同的。O⑴ 调度程序也可以支持
多处理器(称为
对称多处理器或 SMP)。您可以在 ./linux/kernel 中找到
进程管理的源代码,在 ./linux/arch 中可以找到依赖于
体系结构的源代码。
内存管理
内核所管理的另外一个重要资源是内存。为了提高效率,如果由
硬管理虚拟内存,内存是按照所谓的内存页 方式进行管理的(对于大部分
体系结构来说都是 4KB)。Linux 包括了管理可用内存的方式,以及物理和虚拟映射所使用的硬件机制。
不过内存管理要管理的可不止 4KB缓冲区。Linux 提供了对 4KB缓冲区的抽象,例如
slab 分配器。这种内存管理模式使用 4KB缓冲区为基数,然后从中
分配结构,并跟踪内存页使用情况,比如哪些内存页是满的,哪些页面没有完全使用,哪些页面为空。这样就允许该模式根据系统需要来动态调整内存使用。
为了支持多个用户使用内存,有时会出现可用内存被消耗光的情况。由于这个原因,页面可以移出内存并放入磁盘中。这个过程称为交换,因为页面会被从内存交换到硬盘上。内存管理的源代码可以在 ./
linux/mm 中找到。
虚拟文件系统
虚拟文件系统(VFS)是 Linux 内核中非常有用的一个方面,因为它为文件系统提供了一个通用的接口抽象。VFS 在 SCI 和内核所支持的文件系统之间提供了一个交换层。
VFS 在用户和文件系统之间提供了一个交换层
在 VFS 上面,是对诸如
open、
close、
read 和
write 之类的函数的一个通用 API 抽象。在 VFS 下面是文件系统抽象,它定义了上层函数的实现方式。它们是给定文件系统(超过 50 个)的插件。文件系统的源代码可以在 ./
linux/fs 中找到。
文件系统层之下是缓冲区缓存,它为文件系统层提供了一个通用函数集(与具体文件系统无关)。这个缓存层通过将数据保留一段时间(或者随即预先读取数据以便在需要是就可用)优化了对
物理设备的访问。缓冲区缓存之下是设备驱动程序,它实现了特定物理设备的接口。
特性
可移植性
尽管Linus Torvalds的初衷不是使
Linux成为一个可移植的操作系统,今天的Linux却是全球被最广泛移植的操作系统
内核。从掌上电脑
iPad到巨型电脑
IBM S/390,甚至于
微软出品的游戏机
XBOX都可以看到Linux内核的踪迹。Linux也是IBM
超级计算机Blue Gene的操作系统。
Linux可以在以下结构上运行:
Acorn:Archimedes,A5000和RiscPC系列
英特尔80386及之后的兼容产品:80386,80486和整个奔腾系列;AMD
Athlon,Duron,Thunderbird;
Cyrix系列。对英特尔8086,8088,80186,80188和80280芯片的支持正在开发中。
Mips
摩托罗拉68020及以上: 新的Amigas,一些
苹果电脑 网络支持
作为一个生产操作系统和
开源软件,Linux 是测试新协议及其增强的良好平台。Linux 支持大量
网络协议,包括典型的
TCP/IP,以及高速网络的扩展(大于 1
Gigabit Ethernet [GbE] 和 10 GbE)。Linux 也可以支持诸如
流控制传输协议(SCTP)之类的协议,它提供了很多比 TCP 更高级的特性(是传输层协议的接替者)。
动态内核
Linux 还是一个动态内核,支持动态添加或删除
软件组件。被称为动态可加载
内核模块,它们可以在引导时根据需要(当前特定设备需要这个模块)或在任何时候由用户插入。
系统管理程序
Linux 最新的一个增强是可以用作其他操作系统的操作系统(称为系统
管理程序)。该系统对内核进行了修改,称为基于内核的
虚拟机(
KVM)。这个修改为
用户空间启用了一个新的接口,它可以允许其他操作系统在启用了 KVM 的内核之上运行。除了运行 Linux 的其他实例之外, Microsoft ® Windows ® 也可以进行虚拟化。惟一的限制是底层处理器必须支持新的虚拟化指令
组成
进程管理(process management)、 1
中断管理(interrupt management)、 3
内存管理(memory management)、 4
模块管理(module management)、 5
进程间通信(inter-process communication)、9
网络管理(network management)、 10
系统启动(system init)等操作系统功能的实现。11
发行版
Linux内核的发展过程中,我们还不得不提一下各种Linux发行版的作用,因为正是它们推动了Linux的应用,从而也让更多的人开始关注Linux。一些组织或厂家,将Linux系统的内核与外围
实用程序(Utilities)软件和文档包装起来,并提供一些
系统安装界面和系统配置、设定与
管理工具,就构成了一种发行版本(distribution),Linux的发行版本其实就是Linux核心再加上外围的实用程序组成的一个大
软件包而已。相对于Linux操作系统内核版本,发行版本的
版本号随发布者的不同而不同,与Linux系统内核的版本号是相对独立的。因此把
SUSE、
RedHat、
Ubuntu、
Slackware等直接说成是Linux是不确切的,它们是Linux的发行版本,更确切地说,应该叫做“以Linux为核心的操作系统软件包”。根据GPL准则,这些发行版本虽然都源自一个内核,并且都有自己各自的贡献,但都没有自己的版权。Linux的各个发行版本(distribution),都是使用Linus主导开发并发布的同一个Linux内核,因此在
内核层不存在什么
兼容性问题。每个版本都不一样的感觉,只是在发行版本的最外层才有所体现,而绝不是Linux本身特别是内核不统一或是不兼容。
90年代初期Linux开始出现的时候,仅仅是以
源代码形式出现,用户需要在其他操作系统下进行编译才能使用。后来出现了一些正式版本。最流行的几个正式版本有:SUSE、RedHat、
Fedora、
Debian、Ubuntu、
CentOS、
Gentoo,等等。用户可根据自己的经验和喜好选用合适的Linux发行版。
原先Linus Torvalds将Linux置于一个禁止任何商业行为的条例之下,但之后改用
GNU通用公共许可证第二版。该协议允许任何人对软件进行修改或发行,包括商业行为,只要其遵守该协议,所有基于Linux的软件也必须以该协议的形式发表,并提供源代码。
Linus Torvalds曾经公开声称将Linux置于
GNU通用公共许可证之下是他一生中所做的“最好的决定”。
常量定义
初始定义
宏phys定义了你的机器上的
地址转换__virt_to_phys。这个宏用于把虚拟地址转换为一个
物理地址。通常情况下:
phys = virt - PAGE_OFFSET PHYS_OFFSET
解压缩符号
解压缩器的地址。由于当你调用解压缩器代码时,通常关闭MMU,因此这里并不讨论
虚拟地址和物理地址的问题。通常你在这个地址处调用内核,开始引导内核。它不需要在
RAM中,只需要位于FLASH或其他只读或读/写的可寻址的
存储设备中。
l ZBSSADDR
解压缩器的初始化为0的工作区的起始地址。必须位于RAM中,解压缩器会替你把它初始化为0,此外,需要关闭MMU。
l ZRELADDR
解压缩内核将被写入的地址和最终的执行地址,必须满足:
__virt_to_phys(TEXTADDR) == ZRELADDR
内核的开始部分被编码为与位置无关的代码。
l INITRD_PHYS
放置初始RAM盘的
物理地址。仅当你使用bootpImage时相关(这是一种非常老的param_struct结构)
l INITRD_ⅥRT
初始RAM盘的虚拟地址。必须满足:
__virt_to_phys(INITRD_ⅥRT) == INITRD_PHYS
l PARAMS_PHYS
param_struct
结构体或tag lis的物理地址,用于给定内核执行环境下的不同参数。
内核符号
RAM第一个BANK的物理地址地址。
l PAGE_OFFSET
RAM第一个BANK的虚拟地址地址。在内核引导阶段,虚拟地址PAGE_OFFSE将被映射为物理地址PHYS_OFFSET,它应该与TASK_SIZE具有相同的值。
l TASK_SIZE
一个
用户进程的
最大值,单位为
byte。
用户空间的
堆栈从这个地址处向下增长。
任何一个低于TASK_SIZE的虚拟地址对用户进程来说都是不可见的,因此,内核通过进程偏移对每个进行进行动态的管理。我把这叫做用户段。任何高于TASK_SIZE的对所有进程都是相同的,称之为内核段。(换句话说,你不能把IO映射放在低于TASK_SIZE和PAGE_OFFSET的位置处。)
l TEXTADDR
内核的虚拟起始地址,通常为PAGE_OFFSET 0x8000。内核映射必须在此结束。
l DATAADDR
内核
数据段的虚拟地址,不能在使用解压缩器的情况
下定义。
l VMALLOC_START
l VMALLOC_END
用于限制
vmalloc区域的虚拟地址。此地址必须位于内核段。通常,vmalloc区域在最后的虚拟RAM地址以上开始VMALLOC_OFFSET字节。
l VMALLOC_OFFSET
Offset normally incorporated into VMALLOC_START to provide a hole between virtual RAM and the vmalloc area. We do this to allow
out of bounds memory accesses (eg,something writing off the end of the mapped memory map) to be caught. Normally set to 8MB.
构架宏
pram——指定了RAM起始的物理地址,必须始终存在,并应等于PHYS_OFFSET。
pio——是供arch/arm/kernel/debug-armv.S中的调试宏使用的,包含IO的8 MB区域的物理地址。
vio——是8MB调试区域的虚拟地址。
这个调试区域将被位于代码中(通过MAPIO函数)的随后的构架相关代码再次进行初始化。
l BOOT_PARAMS
参见 PARAMS_PHYS.
l FⅨUP(func)
l MAPIO(func)
机器相关的函数,用于IO区域的映射(包括上面的调试区)。
l INITIRQ(func)
用于初始化中断的机器相关的函数。
相关新闻
2023年1月,Linux Kernel 4.9收到4.9.337更新,并在kernel
.org上被标记为EOL,这意味着该版本系统将正式终止支持,不再收到任何维护和安全更新。
2023年1月9日消息,Linus Torvalds 提前数小时推出了 Linux Kernel 6.2 的第 3 个候选版本更新。
2023年1月13日消息,
Linux Kernel 6.0 已经终止支持。Linux 6.0 在官网上已经标记为 EOL(End of Life),这意味着官方团队不再继续维护该
内核版本。