Linux 和 Windows 的文件系统有些不同,在学习使用 Linux 之前,若能够了解这些不同,会有助于后续学习。
本文先对 Windows 和 Linux 上面文件系统原理、组织概念进行区分,并给出例子、列举两者的优缺点以具体说明,最后较为详细地介绍了 Linux 系统的目录结构。
Windows 和 Linux 文件系统下面将介绍启动 Windows 和 Linux 后,在文件系统的角度上,它们分别是怎样看待自己世界的。
访问原理在 Windows 系统中, 一切东西都是存放在硬盘上的。启动系统后,先确定硬盘,再确定硬盘上的分区以及每个分区所对应文件系统,最后是存放在某个分区特定的文件系统中的文件。 也就是说,Windows 是通过 “某个硬盘-硬盘上的某个分区-分区上的特定文件系统-特定文件系统中的文件” 这样的顺序来访问到一个文件的。
但是与 Windows 不同, Linux 系统中的一切都是存放在唯一的 虚拟文件系统中的,这个 虚拟文件系统是树状的结构以一个根目录开始。启动系统后,先有这个 虚拟文件系统,再识别出各个硬盘, 再把某个硬盘的某个分区挂载到这个 虚拟文件系统的某个子树上(即分区用某个子目录来表示),再确定分区对应的子目录文件系统,最后的文件就存放在这个特定的文件系统中。 也就是说, Linux 系统是通过 “虚拟文件系统-硬盘-硬盘上的分区-分区上的特定文件系统-特定文件系统中的文件” 这样的顺序来访问一个文件的。
可能对习惯了使用 Windows 的用户来说, Linux 的方式有些不适应,它的 虚拟文件系统,实质就是一颗目录树,最开始的目录叫做根目录,根目录中又有每一级子目录,或者文件,子目录又有子子目录和文件,其中每个子目录都特定的功能这个功能(这些是约定俗成了的,在后面 常用的重要目录 (See section 1.2.1) 中会详细说明)。
也许有人会问,没有这个虚拟文件系统就无法使用硬盘,可是最开始没有硬盘,那么这个 虚拟文件系统以及相应的组织结构是怎么存放起来的呢?这个问题,就像先有鸡还是先有蛋这个问题一样看似简单实则……但是,在 Linux 中,很轻易地跳出了这个思维循环,问题的答案并没在 虚拟文件系统 和 硬盘 这两者之间徘徊,而是第三者—— 内存 ,Linux 系统启动起来之后,整个 虚拟文件系统的组织结构,都是随着每次内核系统的启动自动在内存中建立好了的,根本就不需要硬盘。
另外还要注意,就是在我们用户的角度上,无论在 Windows 还是 Linux 上面,都是使用路径来访问一个文件的。表示文件的路径由 “文件所在的目录+各级目录的分隔符+文件” 三个部分组成,这个策略在两者之间是一样的,所不同的是,Windows 下面目录分隔符是 \ , Linux 下面是 / ,也许这也是两者之间为了表示其各自立场不同的一个原因吧?^_^
系统组织在 Windows 系统中,我们可以把文件大体分为两种: 系统文件和用户文件 。一般来说系统文件(例如 Windows 操作系统本身,一些系统程序,程序运行所需的库文件,以及一些系统配置文件等)存放的默认位置在 C 盘,当然也可以在安装时候指定在其他盘;其它用户文件,包含用户后来安装的程序以及一些数据文件等,用户可以把它们随意存放在任意的分区。
在 Linux 系统中,主要有两个概念: 虚拟文件系统中的文件和 Linux 操作系统内核 本身。逻辑上可以认为前者属于上层,后者在下层,前者基于后者,后者依赖前者而存在。 Linux 把除了它本身(Linux 操作系统内核)以外的一切事物都看作是在 虚拟文件系统中的文件了。无论是键盘,鼠标,数据,程序,CPU,内存,网卡……无论是硬件、软件、数据还是内存中的东西,我们都可以在 虚拟文件系统中的相应子目录对他们进行访问和操作,操作统一。而实现这些管理的幕后就是 Linux 操作系统内核 本身:启动 Linux 系统的时候,首先电脑把 Linux 操作系统内核 加载到内存中,内核本身提供了文件管理,设备管理,内存管理,CPU 进程调度管理,网络管理等功能,等内核运行起来之后,就在内存中建立起相应的 虚拟文件系统,最后就是内核利用它提供的那些功能,通过管理文件的方式,来管理 虚拟文件系统中的硬件软件等各种资源了。
Linux 把提供操作系统本身功能(管理计算机软硬件资源)的那些部分划给了 Linux 操作系统内核 ,使得 Linux 操作系统内核 成为一个独立的部分,有它自己独立的开源代码;而其它的一切(软件应用,硬件驱动,数据)都根据其特性有自己的开源代码、或者自由地组织并且存放在那个 虚拟文件系统中由 Linux 操作系统内核 来管理。这样,将系统本身和系统所管理的资源分开,并开放源代码,有助于对系统或者系统所管理的资源进行灵活的定制和扩展,还能按需快速建立起只适合自己使用的操作系统,也利于操作系统本身的发展。实际 Ubuntu , Fedora , RedHat 等各种不同的 Linux 操作系统发行版,简单来说就是不同厂商对其文件系统和内核进行了不同的配置而产生的 “大众化” 的操作系统。相比之下,Windows 就显得非常地零乱复杂,将系统、软件、硬件、数据都混在了一起,其不同版本只能由 Microsoft 一家公司发行。 举例说明下面用直观的例子,来说明两者的不同,以加深理解。假设我们的机器上面有一个硬盘,硬盘分为三个区。
在 Windows 系统中, 我们启动系统之后就会看到 C, D, E, 盘符,它们分别对应硬盘上的三个分区,增加硬盘,或者分区,会导致盘符的增加(注意由于历史原因, A, B 用于表示软驱,硬盘分区盘符从 C 开始按字母递增),这里的每个分区都各自可以被格式化为不同的文件系统(这里的文件系统,包括例如 NTFS 格式, FAT32 格式等),文件系统的基本功能就是为了存放文件的,不同文件系统区别一般在于管理其中存放的文件的功能的强弱,所以分区被格式化成指定格式的文件系统之后,就可以存放任何文件和目录了,我们看到的 C, D, E 内容也就对应了硬盘中相应分区的数据内容。
但是,与 Windows 中把硬盘分区看成 C, D, E 盘符不同, Linux 中最开始根本就没有硬盘的概念,就只有一个纯粹的 虚拟文件系统。如果想要使用哪个硬盘的某个分区,就把那个分区 “挂载” 到某个子目录之下,这样硬盘中的分区,文件系统,目录等内容就呈现到了那个子目录里面。也就是说,在 Linux 中,我们使用硬盘中的数据,实际是先把硬盘的某个分区 “挂载” 到某个子目录下,然后通过那个子目录来访问的。这个例子中, 通常硬盘会对应 虚拟文件系统中的/dev/sda(如有多个硬盘,则为 /dev/sda, /dev/sdb, ……, 按字母递增), 其三个分区对应 /dev/sda1, /dev/sda2,/dev/sda3(多个分区按数字递增,不同硬盘的分区,对应为 /dev/sdb1, /dev/sdb2 等等), 默认硬盘各个分区会被挂载到 虚拟文件系统系统中类似 /mnt/sda1/, /mnt/sda2/, /mnt/sda3/ 的目录(在 Linux 又叫挂载点)中,在/etc/fstab 文件中,我们可以找到分区文件和挂载点的对应关系描述。这样,硬盘相应的分区就做为整个 虚拟文件系统根目录下的一颗子树,反映到了子目录(挂载点)上,子目录中的内容就对应分区中的数据。
假设访问上述硬盘第三个分区 dir1 目录中的文件 test.file
Window 系统上的路径:E:\dir1\test.file
Linux 系统上的路径:/mnt/sda3/dir1/test.file再有,假设用户安装和卸载一个程序 firefox :
Windows 系统中
指定或不指定安装路径类似,程序的安装目录会在 C:\Program Files\Firefox 类似的目录中,或指定的安装路径中; 可执行文件一般在程序的安装路径;依赖的内部库、第三方库、和系统库可能在安装路径中,也可能在 C:\Windows\System32, 或 C:\Windows\system 等类似的路径;而程序访问期间的系统和用户配置文件和产生的输入输出文件,可能会在安装路径配置中,或者在 C:\Windows\ 下的某些文件中(比如注册表数据库文件、用户目录等),这就不一定了。而且不同的系统版本,应用程序版本下,这些目录的具体名称和路径可能会有所不同。卸载的时候由于不确定哪些地方安装了什么内容,很容易造成文件删除补全,遗留系统垃圾等现象,造成系统越来越瘫肿。
Linux 系统中
如果不指定安装路径,所有程序的可执行文件在 /usr/bin 中, 全局配置文件在 /etc/firefox 类似的目录, 用户配置文件一般在用户主目录的 .firefox 的路径下 (用户主目录路径名称统一格式为 /home/) ,依赖的内部库和第三方库在 /usr/lib, 系统库在 /lib 下, 数据文件一般就在用户主目录下。 如果指定安装目录,那么所有内部库和可执行程序,全局配置文件,会在 < 安装路径> 下的 bin, lib, etc 子目录下,其它文件一般和默认情况相同。卸载程序之时,只需在对应目录中,将可执行文件、内部库、配置文件、数据文件删除即可,基本没有不确定是否遗留垃圾文件的问题。这些都是大多数应用程序安装的和访问的默认策略,就像是不成文的业界标准,不排除有个别程序不安装这种策略部署应用,但是 Linux 用户带来 “麻烦“ 的应用,早晚也会被淘汰,不可能会流行在 Linux 系统中,这样,自然的,好的应用都保存在 Linux 系统中并逐渐流行起来,还不会破坏系统结构。
可见, Linux 文件的存放和组织明显方式更高效,层次更分明。
优缺点基于上述内容,Windows 和 Linux 文件系统的各有优缺点分别如下。
Windows 系统优点
优点主要是用户存放东西的位置比较自由,系统结构简单便于新用户上手。
Windows 系统缺点
缺点较多主要有:
目录组织缺乏标准
由于对“系统文件”和“用户文件”存放位置缺乏细致的规定,数据组织的方式显得比较凌乱,并且两种文件之间很容易相互干扰(例如数据文件可能存放在系统区域给系统带来垃圾文件等)。
用户的使用经验对系统的使用效率影响很大
一般来说,我们使用 Windows 时候合理使用分区会提升的系统效率。例如根据需要设置合理的系统分区(假设为 C 分区),尽量少往 C 盘存放数据文件,根据具体情况可以将一些 “重要并且常用的” 程序安装在 C 分区,随时保持系统目录的清洁和大小助于提升系统的运行速度,用户安装的一般软件尽量不要安装在 C 盘,安装软件时候指定的位置最好采用默认标准目录名称(例如 X:\Program Files 目录,这里 X 表示盘符而不要自己定义一些奇怪名字的目录,这样便于软件的维护等等。
共享不便
Windows 上有经验的用户们会将自己的目录结构组织好,但是每个用户组织自己内容的方式是不一样的,所以他的机器上哪里存放了什么内容,别人很难知道,为共享带来了麻烦。
Linux 系统缺点
最开始 虚拟文件系统中的每个子目录的功能是事先规定好了的,我们需要事先知道那些目录存放哪些文件,然后在相应的位置中创建自己的内容,这也是 Linux 系统入门门槛高的一个原因。当然,最开始的新手,也完全可以无视这一点,可以像 Windows 那样随意地创建目录和文件(尽管不推荐这么做)。
实际上最开始的目录也不多,主要就那么几个,花不了多长时间就会明白它们的作用的,而明白这些作用之后带来的好处,远不止付出那么多(本文后面 常用的重要目录 (See section 1.2.1) 会着重对此进行介绍)。
Linux 系统优点
这里只说几个优点:
目录结构反映系统运行机理
当我们了解了这些目录的功能之后,我们对整个 Linux 操作系统的运行机理也会有一个大致的了解。
结构清晰避免逻辑混乱
这样的目录结构,有助于我们以一种高效的方式组织自己的数据,分类清晰并且不会对系统运行有任何影响,规定了最开始每个目录的功能,并没有限制我们的自由,因为我们知道我们可以在哪里创建自己的子目录并且在子目录中任意创建自己的文件。
组织规范便于共享
由于目录具有统一的组织结构,所以 Linux 上面的用户在共享数据的时候,能够很容易地猜测出他所需要的数据大致存放在什么位置,同时也不会影响到私有数据的保密性,毕竟具体来说,怎么存放自己的私有数据,那是用户自己决定的。