魏永明:开源软件及国内发展现状
发布时间:2012-9-10 19:31
发布者:f.luo
关键词:
开源软件
2012年09月10日 http://qing.weibo.com/1926329563/72d174db330026eg.html 开源软件及国内发展现状 1 开源是大势所趋 随着计算机技术的发展,尤其是互联网技术和相关企业的兴起,开源软件在操作系统、编译工具链、数据库、WEB服务器、移动操作系统等各个方面已经成为主流。而且许多企业利用开源软件形成了独特的商业模式。比如谷歌的 Android 操作系统,从 2007 年开源发布第一个版本起,到今天已经发展到 4.1 版本,占据了智能手机操作系统一半以上的市场份额,谷歌也通过 Android 操作系统在移动互联网这一新兴行业中占据了领先和主导地位。再比如在服务器端广泛使用的关系型数据库 MySQL,在以开源软件和商业许可并行的模式下,得到了快速发展,并在 2008 年作价 10 亿美金由 Sun 收购(后者又在 2009 年被 Oracle 公司以 74 亿美金的高价收购)。相反,以前一直和开源软件做斗争的微软公司,却因为无法快速推出适应市场的 Windows Phone 操作系统,在移动互联网竞争中处于下风。为顺应潮流,微软也开始拥抱开源,比如向Samba项目贡献代码,放弃自己研发多年的大数据项目而选择Hadoop为其大数据的核心等。 显然,纵观[/url] IT 行业这二十多年的发展,开源软件从黑客的理想之国,已经形成了一股推进计算机及相关行业不停进步的巨大力量。很多人可能尚未意识到,我们使用的电脑中运行有开源软件,手机中运行有开源软件,家里的电视也运行有开源软件,甚至小小的数码产品(如电子相框)中也运行有开源软件,尤其是互联网服务器端软件,几乎全部是开源软件。毫不夸张地说,开源软件已经渗透到了我们日常生活的方方面面。那么,开源软件到底什么,开源软件尤其是国内的开源软件及社区的现状如何,发展面临哪些困难和问题? 2 开源软件的基本概念 在讲述国内开源软件的发展情况之前,我们先就开源软件的一些基本概念做一些普及。 2.1 为什么会有开源软件? 广义上讲,开源软件指所有公开源代码的软件,包括某些商业软件也可能是开源的。但我们通常所说的开源软件,是狭义上的,指任何人可以通过极低的成本(如仅仅访问互联网而无需其他额外费用)获得该软件源代码的软件,也就是其源代码向公众开放。和狭义上的开源软件相对应的,就是那些不向公众公开源代码的软件,通常就是商业软件。 实质上,在计算机出现的最初年代,几乎所有的软件都是开源的。那时的计算机企业,主要是以销售硬件产品为主,软件几乎都是附送的,加上那时的软件规模都不大,以源代码形式提供给用户还可以缓解一定的技术支持压力——有问题由用户自己修改解决。所以,最初的软件几乎都是以开源的方式提供的。因此,对着迷于计算机编程的工程师来讲,获得软件的源代码几乎是天经地义的事情。这样,当以微软为代表的企业开始实践纯软件产品的商业模式(核心思想是提供二进制可执行程序的使用许可,而不提供源代码),就引起了许多计算机编程爱好者的不满:给我一堆二进制程序,我如何才能按我自己的想法改进程序?在这种背景下,真正意义上的开源软件就自然而然地产生了。 2.2 开源软件的发展历程 开源软件的发展,和互联网的发展密不可分。真正有规模的开源软件,应该是从上个世纪 90 年代开始进入公众视线,也就是互联网开始兴起的年代。我们大致可以将开源软件的发展分为如下三个阶段: 1) 萌芽阶段(上世纪九十年代之前)。这个阶段主要以个人和大学为主,因为发布条件受限,大多数开源软件无法得到有效传播,而仅仅流传于互相熟悉的程序员和老师、学生之间。这个阶段的典型开源软件为 BSD 操作系统。 2) 以非盈利组织为主的阶段。这个阶段应从上个世纪九十年代算起,说起这个阶段,我们不得不提到 Richard Stallman 发起的自由软件基金会,还有 Apache 基金会等。前者发起的 GNU 项目(1983 年发起,九十年代后随 Linux普及),成就了 Linux 操作系统;后者维护的 Apache WEB服务器,在互联网上几乎占据了统治地位。 3) 以大型IT企业为主的阶段。这个阶段出现于 2005 年之后,以谷歌为代表的大型互联网企业,开始以各种方式发布开源软件,最为著名的是 Chrome 浏览器以及 Android 操作系统;当然还有 Intel、Nokia 等企业主导的 Moblin、MeeGo 等基于 Linux 的智能手机操作系统。 2.3 开源软件许可证 笔者看来,软件作者选择向公众开放源代码,其理由无外乎如下三种: 第一,那些认为所有软件都应该以源代码方式发布的。如 Richard Stallman,他认为所有的软件都应该是开放源代码的,甚至为了建造一个理想中的全开源软件世界,创立了自由软件基金会,发明了 GPL 许可证,发起了 GNU 项目。 第二,通过开源软件展示自己的软件设计、算法和编码水平,并期望获得他人认可的。大部分小型软件或者程序的作者,或者由大学主持和维护的开源软件,出于这种目的向公众开放源代码。 第三,通过开源软件谋求获得广泛推广,并通过提供增值的产品或者服务来获得商业收益的。这通常是商业企业选择开源软件的原因。如 FireFox、MySQL、Android、WebKit 等属于这种情形。 为了达到上述三种不同的目的,人们在现有软件著作权的法律框架内,发明了多种用于开源软件的许可证。这些许可证从法律上帮助对开源软件有不同诉求的软件作者,获得自己想要的结果。要想具体了解这些许可证的实质内容,我们首先需要更加深入地了解软件著作权。 许多开发者对软件著作权只有一个初步的、模糊的认知。我们经常会在各种软件的启动画面或者关于对话框中刚看到类似“版权所有 (C) 2012 某公司;保留所有权利”的用语。这说明,软件著作权包含了很多权利,所以才有“保留所有权利”这样的说法。具体而言,软件著作权大致包括如下几个权利: 署名权。就是署上自己大名的权利,向人们说明这是我的作品。这里的“我”,可能是个人,也可能是法人单位。 修改权。就是是否可以修改软件,比如翻译软件界面中的文字。对非开源软件,就是是否允许你反编译软件并修改的权利。对开源软件来讲,就是修改其中可能存在的缺陷,或对一些代码进行优化、重构等等。 复制权。就是将软件进行复制的权利。和图书类比,就是你能不能抄写和/或复印图书。 发布权。就是将软件副本交给他人的权利,不管是收费的还是不收费的。 对商业软件而言,这些权利都被保留,意思是什么呢?就是说,你不能修改,也不能复制,还不能随便发布给别人。那用户能做什么,唯一的就是安装和使用这个软件了。当然,大部分商业软件都附带有一个《最终用户许可协议》,其中告诉了你能做什么,不能做什么。比如,你可以因为备份的原因复制这个软件。另外,还定义了很多免责条款,比如,如果 90 天内软件的存储介质损坏,可以免费替换;如果因为使用本软件导致数据丢失或损坏,概不负责之类的。 对开源软件而言,因为任何人可以几乎无成本获得软件的源代码或者最终程序,用户使用这个软件要是有了问题,都去询问作者,那作者就吃不消了。所以,开源软件也通常使用某个特定的许可证来约定作者以及使用者所承担的权利和义务。 自由软件基金会制定的 GPL 许可证,应该是开源软件使用的各种许可证中最为严格的。为了区别于其他开源软件,Richard Stallman 将使用 GPL 许可证的开源软件称为自由软件。GPL 许可证的核心内容是: 你可以随意复制和发布软件。如果以二进制方式发布软件,则必须能够让获得二进制版本的人,以不付出额外成本的方式获得其源代码。 你可以随意修改源代码。一旦要发布修改后的软件,必须同时发布修改后的源代码。也就是说,修改版本也必须以 GPL 许可证发布。这就是 GPL 许可证被称为病毒许可证的一个最重要原因。 如果 GPL 软件作为其他软件的一部分使用(后者称为 GPL 软件的衍生作品),不论是静态链接还是动态链接,衍生作品也要遵循 GPL 许可证。这是 GPL 许可证被称为病毒许可证的另外一个重要原因。 无任何担保。就是说,使用 GPL 软件,出了问题不要找原作者,你需要自己负责。 RichardStallman 希望通过这样严格的 GPL 许可证,来建立一个所有软件均遵循 GPL 的理想软件世界。除了 Richard Stallman 所倡导的理想王国之外,还有许多个人和组织,以不同于自由软件的方式来发展开源软件。这些开源软件所使用的许可证相比 GPL 要宽松一些,或者很宽松。这些开源软件作者,通常属于本节前面所讲的第二、第三种人,所以他们使用的许可证有如下共同点: 免担保,责任由使用者自负。 随便复制和发布。 不限制商用。 这些许可证的不同点在于: Apache 许可证:如有修改,必须保留已有的版权声明,且必须包含新的版权声明。通俗理解,就是要保留原作者信息,也就是署名权。 BSD 许可证:不允许在衍生软件作品中提原作者的名字,其理由是,因为你的修改可能污染原有代码,破坏原作品的品质。 MIT 许可证:在衍生软件作品中,必须提原作者的名字;其理由是,原有代码作者应得到充分尊重。 Mozilla 许可证(MPL):就原有软件所做修改,必须可以以各种可能的方式发布其源代码(包括使用 GPL 许可证),且应该有修改说明。 除了上述许可证之外,还有一个广泛使用的 LGPL 许可证。该许可证最初是针对函数库专门制定的。为了避免类似 C 基础库这样的软件因为采用 GPL 许可证而让使用它的软件(衍生作品)成为 GPL 软件,从而定义了 LGPL 许可证。试想,如果 C 基础库也采用 GPL 许可证,那就失去了它本身存在的实际价值,因为其他任何非 GPL 软件都不能使用采用 GPL 的 C 基础库。所以,LGPL 定义,当 C 基础库这样的软件以动态链接的形式由其他软件使用时,这些软件就可以不遵守 GPL 许可证,甚至可以是商业软件。另外,本某种角度看,LGPL 和 MPL 本质上是一样的。 当然,除了上面的各种许可证,还有的开源软件作者根本不关心保留什么权利,或者对其作品做什么样的约束,相反,这些作者开源其软件,就是为了“有用”,任何人拿这种软件做什么,对原作者来讲,都是无所谓的。这种软件亦称为“礼物软件”,相当于作者放弃了有关软件著作权的所有权利,也就是所谓置于“公共领域(public domain)”当中——随你怎么用。 2.4 为什么开源软件会得到快速发展并广泛应用? 很多人不理解,既然作者这么大方地将源代码都公开了,只是为了“有用”,且不提供任何“担保”,看起来原作者是无法直接获利的,那为什么没有直接的利益驱动,开源软件却能够得到这么快速的发展和广泛应用呢? 笔者初探其原因,大致有四: 1) 开源软件虽说不提供任何担保,但既然原作者愿意公开源代码,说明作者对代码的质量还是非常有信心的。实际上,开源软件的作者通常都是编码高手(俗称“黑客”),其质量甚至超过某些商业软件。 2) 开源软件因为其免费特征,能够得到大量用户的使用和验证,通过形成和用户(往往也是编码高手)之间的互动和交流,能够以最快的速度修复可能的缺陷,改善软件设计。Linux 内核的发展就形成了一个以全世界内核高手为主的松散社区,通过快速迭代开发,加上其免费特征,迅速占据了原先由商业 UNIX 系统控制的服务器操作系统领域。 3) 因为任何人都可以得到其源代码,所以很多用户就可以自行修改其源代码,以满足自己的一些特别需求。 4) 因为开源软件的涉及面非常广,利用已有的各种成熟开源软件,任何具有一定实力的组织,均可在较短时间内形成一个基本成熟的软件平台,进而可和已有的商业软件平台进行竞争。谷歌的 Android 系统属于此种情况的典型。 所以,尽管开源软件的发展历程并不是一帆风顺的,但基于以上原因,开源软件显现出了其强大的生命力。各种基于开源软件的成功商业模式,也为开源软件的发展注入了加速剂。有关围绕开源软件的成功商业模式,可见本文第 4 章。 3 国内开源软件的发展及社区现状3.1 国内开源软件的发展简史 国内开源软件的发展大致始于 1997 年前后。那时,中国第一个(局部)互联网(CERNET)刚刚建立不久,1995 年在清华大学建立的著名水木清华 BBS 就是开源软件。自那之后,Linux 内核以及 GNU 项目中的成百上千个开源软件突然展现在国人的面前。在这之前,国内软件开发者,几乎没有人会认为获得程序的源代码是天经地义的事情(写到此处,笔者再次感叹文化和背景的不同所带来的认知差别)。但随着带有源代码的 Linux 操作系统随着互联网以及廉价光盘的广泛传播,当你能看到这些优秀的软件是如何设计和编写出来的的时候,我相信,大部分程序开发者都会和笔者一样——那心情岂止是“激动”两个字可以形容的? 在这样的背景下,中国也出现了一些开源软件。最初由国人开发的开源软件,主要解决的是 Linux 系统的汉化问题,流传最为广泛的应该是可以显示和输入中文的伪终端应用程序 CCE。在 1998 年之后的两三年内,出现了如下三个开源软件: 章文嵩博士开发的 LVS(Linux Virtual Server),后来被 Linux 内核收录,成为使用 Linux 操作系统搭建集群服务器的重要核心软件组件。 当时的清华大学博士生苏哲开发的 Smart Boot Manager,是一种引导管理器,类似现在流行的 GRUB,主要解决引导多种操作系统的问题。苏哲后来主持开发的 SCIM 系统,被各种流行的 Linux 发行版收录,成为了 Linux 操作系统上提供多语种输入法支持的标准框架。 笔者开发的 MiniGUI,后来由笔者创立的北京飞漫软件技术有限公司继续维护和发展,在功能手机、数码相框、工业控制系统和工业仪表中得到了广泛应用。 上述三个开源软件,成为中国开源软件早期的代表作,在国际上具有较强的影响力,很多台湾同行也知道这些软件,提起来往往是赞不绝口。 在此之后,国内开源软件的发展长期处于停滞状态,这和 2000 年左右 DotCOM 泡沫的破裂有一定的关系。DotCOM 泡沫的破裂,让许多梦想通过开源软件来创造商业奇迹的 Linux 发行版厂商很是受伤。比如,笔者曾经供职过的蓝点软件,在 NASDAQ OTCBB 板借壳上市,半年之内股价从 20 多美金跌到 0.2 美金,后于 2001 年贱卖。RedHat 等知名 Linux 发行版厂商也深受其害,另外一些抗跌能力不强的从事开源软件相关业务的企业更是一蹶不振,甚至关门大吉。 DotCOM 泡沫的破裂,给很多支持开源软件的理想主义者浇了一桶凉水,开源软件的商业化发展步伐减缓,从而影响了国内开源软件的发展。2000年前后几年,以北京、武汉等地的 LUG(Linux User Group)为代表的各类开源软件组织非常活跃,而从 2003 年开始,逐渐降温甚至消失。 但是,国际上深信理想主义的黑客文化并没有因为 Linux 发行版厂商的商业化遇阻而停止发展,Linux 内核、GNU 项目、GNOME 和 KDE 等等软件继续向前发展。同时,2005 年后,又出现了如下在当前 IT 领域有着举足轻重影响力的几款开源软件: Mozilla 基金会(以 Mozilla 基金会下属 Mozilla 公司的成立为准)以及 FireFox 浏览器。Mozilla 公司通过 FireFox 浏览器获得了来自谷歌等公司的大量合作收入,从而实践了没有赞助也能自负盈亏的商业模式。 WebKit 浏览器引擎。WebKit 浏览器是苹果 Safari 浏览器、谷歌 Chrome 浏览器使用的浏览器核心引擎。WebKit 其实是由苹果公司发起的开源项目,在早期 KDE 系统的 KHTML 和 KJS 两个子系统基础上发展而来。 谷歌的 Android 操作系统。Android 操作系统的上层虽然是虚拟机和 Java 应用,但底层却使用了大量开源软件,如 Linux 内核、SQLite 内嵌式数据库、FreeType 矢量字体渲染库等等。 显然,从 2005 年起,开源软件的发展从一个低谷重新引来了发展的高潮,而这次,与前述的第三个阶段吻合,即以大型 IT 企业为主导进行发展。在此期间,国内也出现了为数不多的一些开源软件项目,其中以清华大学陈渝副教授主持的 SkyEye 最具代表性。该项目旨在提供一个面向嵌入式软件开发和调试的 ARM 或其他架构的纯软件仿真器(虚拟机)。该项目持续活跃长达七年时间,吸引了许多来自海外的高手参与,是为数不多具有国际影响力,且充分体现了国际化协作、分享的开源软件项目。 与此同时,RedHat 以及国内的红旗等公司,也开始通过提供针对服务器的 Linux 定制版本而获得可观收入,之后,Ubuntu 这一在桌面系统上广泛应用的 Linux 发行版也实践了其成功的商业模式,占据了绝大部分 Linux 桌面发行版的市场份额。 2008年金融危机后,传统企业为了降低IT的总拥有成本逐步使用Linux和开源软件,尤其是金融企业,世界上主要证券交易所如纽约交易所、NASDAQ、东京交易所、伦敦交易所等先后迁移到Linux。这标志着开源软件进入了不可逆转的发展通道。 从 2005 年开始,国内的开源软件也开始进入上面所说的由大型企业主导的第三个阶段,参与开源项目的企业当中,最为活跃的是淘宝,接下来是新浪、百度、腾讯和华为等。同时,随着“开源中国”等社区的兴起,个人主持或者参与的开源软件逐渐多了起来。根据“开源中国”收录的开源软件,当前已经有一千多个由国人开发或者主持的开源软件。这和十年前相比,已经有了非常大的进步。有兴趣的读者可访问 http://www.oschina.net 了解。其中值得一提的开源软件有: TFS。TFS是一款由淘宝开发的分布式对象存储系统,于2010年9月开源,在淘宝它存储了几百亿张图片和交易快照。新浪微博已在生产系统中使用TFS作图片等对象存储。淘宝承诺发布的开源版本与自身使用的版本保持高度一致,并同步更新,这为国内开源软件的发展起到了积极的推动作用,TFS已经成为国内企业利用开源方式形成核心竞争力的典范。 TAIR。TAIR 是一个高性能、可扩展、高可靠的分布式key/value存储系统,淘宝在2010年6月开源。在淘宝约有600台TAIR服务器广泛应用在Web服务器和数据库中间作对象缓存。国内的豆丁网等公司已使用TAIR。 OceanBase。OceanBase是一个高性能海量数据库系统,由淘宝开发,于 2011 年 5 月开源。淘宝在其收藏夹等多项功能中使用该数据库,已经历实际应用的检验。 RT-Thread。这是一个由国人主持开发的开源实时操作系统,曾获得“第六届中日韩开源软件竞赛”的技术优胜奖(其他两个技术优胜奖获得者为淘宝OceanBase 和红旗Qomo Linux)。RT-Thread 目前也获得了诸多商业应用。 Linux Deepin。这是近几年发展起来的面向桌面的中文 Linux 发行版,由一群来自武汉的 Linux 高手发起并维护。 ucore:2010 年暑假开始,陈渝博士组织清华大学学生开展教学用开源操作系统ucore的设计与实现,并直接用于清华大学的操作系统课程,学生可参考实验文档和ucore源码通过实践逐步深入掌握操作系统。这相对国内操作系统旧有的教学方法有较大改变,获得了国内外操作系统教学领域专家的认可,并将在教育部的支持下进行更大范围内的推广。 3.2 国内开源软件的特点和问题 但国内开源软件也存在很多问题,如缺乏重量级软件,缺乏持续维护和更新,质量一般,用户不多等等。另外,如开源中国创始人所言,国人所开发的这些开源软件,和国际主流开源软件脱节严重,绝大多数的状态是单打独斗。 比如淘宝主导或参与的开源软件,大多数和互联网服务器后台、云计算相关,这些项目的主要用户是淘宝自己。因为门户之见,这些软件很难被其他的互联网企业所使用,大家不停地“造轮子”而忽视了开源软件发展必须具备的“共享”、“协作”之精神。当然,这种情况正在改变,比如上面提到的淘宝 TFS 系统已被其他互联网企业使用,ucore 项目也得到了诸多国内、国外大学积极响应和支持。 笔者希望国内的开源软件作者能够和国际主流的开源软件步伐保持一致,摒弃门户之见,要么加入国际化的开源软件,要么将自己主持的开源软件逐步国际化。这样,我们的开源软件才能得到源源不断的前进动力,也才能在国际化舞台上扮演更加重要的角色。 3.3 新的力量 但不论如何,国内大型 IT 企业参与开源软件本身就是一个良好的开端,将为中国开源软件的发展起到非常大的促进作用。 与此同时,各种开源社区活动也越来越活跃,比如具有政府背景的“开源软件高峰论坛”和草根性质的“我们的开源软件”巡回展演等。在最近的“我们的开源软件”巡回展演中,参与介绍的开源软件多达几十种,参会人员众多,而这一切都是社区成员通过“微博”等方式发起和组织的。 这表明,开源软件即将在国内引起新一轮的发展浪潮。 4 开源我的软件? 在高物价、高房价的今天,大部分人对此问题的第一反应是:“我就一刚解决温饱的码农,我开源,谁养我?”这问题,和我们在十年前推广开源软件理念时遇到的问题几乎一样。但其实,这话已经大大落后于时代了!我们不仅仅可以通过使用其他人的开源软件赚钱,还可以通过开源自己的软件来赚钱。 4.1 别人靠开源软件如何赚钱? 在证明上述论点之前,我们先看看别人是如何利用开源软件赚钱的。靠开源软件赚钱的方式(经过验证的)无外乎有如下几种: 1) 双许可证模式。即在采取严格的开源软件许可证的同时(通常选择 GPL),给商业用户提供非 GPL 许可方式。这本质上是一种贩卖软件许可的行为,但开源软件带给开发者一个很大的好处,即传播迅速,快速迭代。笔者主持的 MiniGUI 项目就采用这种模式,在过去的五年当中,获得了几千万元的软件许可收费。当然,使用这个模式最成功的当属MySQL。 2) 基础软件采用宽松许可证,同时向基础软件的商业用户贩卖增值服务或者增强组件、开发工具等的许可。这种模式可用于类似 RT-Thread 这类的基础性软件上,RT-Thread 本身可以是开源且可无偿商用的,但其上的各种增值组件,如网络、文件系统、图形系统等,可以是商业软件。国外采用这种模式的以各类 CMS 系统为主。比如 Drupal 和 Concrete 系统,其基本系统是开源且免费的,但其上的许多插件、主题、模版等是收费的。有兴趣的读者可访问http://www.concrete5.org 网站,其中还有“Marketplace(市场)”频道。 3) 混合模式,既贩卖工具等软件的许可,同时还向用户提供付费服务的模式。比如 Ubuntu Linux 发行版。 4) 成为平台型软件,并承载自己的互联网业务。这种模式在大型互联网企业中应用广泛。比如谷歌开发并开源 Chrome 浏览器,短短几年抢占了微软的很多市场份额,通过在 Chrome 中默认使用谷歌搜索引擎而获得极大的收入;再比如谷歌开源 Android,一方面为了遏制苹果 iOS 的增长势头,一方面通过预置 Google 搜索而获得了大量来自移动互联网的流量收入。 显然,有了先驱们的成功案例,作为开源软件参与者,不论是企业还是个人,都可能名利双收。 4.2 IT 企业为何要参与开源软件? IT 行业中的企业,即使是销售硬件产品的企业,也在不停地开发各种软件,同时也大量使用各种开源软件。对这类企业,开源自己开发的软件其动力是什么? 作为企业,参与或者主导一个开源软件,其最为明显的动力应该是上述的第四个商业模式,即打造一个平台型软件。但是,就中国 IT 企业来讲,笔者尚未看到有此种实力,或者此种抱负的企业存在,毕竟,打造一个平台需要长期的投入,一般情况需要五年或者更长的时间。貌似中国没有一个企业有这个耐心来投入五年这么长的时间在一个软件上。 那么为什么企业还要参与到开源软件的开发中?笔者认为,谋不了大利就谋点小利,企业主导或参与开源软件,至少有如下几个好处: 提高企业的美誉度。在利用开源软件的同时,也参与到开源软件当中,企业的美誉度会得到很大的提升。 员工更有激情。因为自己的作品能够公之于众,虽然著作权本质上属于企业,但作为实际的编码者,可以通过开源自己的作品来获得额外的成就感和满足感。这对于稳定开发团队、提高开发人员的积极性会有很大的帮助。 当然,也许过不了几年,中国也能出现实践第四种商业模式的大型 IT 企业,让我们拭目以待吧! |
网友评论