查看: 2348|回复: 0

实战:如何在Linux上安装与配置Hadoop

[复制链接]
发表于 2017-4-8 11:21:55 | 显示全部楼层 |阅读模式

Hadoop最早是为了在Linux平台上使用而开发的,但是Hadoop在UNIX、Windows和Mac OS X系统上也运行良好。不过,在Windows上运行Hadoop稍显复杂,首先必须安装Cygwin以模拟Linux环境,然后才能安装Hadoop。

  在Unix上安装Hadoop的过程与在Linux上安装基本相同,因此下面不会对其进行详细介绍。

  在Linux上安装与配置Hadoop

  在Linux上安装Hadoop之前,需要先安装两个程序:

  1. JDK 1.6或更高版本;

  2. SSH(安全外壳协议),推荐安装OpenSSH。

  下面简述一下安装这两个程序的原因:

  1. Hadoop是用Java开发的,Hadoop的编译及MapReduce的运行都需要使用JDK。

  2. Hadoop需要通过SSH来启动salve列表中各台主机的守护进程,因此SSH也是必须安装的,即使是安装伪分布式版本(因为Hadoop并没有区分集群式和伪分布式)。对于伪分布式,Hadoop会采用与集群相同的处理方式,即依次序启动文件conf/slaves中记载的主机上的进程,只不过伪分布式中salve为localhost(即为自身),所以对于伪分布式Hadoop,SSH一样是必须的。

  一、安装JDK 1.6

  安装JDK的过程很简单,下面以Ubuntu为例。

  (1)下载和安装JDK

  确保可以连接到互联网,输入命令:

555555">sudo apt-get install sun-java6-jdk

  输入密码,确认,然后就可以安装JDK了。

  这里先解释一下sudo与apt这两个命令,sudo这个命令允许普通用户执行某些或全部需要root权限命令,它提供了详尽的日志,可以记录下每个用户使用这个命令做了些什么操作;同时sudo也提供了灵活的管理方式,可以限制用户使用命令。sudo的配置文件为/etc/sudoers。

  apt的全称为the Advanced Packaging Tool,是Debian计划的一部分,是Ubuntu的软件包管理软件,通过apt安装软件无须考虑软件的依赖关系,可以直接安装所需要的软件,apt会自动下载有依赖关系的包,并按顺序安装,在Ubuntu中安装有apt的一个图形化界面程序synaptic(中文译名为“新立得”),大家如果有兴趣也可以使用这个程序来安装所需要的软件。(如果大家想了解更多,可以查看一下关于Debian计划的资料。)

  (2)配置环境变量

  输入命令:

sudo gedit /etc/profile

  输入密码,打开profile文件。


您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关于我们  -  服务条款  -  使用指南  -  站点地图  -  友情链接  -  联系我们
电子工程网 © 版权所有   京ICP备16069177号 | 京公网安备11010502021702
快速回复 返回顶部 返回列表