`
511930751
  • 浏览: 41011 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

Hadoop搭建-单机模式

阅读更多
临近年关,不是太忙。就在闲暇时间看了下hadoop..欢迎各位大牛拍砖.
单机模式
1、 jdk安装(jdk6.0)
a) 下载地址:http://www.oracle.com/technetwork/java/javase/dwnloads/jdk-6u30-download-1377139.html
b) jdk安装目录/opt/jdk1.6.0_30
2、 hadoop安装(hadoop1.0.0)
a) 下载地址:http://mirror.bjtu.edu.cn/apache/hadoop/common/hadoop-1.0.0/
b) hadoop安装目录/opt/hadoop-1.0.0
3、 修改$HADOOP_HOME$/etc/hadoop/hadoop-env.sh,添加JAVA_HOME=/opt/jdk1.6.0_30
4、 下面的实例将已解压的 conf 目录拷贝作为输入,查找并显示匹配给定正则表达式的条目。输出写入到指定的output目录。
$ cd /opt/hadoop-1.0.0/
$ mkdir input
$ cp /opt/hadoop-1.0.0/etc/hadoop*.xml input
$ bin/hadoop jar /opt/hadoop-1.0.0/share/hadoop/hadoop-examples-1.0.0.jar grep input output 'dfs[a-z.]+'
$ cat output/*

单机模式的伪分布系统
1、查看机器的hostname,使用命令$hostname,如果不是localhost,需要修改成localhost。
2、修改hadoop的配置文件。这里需要修改三个配置文件,分别是:
a)/opt/hadoop-1.0.0/etc/hadoop/core-site.xml
<configuration>
<property>
        <name>fs.default.name</name>
        <value>hdfs://localhost:9000</value>
</property>
</configuration>
b)/opt/hadoop-1.0.0/etc/hadoop/mapred-site.xml
<configuration>
<property>
  <name>mapred.job.tracker</name>
  <value>localhost:9001</value>
</property>
</configuration>
c)/opt/hadoop-1.0.0/etc/hadoop/hdfs-site.xml
<configuration>
<property>
   <name>dfs.replication</name>
   <value>1</value>
</property>
</configuration>

3、免密码ssh设置
现在确认能否不输入口令就用ssh登录localhost:
$ ssh localhost
如果不输入口令就无法用ssh登陆localhost,执行下面的命令:
$ ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
$ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

4、格式化一个新的分布式文件系统:
$ bin/hadoop namenode -format
启动Hadoop守护进程:
$ sbin/start-all.sh
Hadoop守护进程的日志写入到 ${HADOOP_LOG_DIR} 目录 (默认是 ${HADOOP_HOME}/logs).

5、浏览NameNode和JobTracker的网络接口,它们的地址默认为:
NameNode - http://localhost:50070/
JobTracker - http://localhost:50030/

6、将输入文件拷贝到分布式文件系统:
$ bin/hadoop fs -put /opt/hadoop-1.0.0/etc/hadoop*.xml input

7、运行发行版提供的示例程序:
bin/hadoop jar /opt/hadoop-1.0.0/share/hadoop/hadoop-examples-1.0.0.jar grep input output 'dfs[a-z.]+'

8、查看输出文件:
将输出文件从分布式文件系统拷贝到本地文件系统查看:
$ bin/hadoop fs -get output output
$ cat output/*
或者
在分布式文件系统上查看输出文件:
$ bin/hadoop fs -cat output/*

9、完成全部操作后,停止守护进程:
$ sbin/stop-all.sh

Hadoop命令整理:
1、从HDFS中删除input目录
/opt/hadoop-1.0.0/bin/hadoop fs -rmr input/
2、把本地目录上传到HDFS
/opt/hadoop-1.0.0/bin/hadoop fs -put input/  input

注意点:
1、Hadoop1.0.0和之前的版本有些许改动。文件的目录结构需要注意。
2、机器的hostname需要注意。

分享到:
评论

相关推荐

    Ubuntu下搭建Hadoop单机模式环境

    本文主要介绍了在Ubuntu系统上Hadoop单机版测试环境的搭建过程。

    用虚拟机在ubuntu上搭建hadoop平台的单机模式

    该文档可以帮助您完美地搭建hadoop平台的单机模式

    linuxhadoop搭建手册以及三种集群模式配置

    资源名称:linux hadoop搭建手册以及三种集群模式配置内容简介: linux hadoop搭建手册以及三种集群模式配置前半部分主要讲述了环境配置 环境配置环境配置;后半部分主要讲述Hadoop集群有三种运行模式,分别为单机...

    搭建伪分布模式Hadoop.pdf

    1.搭建单机模式Hadoop (1)关闭防火墙(2)关闭selinux防火墙(3)设置主机名(4)映射主机名与ip地址 2.安装JDK(2)上传JDK至服务器(4)配置JAVA环境变量 3.安装Hadoop(3)配置Hadoop环境变量 2.搭建伪分布式模式...

    从裸机搭建完全分布式模式Hadoop.pdf

    1.搭建单机模式Hadoop 1.搭建准备工作 (1)关闭防火墙(2)关闭selinux防火墙 2.安装JDK (1)下载jdk (2)上传JDK至服务器 a.下载WinSCP软件 b.建立linux与windows之间文件互传 (4)配置JAVA环境变量3.安装Hadoop ...

    ubuntu环境下hadoop环境搭建(伪分布模式)

    ubuntu环境下hadoop环境搭建(伪分布模式),是本人学习大数据以来对于hadoop环境搭建的一些经验,现在写成文档的形式分享给大家。

    全球最详细的从零起步搭建Hadoop单机和伪分布式开发环境图文教程

    本文从零起步构建Hadoop单机版本和伪分布式的开发环境,涉及: 1, 开发Hadoop需要的基本软件;...3, 配置Hadoop单机模式并运行Wordcount示例; 4, 配置Hadoop伪分布式模式并运行Wordcount示例;

    Hadoop云计算环境搭建

    详实的记录了搭建Hadoop云计算环境的过程,希望能帮助他人快速搭建Hadoop云计算环境,目录如下: 1引言 1 1.1 编写目的 1 2搭建过程 1 2.1 所需软件 1 ...2.9.1 单机模式 15 4 附录 16 4.1 linux常用命令 16

    Hadoop大数据平台构建、规划大数据平台集群教学课件.pptx

    单机模式 在单机上运行。 没有分布式文件系统,直接读写本地操作系统。 伪分布模式 在单机上运行。 使用分布式文件系统。 hadoop集群只有一个节点,因此hdfs的块复制将限制为单个副本。 在单个节点上运行NameNode、...

    使用hadoop实现WordCount实验报告.docx

    使用hadoop实现WordCount详细实验报告,配有环境变量配置截图以及实验运行及结果详细过程描述与截图

    搭建hadoop伪分布式.docx

    这种模式也是在一台单机上运行,但用不同的Java进程模仿分布式运行中的各类结点(NameNode,DataNode,JobTracker,TaskTracker,SecondaryNameNode),请注意分布式运行中的这几个结点的区别:从分布式存储的角度来说,...

    基于hadoop的云计算研究报告

    1. Hadoop的基本结构和包含部分 2. 云存储虚拟平台的搭建 3. Hadoop的环境配置 4. 建立Hadoop集群的实验 5. Hadoop单机模式 6. Hadoop伪布式模式 7. Hadoop完全分布式模式

    动手实验 Oracle Hadoop装载程序

    本实验主要由以下软件搭建而成: Oracle Enterprise Linux, Oracle 11g, Java SE6update30, Apache Hadoop, Oracle Connector for Hadoop等。 实验1: 装载Hadoop文件到数据库 实验2: 装载Hadoo文件到DataPump格式...

    word源码java-hadoop-v1:hadoop入门

    Hadoop分布式集群搭建 大数据概述 商品推荐 预言家 大数据4V特征 1、数据量Volume 2、多样性,复杂性Variety 3、基于高度分析的新价值Value 4、速度Velocity 大数据带来的技术变革 1、技术驱动:数据量大 存储:文件...

    Hadoop实战中文版

    2.2.2 验证SSH安装 2.2.3 生成SSH密钥对 2.2.4 将公钥分布并登录验证 2.3 运行Hadoop 2.3.1 本地(单机)模式 2.3.2 伪分布模式 2.3.3 全分布模式 2.4 基于Web 的集群用户界面 2.5 小结 第3章 Hadoop组件...

    Hadoop实战手册

    hadoop-env.sh 环境变量13#Hadoop Common组件 配置 core-site.xml13#HDFS NameNode,DataNode组建配置 hdfs-site.xml14#配置MapReduce - JobTracker TaskTracker 启动配置15#Hadoop单机系统,启动执行和异常检查17#...

    Hadoop实战中文版.PDF

    212.2.2 验证SSH安装 212.2.3 生成SSH密钥对 212.2.4 将公钥分布并登录验证 222.3 运行Hadoop 222.3.1 本地(单机)模式 232.3.2 伪分布模式 242.3.3 全分布模式 252.4 基于Web的集群用户界面 282.5 ...

    教你玩转Hadoop分布式集群搭建,进击大数据

    Hadoop的搭建有三种方式,单机版适合开发调试;伪分布式版,适合模拟集群学习;完全分布式,生产使用的模式。这篇文件介绍如何搭建完全分布式的hadoop集群,一个主节点,三个数据节点为例来讲解。 教你玩转

    基于Hadoop的大数据处理系统.pdf

    Hadoop擅长于在廉价机器搭建的集群上进⾏海量数据(结构化与⾮结构化)的存储与离线处 理,⽬前能够让数千台普通、廉价的服务器组成⼀个稳定的、强⼤的集群,使其能够对PB级别的⼤数据进⾏存储、计算。此外,Hadoop已 ...

Global site tag (gtag.js) - Google Analytics