为了账号安全,请及时绑定邮箱和手机立即绑定
慕课网数字资源数据库体验端
认识Hadoop--基础篇_学习笔记_慕课网
为了账号安全,请及时绑定邮箱和手机立即绑定

认识Hadoop--基础篇

Kit_Ren Linux系统工程师
难度初级
时长 1小时22分
  • Hadoop 主要作用是 分布式存储+分布式计算
    查看全部
  • 大数据存储及处理技术的原理以及hadoop的使用和开发
    查看全部
  • #Google大数据技术 MapReduce、BigTables、GFS 革命性的变化1:成本降低,能用PC机,就不用大型机和高端存储。 革命性的变化2:软件容错硬件故障视为常态,通过软件保证可靠性。 革命性的变化3:简化并行分布式计算,无须控制节点同步和数据交换
    查看全部
  • 系统瓶颈:存储容量,读写速率,计算效率
    查看全部
  • HDFS特点: 1、数据冗余,软件方式保证低成本硬件容错。 2、流式读写(一次写入,多次读取,不可修改)。 3、适合存储大文件(否则namenode消耗高,头大身小)。 优点:存储块大,吞吐量高,为存储大文件设计; 缺点:延迟高,不适合交互式访问,不支持多用户同时操作一个块。
    查看全部
    2 采集 收起 来源:HDFS特点

    2016-07-31

  • 1.每个数据块3个副本,分布在两个机架内的三个节点,2个在同一个机架上,另外一个在另外的机架上。 2.心跳检测,datanode定期向namenode发送心跳消息。 3.secondary namenode;定期同步元数据映像文件和修改日志,namenode发生故障,secondaryname备份上位
    查看全部
    0 采集 收起 来源:数据管理策略

    2016-07-31

  • NameNode 适合存储大的文件
    查看全部
    0 采集 收起 来源:HDFS特点

    2016-07-31

  • 4、mapred-site.xml文件 <configuration> <property> <name>mapred.job.tracker</name> <value>iZ234znod84Z:9001</value> </property> </configuration>
    查看全部
  • hdfs-site.xml <property> <name>dfs.data.dir</name> <value>/hadoop/data</value> </property>
    查看全部
  • <property> <name>hadoop.tmp.dir</name> <value>/hadoop</value> </property> <property> <name>dfs.name.dir</name> <value>/hadoop/name</value> </property> <property> <name>fs.default.name</name> <value>hdfs://localhost:9000</value> </property>
    查看全部
  • 工具hive
    查看全部
  • 1.HDFS文件系统的文件分成“块(block)”进行存储 2.HDFS块的默认大小64MB 3.块是文件存储处理的逻辑单元 4.HDFS有两类节点:a.NameNode;b.DataNode a.NameNode是管理节点,存放文件元数据,包括文件与数据块的映射表、数据块与数据节点的映射表 b.DataNode是工作节点,存放数据块
    查看全部
    0 采集 收起 来源:HDFS基本概念

    2016-07-28

  • Linux基础知识 Java编程基础
    查看全部
  • hadoop安装步骤: 1、安装JDK:apt-get install openjdk-7-jdk; 2、设置环境变量:JAVA_HOME、JRE_HOME、CLASSPATH、PATH 3、下载hadoop安装包并解压到指定目录下; 4、设置环境变量:HADOOP_HOME、PATH 5、修改相关配置文件$HADOOP_HOME/conf: 1)修改hadoop-env.sh,设置JAVA_HOME; 2)修改core-site.xml,设置hadoop.tmp.dir、dfs.name.dir、fs.default.name; 3)修改mapred-site.xml,设置mapred.job.tracker; 4)修改hdfs-site.xml,设置dfs.data.dir; 6、格式化:hadoop namenode -format; 7、启动:start-all.sh 8、检查:jps
    查看全部
    2 采集 收起 来源:安装小结

    2016-07-27

  • 需要安装apt-get install openssh-server. hosts文件中需要添加 imooc 127.0.0.1
    查看全部

举报

0/150
提交
取消
课程须知
本课程需要童鞋们提前掌握Linux的操作以及Java开发的相关知识。对相关内容不熟悉的童鞋,可以先去《Linux达人养成计划Ⅰ》以及《Java入门第一季》进行修炼~~
老师告诉你能学到什么?
1、Google的大数据技术 2、Hadoop的架构设计 3、Hadoop的使用 4、Hadoop的配置与管理
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!