IDEA的扩展功能
之前每次我们想要去修改集群中的一些配置文件,采用的方式是vim
,这种方式对于非常熟悉vim
命令的程序员来说是很方便的,但是对于我们大多数初学者很不友好。前面我们使用过IDEA
去编写Java
代码,这种方式十分高效,那么如果可以使用IDEA
去直接修改配置文件,那我们代码的编写效率就可以大大提升了。
在IDEA
中是有这样的功能的,接下来我们一起操作。
依次点击工具->部署->浏览远程主机
HA
(High Availablity
),即高可用(7 * 24
小时不中断服务)。HA
严格来说应该分成各个组件的HA
机制:HDFS
的HA
和YARN
的HA
。NameNode
主要在以下两个方面影响HDFS
集群NameNode
机器发生意外,如宕机,集群将无法使用,直到管理员重启。NameNode
机器需要升级,包括软件、硬件升级,此时集群也将无法使用。HDFS HA
功能通过配置多个NameNodes(Active/Standby)
实现在集群中对NameNode
的热备来解决上述问题。如果出现故障,如机器崩溃或机器需要升级维护,这时可通过此种方式将NameNode
很快的切换到另外一台机器。
Input ---> InputFormat --->Mapper--->Shuffle--->Reducer--->OutputFormat--->Output
Map阶段---->Reduce阶段
Map阶段 ---> Shuffle(Map后半段+Reduce前半段)--->Reduce阶段
MapTask
:map ---> sort
1 | mapPhase = getProgress().addPhase("map", 0.667f); |
ReduceTask
: copy ---> sort ---> reduce
1 | copyPhase = getProgress().addPhase("copy"); |