2KB项目,专业的源码交易网站 帮助 收藏 每日签到

怎么构建最好的 Hadoop 集群

  • 时间:2019-04-09 09:25 编辑:2KB 来源:2KB.COM 阅读:467
  • 扫一扫,手机访问
  • 分享
摘要:
Hadoop 英文原文:How To Build Optimal Hadoop Cluster

序文

数据库和文件中贮存的数据量天天都在增加,因而我们需求构建可以贮存大量数据(“大数据”),而且便宜、可保护、可伸缩的情况。传统的关系数据库(RDBMS)系统在以后的需求下本钱太高而且不成伸缩,因而开发、运用可以知足需求的新技术正应时宜。

在这些标的目的中,云计算是此中一项抢先的技术。云计算有很多分歧的完成,我们选择的是Hadoop,这是一个具有Apache答应、基于Google Map Reduce的框架。

在本文中,我将测验考试阐明怎么构建一个可伸缩的Hadoop集群,以存储、索引、检索和保护实际上无限容量的数据。

本文将逐渐引见这些部分的装置和设置装备摆设:

  • 收集系统构造
  • 操作系统
  • 硬件请求
  • Hadoop软件装置/设置

收集架构

依据我们今朝可以拿到的文档,可以以为云内的节点越在物理上靠近,越能取得更好的功能。依据经历,收集延时越小,功能越好。

为了减少布景流量,我们为这个云创立了一个虚拟专用网。别的,还为使用Server们创立了一个子网,作为拜访云的进口点。

这个虚拟专用网的估计时延约莫是1-2毫秒。如许一来,物理邻近性就不再是一个问题,我们应当经过情况测试来验证这一点。

建议的收集架构:

  • 专用TOR(Top of Rack)交流机
  • 运用专用中心交流刀片或交流机
  • 确保使用Server“接近”Hadoop
  • 思索运用以太网绑定
Hadoop Cluster Network Architecture

图1 - Hadoop集群的收集架构

操作系统

我们选择Linux作为操作系统。Linux有很多分歧的刊行版,包含Ubuntu、RedHat和CentOS等,不管选择哪个都可以。基于支撑和答应用度的思索,我们终极选择了CentOS 5.7。最好是定制一个CentOS的映像,把那些需求的软件都预装出来,如许一切的机械可以包括类似的软件和Tools,这是一个很好的做法。

依据Cloudera的建议,OS层应当采取以下设置:

  • 文件系统
        Ext3文件系统
        撤消atime
        不要运用逻辑卷治理
  • 应用alternatives来治理链接
  • 运用设置装备摆设治理系统(Yum、Permission、sudoers等)
  • 减少内核交流
  • 撤消普通用户拜访这些云计算机的权限
  • 不要运用虚拟化
  • 最少需求以下Linux号令:
        /etc/alternatives
        ln、chmod、chown、chgrp、mount、umount、kill、rm、yum、mkdir


硬件请求

因为Hadoop集群中只要两种节点(Namenode/Jobtracker和Datanode/Tasktracker),因而集群内的硬件设置装备摆设不要超越两种或三种。

图2 - Hadoop集群Server脚色

硬件建议:

  • Namenode/Jobtracker:1Gb/s以太网口x2、16GB内存、4个CPU、100GB磁盘
  • Datanode:1Gb/s以太网口x2、8GB内存、4个CPU、多个磁盘,总容量500GB以上
实践的硬件设置装备摆设可以与我们建议的设置装备摆设分歧,这取决于你们需求存储和处置的数据量。但我们激烈建议不要在集群中混用分歧的硬件设置装备摆设,以避免那些较弱的机械成为系统的瓶颈。 本文中的一切译文仅用于进修和交换目标,转载请务必注明文章译者、出处、和本文链接。 2KB翻译任务按照 CC 协议,假如我们的任务有进犯到您的权益,请实时联络我们。


2KB项目(www.2kb.com,源码交易平台),提供担保交易、源码交易、虚拟商品、在家创业、在线创业、任务交易、网站设计、软件设计、网络兼职、站长交易、域名交易、链接买卖、网站交易、广告买卖、站长培训、建站美工等服务

  • 全部评论(0)
资讯详情页最新发布上方横幅
最新发布的资讯信息
【计算机/互联网|】Nginx出现502错误(2020-01-20 21:02)
【计算机/互联网|】网站运营全智能软手V0.1版发布(2020-01-20 12:16)
【计算机/互联网|】淘宝这是怎么了?(2020-01-19 19:15)
【行业动态|】谷歌关闭小米智能摄像头,因为窃听器显示了陌生人家中的照片(2020-01-15 09:42)
【行业动态|】据报道谷歌新闻终止了数字杂志,退还主动订阅(2020-01-15 09:39)
【行业动态|】康佳将OLED电视带到美国与LG和索尼竞争(2020-01-15 09:38)
【行业动态|】2020年最佳AV接收机(2020-01-15 09:35)
【行业动态|】2020年最佳流媒体设备:Roku,Apple TV,Firebar,Chromecast等(2020-01-15 09:31)
【行业动态|】CES 2020预览:更多的流媒体服务和订阅即将到来(2020-01-08 21:41)
【行业动态|】从埃隆·马斯克到杰夫·贝佐斯,这30位人物定义了2010年代(2020-01-01 15:14)
联系我们

Q Q: 7090832

电话:400-0011-990

邮箱:7090832@qq.com

时间:9:00-23:00

联系客服
商家入住 服务咨询 投拆建议 联系客服
0577-67068160
手机版

扫一扫进手机版
返回顶部