`
dajuezhao
  • 浏览: 59788 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

分布式集群中的硬件选择

阅读更多

一、背景

最近2个月时间一直在一个阴暗的地下室的角落里工作,主要内容就是hadoop相关的应用。在这期间,Hadoop的应用确实得到认可,但是同时也带来了一些问题,软件方面我就不在这里说了,只说说一些物理方面的局限:

1、众所周知,hadoop能够接受任何类型的机器加入集群,在多不在精。但是这带来一个问题,机房的空间开销以及电费。

2、机器太多,人力维护成本也是增加的。机柜啊、物理空间都是个不小的负担和开销。

刚好,在这个问题产生的同时,十分幸运的被一同事叫出来,去参加一个会议,得以有机会走上地面。这个会议是个联合性质的,多个公司的人在一起。其中有一家公司在海量数据计算方面力推hadoop,并做了比较好的配套开发工作。比如工作流、数据清洗过滤、输出数据管理等。其实这些应用模型都大同小异。但最引起我关注的是他们的硬件方面的选型,确实很有新意(当然,可能由于我对硬件不熟悉,说的不对还望朋友们别笑话)。

二、具体内容

在昨天会议上,对方提到了自己采用的硬件设备,能很好的解决物理空间和维护成本的问题(当然,我也碰到不在乎空间和电费的主。地方有的是,就是希望把以前淘汰的机器都用上)。他们的机器类型是一款2U的设备,在这个2U的机器上集成了4块主板,12块硬盘。什么意思呢,说白了,就是把4台机器集成到了一个2U的设备上。除了电源共用(没问电源多少瓦的,一激动,忘记问了),其他都是独立的。这样的机器类型大大的节约了物理空间。试想一下,一个机柜10台2U设备,传统的只能存放10台节点机器。如果换成这样的2U设备,可以存放4×10=40台节点机器,空间利用缩小,这样的机器我觉得还是很客观的。

三、总结

1、我不是在做广告,只是觉得这样的硬件类型确实是很适合hadoop集群的使用。

2、硬件方面我不是很熟悉,可能熟悉硬件的朋友对这个都比较了解了,所以我说错了还望指出来。

3、分布式计算的集群确实可以很好的解决海量计算问题,但是带来规模庞大的硬件数量确实在空间和电费上是个挑战。

4、写的不对或是有争议的地方,随时欢迎大家发邮件讨论:dajuzhao@gmail.com

分享到:
评论

相关推荐

    hadoop全分布式集群配置

    Hadoop实现了一个分布式文件系统...本课程讲解搭建hadoop集群的全过程,从安装vmware,centos开始,从本地模式,伪分布式到全分布式,讲解实现经典案例wordcount结束,全方位讲解hadoop的操作细节,带你完成hadoop的安装和入门

    集群与分布式的区别

    集群与分布式的区别 单机结构我想大家最最最熟悉的就是单机结构,一个系统业务量很小的时候所有的代码都放在一个项目中就好了,然后这个项目部署在一台服务器...

    Hadoop-搭建分布式集群.docx

    充分利用集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量...

    部署全分布模式Hadoop集群 实验报告

    本实验所需的软硬件环境包括 PC、VMware Workstation Pro、CentOS 安装包、Oracle JDK 安装包、Hadoop 安装包。 三、实验内容 1. 规划部署。 2. 准备机器。 3. 准备软件环境:配置静态 IP;修改主机名;编辑域名...

    架构高性价比的分布式计算机集群

    正如你所看到的一样,你的机器在绝大多数时间是空闲的,如果你在Windows下用任务...集群中的节点需要硬件尽可能的一致,不一致的硬件集群称为异构集群,虽然这并不能改变集群的特性,但是异构导致集群会花费额外的时间

    分布式与集群的区别是什么?

    在IDF05(Intel Developer Forum 2005)上,Intel首席执行官Craig Barrett就取消4GHz芯片计划一事,半开玩笑当众单膝下跪致歉,给广大软件开发者一个明显的信号,单纯依靠垂直提升硬件性能来提高系统性能的时代已...

    开源电子商务项目,SpringBoot+Dubbo技术栈实现微服务,实现一款分布式集群的电商系统

    【项目资源】:包含前端、后端、移动开发、操作系统、人工智能、物联网、信息化管理、数据库、硬件开发、大数据、课程资源、音视频、网站开发等各种技术项目的源码。包括STM32、ESP8266、PHP、QT、Linux、iOS、C++、...

    ZooKeeper分布式环境搭建详解.pdf

    下面将详细介绍如何在分布式环境中搭建ZooKeeper集群。 一、准备环境 硬件和软件要求 服务器:建议至少3台服务器(因为ZooKeeper集群至少需要3个节点以提供容错性)。 操作系统:支持Linux、Unix和Windows等操作...

    Fourinone分布式计算框架

    ade的解决方案去解决大集群的分布式缓存,利用硬件负载均衡路由到一组fa?ade服务器上,fa?ade可以自动为缓存内容生成key,并根据key准确找到散落在背后的缓存集群的具体哪台服务器,当缓存服务器的容量到达限制时,...

    毕设&课设&项目&实训-计算机基础知识:操作系统、数据库、数据结构与算法、分布式集群、大数据、软件工程、设计模式.zip

    包含前端、后端、移动开发、操作系统、人工智能、物联网、信息化管理、数据库、硬件开发、大数据、课程资源、音视频、网站开发等各种技术项目的源码。 包括STM32、ESP8266、PHP、QT、Linux、iOS、C++、Java、python...

    详细高级分布式系统简答题

    - 资源共享:分布式操作系统能够管理和共享分布式系统中的硬件和软件资源,例如处理器、内存、磁盘等。 - 透明性:分布式操作系统提供透明性,使得分布式系统中的各个节点对用户来说就像是一个单一的系统,用户无需...

    数据源管理 分布式NoSQL系统,Cassandra集群管理.docx

    1、基础描述 Cassandra是一套开源分布式NoSQL数据库系统。它最初由Facebook开发,用于储存收件箱等简单格式...它允许添加更多的硬件以适应更多的客户和更多的数据根据要求,可以根据业务的数据流量轻松扩展集群规模。

    Fourinone分布式并行计算四合一框架

    ade的解决方案去解决大集群的分布式缓存,利用硬件负载均衡路由到一组fa?ade服务器上,fa?ade可以自动为缓存内容生成key,并根据key准确找到散落在背后的缓存集群的具体哪台服务器,当缓存服务器的容量到达限制时,...

    Hadoop完全分布式配置.txt

    当首次解压Hadoop的源码包时,Hadoop无法了解硬件安装环境,便保守地选择了最小配置。在这种默认模式下所有3个XML文件均为空。当配置文件为空时,Hadoop会完全运行在本地。因为不需要与其他节点交互,单机模式就不...

    hadoop完全分布式

    hadoop完全分布式的集群搭建 硬件环境 两台虚拟机 linux的Ubuntu10.10的系统 hadoop0.20.2

    谷歌分布式领域三大论文合集(GFS、MapReduce、BigTable)

    2. 紧随其后的就是2004年公布的 MapReduce论文,论文描述了大数据的分布式计算方式,主要思想是将任务分解然后在多台处理能力较弱的计算节点中同时处理,然后将结果合并从而完成大数据处理。 3. 最后就是谷歌发布于...

    分布式无线农业信息采集系统的设计与实现

    提出了一种基于nRF905的前端分布式无线传感器采集系统,将农业信息采集后无线传输至中 心节点,由其经GSM网络转发至数据中心的决策支持系统进行数据处理和图形化显示,以辅助决策。 介绍了无线采集终端的硬件设计,分析...

    集群、负载均衡及分布式系统架构

    集群中所有的节点都处于活动状态,它们分摊系统的工作负载。一般Web服务器集群、数据库集群和应用服务器集群都属于这种类型。负载均衡集群一般用于相应网络请求的网页服务器,数据库服务器。这种集群可以在接到请求...

    分布式关系型数据库:它基于Paxos协议和分布式架构,实现了高可用性和线性扩展,可以运行在常见的服务器集群上

    OceanBase是由蚂蚁集团自主研发的分布式关系型数据库。它基于Paxos协议和...OceanBase数据库可以运行在常见的服务器集群上,不依赖特殊的硬件架构。该项目旨在提供可靠的关系型数据库解决方案,适用于企业级应用。

Global site tag (gtag.js) - Google Analytics