如何在VMware上部署Hadoop

本文主要讲述如何在虚拟机(VM)上部署Hadoop,因为虚拟化技术很多家都有,但本文讨论的是VMware。建议阅读人群为:系统管理员,架构师或者开发人员。 无论你是在vSphere上新建Hadoop集群还是重构现有基于裸机的环境,都可以参考这篇文章。根据业务场景的特定需求和可用资源,你还可以参考文中的几种部署方式。

数据复制工具Replication Server 6.2应用测试

Replication Server是Enterprisedb 开发的一种软件产品,可以实现复制,其目的是使数据的副本从一个位置到另一个位置,并确保所复制的数据是和原来一样随着时间的推移同步,应用于Oracle,SQL Server,PostgreSQL和AdvancedServer数据库管理系统的表。

Kubernetes网络的常见故障及排查手册

随着云计算的兴起,各大平台之争也落下了帷幕,Kubernetes作为后起之秀已经成为了事实上的PaaS平台标准,而网络又是云计算环境当中最复杂的部分,总是让人琢磨不透。网络可以说是 Kubernetes 部署和使用过程中最容易出问题的部分之一,最主要原因在于对网络技术非常熟悉的人员本来就相对较少,和Kubernetes结合后能彻底将网络掌握透彻就更不容易。如此一来,用户在部署使用Kubernetes的过程中经常遇到一些网络问题,而排查与修复起来又不容易。在本文中,我们将分享Kubernetes网络较为常见的几种故障类型,详解失败的情况、如何诊断问题所在、以及如何修复。

postgresql 高可用 etcd + patroni 之haproxy+keepalived

代理的作用:web缓存(加速)、反向代理、内容路由(根据流量及内容类型等将请求转发至特定服务器)、转码器(将后端服务器的内容压缩后传输给client端)。缓存的作用:减少冗余内容传输;节省带宽、缓解网络瓶颈;降低了对原始服务器的请求压力,降低了传输延迟。

公有云中的Hadoop

信息驱动型企业一直坚持统一数据管理的共同业务和IT目标,提高洞察力和构建知识库。对于许多企业来说,传统的关系型数据仓库和数据集市是唯一的企业级数据分析的途径,而存储阵列和归档是唯一提供访问大量多样历史数据的方法。今天,这些企业通过EDH有更好的办法来应对数据管理的挑战。Cloudera企业数据中心采用Apache Hadoop构建,提供灵活,可扩展和经济的数据管理平台,可以基于同一份数据执行各种企业工作负载(包括批处理,交互式SQL,企业搜索,高级分析等)。

数据加载工具EDB_Loader应用测试

EDB * Loader是一种高性能的批量数据加载器,它提供EDB Advanced Server与Oracle数据库兼容的接口,功能包括: 1、支持Oracle SQL * Loader数据加载方法-常规路径加载,直接路径加载和并行直接路径加载; 2、与Oracle SQL * Loader兼容的控制文件指令的语法; 3、输入数据,以定界符分隔或固定宽度的字段; 4、收集拒绝记录的文件错误; 5、加载多个目标表;