作者存档: LoserZhao - 第4页

Maven私服Nexus搭建

1. 环境及要求

unix系统
当前 CentOS6.5 64bit

JDK1.8
当前 1.8.0_25

2. 安装方式

2.1. 下载安装包

下载地址:https://www.sonatype.com/download-nexus-repo-oss?submissionG[……]

Read more

安装Nginx并配置TomcatHA

1. 环境

IP
系统版本
部署服务
端口

192.168.0.40
CentOS6.5_64
Nginx1.12.0
8088

192.168.0.41
CentOS6.5_64
apache-tomcat-7.0.64
18[……]

Read more

安装KeepAlived并配置NginxHA

1. 环境

IP
系统版本
部署服务
端口

192.168.0.40
CentOS6.5_64
Nginx1.12.0
18089

192.168.0.41
CentOS6.5_64
Nginx1.12.0
18089[……]

Read more

CentOS 7.2 静默安装Oracle 11gR2

1. 搭建本地源:

1.1. 加载 CentOS的ISO镜像并挂载:

1.2. 新建CentOS目录并把ISO上的文件复制到该目录下:

1.3. 修改y[……]

Read more

Spark Task的调度——源码分析

参考Blog

Spark源码分析——Task的调度

DAGScheduler.submitMissingTasks(stage: Stage, jobId: Int)
方法中的最后几行,有一个
taskScheduler.submitTasks(new TaskSet(
tas[......]

Read more

Spark资源调度算法——源码分析

描述

为了运行一个应用程序,Spark首先根据应用程序资源需求构建一个运行时环境,这是通过与资源管理器交互来完成的。通常而言,存在两种运行时环境构建方式:粗粒度和细粒度。

粗粒度

应用程序被提交到集群之后,它在正式运行任务之前,将根据应用程序资源需求一次性将这些资源凑齐,之后使用这些资源运行任[……]

Read more

SparkContext——TaskScheduler源码分析

环境

Spark 1.6.3

SparkContext的初始化变量

从SparkContext从上一直阅读初始化成员变量,发现在这一段,开始给 SchedulerBackend、TaskScheduler、 DAGScheduler进行初始化。
而初始化方式是

[crayon-6810f3c[……]

Read more

ElasticSearch 6.8.3 for CentOS6.5 安装

1. 集群环境及安装包

1.1. 集群环境

主机名
IP
系统版本
部署服务

hadoop32
192.168.0.32
CentOS6.5_64
ES Node

hadoop33
192.168.0.33
CentOS6.5_6[……]

Read more

Yarn的内存超出指定的 yarn.nodemanager.resource.memory-mb 的解决过程

背景

集群背景:48Core,256GMem,24台节点的集群。每台节点给Nodemanager分配了128G。

问题

结果一次大型任务运行时,150亿的表和400亿的表做join时,每台节点的内存居然100%打满了。我这里的100%是整个节点的100%,而我们给所有大数据的组件内存才不到20[……]

Read more

Hive UDF、UDAF、UDTF使用

1. 目录

[TOC]

2. UDF

注:UDF只能实现一进一出的操作,如果需要实现多进一出,则需要实现UDAF

3. UDAF

4. U[……]

Read more