虽然宝塔面板主要用于Web服务器管理,但也可以用来辅助搭建大数据平台。以下是详细步骤:
服务器要求:
系统要求:
通过宝塔面板"软件商店"安装:
或手动安装:
# CentOS
yum install java-1.8.0-openjdk-devel
# Ubuntu
apt install openjdk-8-jdk
配置环境变量:
echo 'export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk' >> /etc/profile
echo 'export PATH=$JAVA_HOME/bin:$PATH' >> /etc/profile
source /etc/profile
wget https://downloads.apache.org/hadoop/common/hadoop-3.3.1/hadoop-3.3.1.tar.gz
tar -xzvf hadoop-3.3.1.tar.gz -C /usr/local/
mv /usr/local/hadoop-3.3.1 /usr/local/hadoop
编辑 /usr/local/hadoop/etc/hadoop/hadoop-env.sh
:
export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk
编辑 /usr/local/hadoop/etc/hadoop/core-site.xml
:
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://主节点IP:9000</value>
</property>
</configuration>
编辑 /usr/local/hadoop/etc/hadoop/hdfs-site.xml
:
<configuration>
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>/usr/local/hadoop/data/namenode</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>/usr/local/hadoop/data/datanode</value>
</property>
</configuration>
编辑 /usr/local/hadoop/etc/hadoop/workers
,添加所有从节点IP或主机名。
# 格式化NameNode(仅在首次启动时执行)
hdfs namenode -format
# 启动HDFS
start-dfs.sh
wget https://downloads.apache.org/spark/spark-3.1.2/spark-3.1.2-bin-hadoop3.2.tgz
tar -xzvf spark-3.1.2-bin-hadoop3.2.tgz -C /usr/local/
mv /usr/local/spark-3.1.2-bin-hadoop3.2 /usr/local/spark
编辑 /usr/local/spark/conf/spark-env.sh
:
export SPARK_MASTER_HOST=主节点IP
export SPARK_WORKER_MEMORY=4g
export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk
export HADOOP_CONF_DIR=/usr/local/hadoop/etc/hadoop
编辑 /usr/local/spark/conf/workers
,添加所有从节点IP或主机名。
/usr/local/spark/sbin/start-all.sh
端口开放:
计划任务:
文件管理:
/usr/local/hadoop/logs
/usr/local/spark/logs
验证Hadoop:
hdfs dfs -mkdir /test
hdfs dfs -ls /
验证Spark:
/usr/local/spark/bin/spark-shell
Web UI访问:
http://服务器IP:50070
http://服务器IP:8080
多节点配置时,确保所有节点:
资源分配:
/usr/local/hadoop/etc/hadoop/yarn-site.xml
安全考虑:
端口冲突:
netstat -tulnp
查看占用端口权限问题:
内存不足:
如需更复杂的生产环境部署,建议使用专业的大数据平台管理工具如Ambari或Cloudera Manager。