百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

日志收集系统架构设计:(flume+zookeeper+kafka+php+mysql )

moboyou 2025-07-14 18:14 13 浏览



正文内容

  • 一、安装jdk
  • 二、安装flume
  • 三、安装kafka
  • 1、zookeeper
  • 2、kafka
  • 四、启动测试步骤
  • 五、目录说明
  • 六、日志收集系统设计图
  • 七、大数据参考资料推荐

一、安装jdk -(版本:1.8.0_191)

1.下载:


https://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html


解压:tar -zxvf
/jdk-8u191-linux-x64.tar.gz -C /home/ppgt/local/

2.修改 /etc/profile 增加:


export JAVA_HOME=/home/ppgt/local/jdk1.8.0_191

export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

export PATH=$PATH:$JAVA_HOME/bin

3.检测:


java -version

二、安装flume -(版本:1.8.0)

1.下载:


wget http://mirrors.hust.edu.cn/apache/flume/1.8.0/apache-flume-1.8.0-bin.tar.gz

2.解压安装:


tar -zxvf apache-flume-1.8.0-bin.tar.gz -C /home/ppgt/local/

3.验证安装:


bin/flume-ng version

4.修改配置 conf/:


cp flume-env.sh.template flume-env.sh

vi flume-env.sh

//配置java路径:export JAVA_HOME=
/usr/local/jdk/jdk1.8.0_191-amd64

5.添加连接kafka的配置文件:conf/flumetokafka.conf

#配置flume链接kafka

# 定义这个agent中各组件的名字


flume_kafka.sources = exec-sources

flume_kafka.sinks = kafka-sink

flume_kafka.channels = memory-channel

# Describe/configure the source

flume_kafka.sources.exec-sources.type = exec

flume_kafka.sources.exec-sources.command = tail -F /home/ppgt/tmpfile/testlogs/data.log

# Describe the sink

flume_kafka.sinks.kafka-sink.type = org.apache.flume.sink.kafka.KafkaSink

flume_kafka.sinks.kafka-sink.topic = topiclogs01

flume_kafka.sinks.kafka-sink.brokerList = localhost:9092

flume_kafka.sinks.kafka-sink.requiredAcks = 1

flume_kafka.sinks.kafka-sink.batchSize = 20

# Use a channel which buffers events in memory

flume_kafka.channels.memory-channel.type = memory

flume_kafka.channels.memory-channel.capacity = 1000

flume_kafka.channels.memory-channel.transactionCapacity = 100

# Bind the source and sink to the channel

flume_kafka.sources.exec-sources.channels = memory-channel

flume_kafka.sinks.kafka-sink.channel = memory-channel

三、安装kafka

1.安装依赖zookeeper -(版本:3.4.12)

1)下载:


wget http://mirror.bit.edu.cn/apache/zookeeper/stable/zookeeper-3.4.12.tar.gz

2)解压:


tar -zxvf zookeeper-3.4.12.tar.gz -C /home/ppgt/local/

3)修改数据存储目录:


conf/zoo.cfg

cp zoo_sample.cfg zoo.cfg

修改值:dataDir=
/home/ppgt/kafka_zk_tmp/tmp/zookeeper

2.安装kafka -(版本:0.9.0.0)

1)下载:


wget https://archive.apache.org/dist/kafka/0.9.0.0/kafka_2.11-0.9.0.0.tgz

2)解压:


tar -zxvf kafka_2.11-0.9.0.0.tgz -C /home/ppgt/local/

3)修改配置文件:config/server.properties


a) zookeeper.connect=localhost:2181 #zk服务地址

b) host.name=localhost #主机名

c) log.dirs=
/home/ppgt/kafka_zk_tmp/tmp/kafka-logs#kafka数据的存放地址

d) num.partitions=1 #分区数量

e) listeners=PLAINTEXT://:9092 #kafka监听端口

f) broker_id=0 #唯一标识id

四、启动测试步骤

1.启动zookeeper


bin/zkServer.sh start

2.启动flume


bin/flume-ng agent --conf conf --conf-file conf/flumetokafka.conf --name flume_kafka -Dflume.root.logger=INFO,console

3.启动kafka


//启动kafka服务

bin/kafka-server-start.sh /home/ppgt/local/kafka_2.11-0.9.0.0/config/server.properties

//创建一个topic

bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic topiclogs01

//创建一个kafka消费者

php /home/ppgt/www_test_ppgt_admin/syslogs_featrue_v1.0/script/cron/sysLogsConsumerRun.php

bin/kafka-console-consumer.sh --zookeeper localhost:2181 --topic topiclogs01 --from-beginning

//或者执行php消费者

//生产测试日志

echo '内容' exce >>
/home/ppgt/tmpfile/testlogs/data.log

五、目录说明

1./home/ppgt/local/


conf/zoo.cfg #配置文件

conf/flumetokafka.conf #连接kafka的配置文件

config/server.properties #配置文件

conf/flume-env.sh#配置文件

jdk1.8.0_191 #jdk安装目录

apache-flume-1.8.0-bin/#flume安装目录

kafka_2.11-0.9.0.0/ #kafka安装目录

zookeeper-3.4.12/ #zookeeper安装目录

2./home/ppgt/kafka_zk_tmp/tmp/


zookeeper/ #zookeeper数据存储目录

kafka-logs/ #kafka数据的存放地址

六、日志收集系统设计图


七、大数据资料文章推荐


相关推荐

一个时间选择器,为何大家都不相同

在自媒体平台的定时发布功能中,看似基础的时间选择器,在不同平台却呈现出显著差异——从时间范围限制、日期展示方式,到时间精度与交互布局,各平台设计均有侧重,这些差异背后,实则是对用户场景、操作便捷性...

全新生成模型「离散分布网络DDN」如何做到原理简单,性质独特?

本文作者杨磊,目前在大模型初创公司阶跃星辰担任后训练算法工程师,其研究领域包括生成模型和语言模型后训练。在这之前,他曾在旷视科技担任了六年的计算机视觉算法工程师,从事三维视觉、数据合成等方向。他于2...

大模型“记性差一点”反而更聪明!随机剔除token,让AI不再死记硬背

训练大模型时,有时让它“记性差一点”,反而更聪明!大语言模型如果不加约束,很容易把训练数据原封不动地复刻出来。为解决这个问题,来自马里兰大学、图宾根大学和马普所的研究团队提出了一个新方法——金鱼损失(...

彩票并非纯靠运气!老彩民绝不会告诉你的,五个选号笨办法!

在许多人眼里,购买彩票纯粹是一场与命运的对赌,完全依赖于那缥缈的运气。然而,真正深入其中的老彩民们却深知,虽然最终的开奖号码随机,但在选号的过程中,确实存在一些值得琢磨的“门道”。这些方法看似“笨拙”...

老程序员爱用AI写代码:调查显示三成资深工程师一半代码靠AI生成

IT之家9月8日消息,一项新调查深入剖析了生成式人工智能(GenAI)对软件开发者日常工作的变革作用。结果显示,不同资历的工程师呈现出明显分化:资深工程师更倾向于大量使用AI生成代码,主动...

告别手动!4种批量建Excel,省时还不出错

你是不是也遇到过这种情况:月底要做报表,要给每个部门单独建一个Excel;项目汇总,每个客户都得生成一份数据文件。光是新建、命名、保存这一套流程,就得重复几十遍。鼠标点到手酸,眼睛还得紧盯着生怕出错,...

财务多个发票凑一个金额,花了1天,同事用Excel2分钟搞定

我们现在有很多发票金额,如下是模拟的数据,这里有10张发票然后总金额是固定的,是由以下的发票金额凑起来正好的数值也不确定具体是几张发票凑起来的现在需要快速的将它们找出来,正好凑好总金额遇到这种凑金额的...

调和随机数的混沌_随机调配

编者按本文来自作家、游戏智慧(Game-Wisdom.com)创始人乔希·拜瑟(JoshBycer)的个人博客,由indienova取得授权并译制发表,原文链接见文末。正文随机数生成(Rando...

大模型“记性差一点”反而更聪明,金鱼损失随机剔除token,让AI不再死记硬背

训练大模型时,有时让它“记性差一点”,反而更聪明!大语言模型如果不加约束,很容易把训练数据原封不动地复刻出来。为解决这个问题,来自马里兰大学、图宾根大学和马普所的研究团队提出了一个新方法——金鱼损失(...

彩票店老板绝不会告诉你的十个选号潜规则!早知道早中奖!

每天都有无数彩民走进彩票店,怀揣着梦想购买一两注彩票。你可曾想过,那些看似随机的数字背后,可能隐藏着一些不为人知的"潜规则"?经过多方打探和走访,我们终于整理出彩票店老板绝不会主动告诉...

Excel数据重塑利器:WRAPROWS和WRAPCOLS函数详解

WRAPROWS和WRAPCOLS是ExcelforMicrosoft365中引入的两个新函数,它们能够将单行或单列的数据按照指定的方式重新排列成多行多列的二维数组。WRAPROWS:...

生成式AI不是“通用智能”,而是“工具革命”:企业落地的3个关键思考

从ChatGPT到Midjourney,生成式AI的“魔法”正在席卷各行各业。但在热潮之下,我们更需要冷静思考:它真的具备“智能”吗?其实,生成式AI不是通用智能的雏形,而是一场信息处理方式的“工具革...

建议收藏!BigemapPro 快捷命令+函数公式大全,效率直接拉满

在使用BigemapPro处理地理数据时,熟练掌握快捷命令和函数公式能极大提升工作效率,告别重复操作,让你的地图编辑、数据处理更高效。今天,就为大家整理了一份超全的BigemapPro实用技巧,涵盖常...

Excel制作小型抽奖系统,可以内定结果,拿去用

“年会抽奖还能内定?别笑,我亲眼见过。”这句话一出,会议室瞬间安静,老板都忍不住探头。其实内定不是黑幕,而是技术——Excel就能搞定。三分钟搭好,零代码基础也能玩得飞起,关键是还能让全场嗨到尖叫。先...

告别加班!27个Excel新函数全面升级你的工作效率,新手必看!

今天我要为大家带来27个Excel新函数全面解析,这些都是微软近年来推出的重磅功能,能够让你的工作效率提升十倍不止!一、动态数组革命:彻底改变Excel计算方式FILTER函数-按条件筛选数据=F...