Springboot系列之kafka操作 kafka简介 ApacheKafka®是一个分布式流媒体平台。有三个关键功能: 发布和订阅记录流,类似于消息队列或企业消息传递系统。 以容错的持久方式存储记录流。 记录发生时处理流。 Kafka通常用于两大类应用: 构建可在系统或应用程序之间可靠获取数据的实时流数据管道 构建转换或响应数据流的实时流应用程序 kafka概念 (1)什么是流处理? 所谓流处理,我的理解是流水线处理。例如,电子厂每个人负责一个功能,来了就处 理,不来就等着。 (2)partition和repl…

2020年11月19日 0条评论 161点热度 阅读全文

Kafka是一种高吞吐量的分布式发布订阅消息系统,有如下特性: 通过O(1)的磁盘数据结构提供消息的持久化,这种结构对于即使数以TB的消息存储也能够保持长时间的稳定性能。高吞吐量:即使是非常普通的硬件Kafka也可以支持每秒数百万的消息。支持通过Kafka服务器和消费机集群来分区消息。支持Hadoop并行数据加载。 Springboot的基本搭建和配置我在之前的文章已经给出代码示例了,如果还不了解的话可以先按照 SpringMVC配置太多?试试SpringBoot 进行学习哦。 那么如今很火的Springboot与…

2020年11月18日 0条评论 146点热度 阅读全文

慕课网《Kafka流处理平台》学习总结 时间:2018年09月09日星期日 说明:本文部分内容均来自慕课网。@慕课网:https://www.imooc.com 教学源码:无 学习源码:https://github.com/zccodere/s... 第一章:课程介绍 1-1 课程介绍 课程介绍 Kafka概念解析 Kafka结构设计 Kafka场景应用 Kafka高级特性 第二章:概念解析 2-1 发展背景 LinkedIn 开源 Databus 分布式数据同步系统 Cubert 高性能计算引擎 ParSeq J…

2020年11月18日 0条评论 144点热度 阅读全文

序列化 kafka序列化消息是在生产端,序列化后,消息才能网络传输。而构造KafkaProducer代码如下: Properties props = new Properties(); props.put("bootstrap.servers", "10.0.55.229:9092"); props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer"); props.put("value.serializer"…

2020年11月14日 0条评论 17点热度 阅读全文

序 kafka呢其实正道不是消息队列,本质是日志存储系统,而stream processing是其最近大力推广的特性,本文简单介绍下word count的实例。 maven <dependency> <groupId>org.apache.kafka</groupId> <artifactId>kafka-streams</artifactId> <version>0.10.2.1</version> </dependency…

2020年11月13日 0条评论 149点热度 阅读全文

​ Kafka是由LinkIn开源的实时数据处理框架,目前已经更新到2.3版本。不同于一般的消息中间件,Kafka通过数据持久化和磁盘读写获得了极高的吞吐量,并可以不依赖Storm,SparkStreaming的流处理平台,自己进行实时的流处理。 ​ Kakfa的Offset机制是其最核心机制之一,由于API对于部分功能的实现,我们有时并没有手动去设置Offset,那么Kafka到底有几个Offset呢? 一、生产者Offset ​ 首先,我们先来看生产者的offset,我们知道Kafka是通过生产者将消息发送给某…

2020年11月13日 0条评论 197点热度 阅读全文

前言 作为消息中间件,Kafka用以服务消息的异步传输功能和JMS类似:生产者把消息放进队列中,消费者从队列中获取数据但是实现起来却是完全不一样 Kafka流程结构图 1.Producer是通过连接Broker来发送消息的2.Producer是向某个Topic来传递送消息的3.发送到Topic中的消息是可以给不同Broker处理的4.Consumer是连接到某个Broker来监听订阅的Topic的5.Brokers是通过Zookeeper来进行管理的,并互相通知各自的运行情况6.如果Producer或Consume…

2020年11月11日 0条评论 167点热度 阅读全文

自己手写了一个监测kafka lag值的shell脚本。之前是用python写的,感觉比较麻烦,这里写了一个shell版的,大家可以直接拿来使用。 cd /usr/share/kafka/kafka_2.11-2.4.1/ || exit 1 lag=$(./bin/kafka-consumer-groups.sh --bootstrap-server localhost:9092 --describe --group my_group 2>/dev/null|grep -v GROUP|awk 'NR>…

2020年11月11日 0条评论 142点热度 阅读全文

前言 从字面意思理解就是数据不需要来回的拷贝,大大提升了系统的性能;这个词我们也经常在javanio,netty,kafka,RocketMQ等框架中听到,经常作为其提升性能的一大亮点;下面从I/O的几个概念开始,进而在分析零拷贝。 I/O概念 1.缓冲区 缓冲区是所有I/O的基础,I/O讲的无非就是把数据移进或移出缓冲区;进程执行I/O操作,就是向操作系统发出请求,让它要么把缓冲区的数据排干(写),要么填充缓冲区(读);下面看一个java进程发起read请求加载数据大致的流程图: 进程发起read请求之后,内核接…

2020年11月10日 0条评论 125点热度 阅读全文

1.kafka配置文件 解压kafka的安装包后,在conf目录下server.properties #broker 的全局唯一编号,在kafka集群中不能重复,为整型数字 broker.id=0 #开启删除topic功能 delete.topic.enable=true #处理网络请求的线程数量 num.network.threads=3 #用来处理磁盘 IO 的现成数量 num.io.threads=8 #发送套接字的缓冲区大小 socket.send.buffer.bytes=102400 #接收套接字的缓冲…

2020年11月6日 0条评论 226点热度 阅读全文