张士玉小黑屋

一个关注IT技术分享，关注互联网的网站，爱分享网络资源，分享学到的知识，分享生活的乐趣。

当前位置：首页 » 《随便一记》 » 正文

通过FlinkCDC将MySQL中变更的数据写入到kafka_不会打球的摄影师不是好程序员

4 人参与 2022年06月02日 08:36 分类 : 《随便一记》评论

点击全文阅读

文章目录

前言
一、CDC的种类？
二、通过FlinkCDC将数据从MySQL导入到Kafka
- 1.核心代码
- 2.工具类
- 三、结果展示
3.可能会出现的错误及解决
- 解决：

前言

CDC的Change Data Capture（变更数据捕获）的缩写

FlinkCDC的核心思想是监测并捕获数据库的变动（包括数据或数据表的插入、更新以及删除等），将这些变更按发生的顺序完整记录下来，写入到消息中间件中以供其他服务进行订阅及消费。

一、CDC的种类？

CDC 主要分为基于查询和基于 Binlog 两种方式，简述两者的区别：

	基于查询的CDC	基于binlog的CDC
常见的组件	Sqoop	Maxwell、Canal、Debezium
思想	Batch	Streaming
延迟性	高	低
是否可以捕获所有数据变化	否	是

Flink 社区开发了 flink-cdc-connectors 组件，这是一个可以直接从 MySQL、PostgreSQL 等数据库直接读取全量数据和增量变更数据的 source 组件。

二、通过FlinkCDC将数据从MySQL导入到Kafka

1.核心代码

：

import com.alibaba.ververica.cdc.connectors.mysql.MySQLSource;
import com.alibaba.ververica.cdc.connectors.mysql.table.StartupOptions;
import com.alibaba.ververica.cdc.debezium.DebeziumSourceFunction;
import com.atguigu.app.function.CustomerDeserialization;
import com.atguigu.utils.MyKafkaUtil;
import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;


public class FlinkCDC {
    public static void main(String[] args) throws Exception {

        //1.获取执行环境
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        env.setParallelism(1);

        //2.flinkcdc构建SourceFunction
        DebeziumSourceFunction<String> sourceFunction = MySQLSource.<String>builder()
                .hostname("hadoop101")
                .port(3306)
                .username("root")
                .password("123456")
                .databaseList("gmall-flink")
                .tableList("gmall-flink.base_trademark")
                .deserializer(new CustomerDeserialization())
                .startupOptions(StartupOptions.latest())
                .build();
        DataStreamSource<String> streamSource = env.addSource(sourceFunction);

        //3.打印数据并将数据写入kafka
        streamSource.print();
        String sinkTopic = "ods_base_db";
        streamSource.addSink(MyKafkaUtil.getKafkaProducer(sinkTopic));

        //4.启动任务
        env.execute("FlinkCDC");

    }
}

2.工具类

import org.apache.flink.api.common.serialization.SimpleStringSchema;
import org.apache.flink.streaming.connectors.kafka.FlinkKafkaProducer;

public class MyKafkaUtil {

    public static FlinkKafkaProducer<String> getKafkaProducer(String topic){

        return new FlinkKafkaProducer<String>("192.168.2.101:9092", topic, new SimpleStringSchema());
    }
}

三、结果展示

我在MySQL数据库中每变更一条数据，在IDEA和kafka这边都可以检测到：
IDEA:
在这里插入图片描述
Kafka：

3.可能会出现的错误及解决

org.apache.kafka.common.errors.TimeoutException: Topic ods_base_database not present in metadata after 60000 ms

解决：

1.vi kafka/config.server.properties
在这里插入图片描述
修改这三个地方，切记用IP地址，之前用的hadoop101一直出错

2.重启kafka，重启zookeeper，问题解决！

点击全文阅读

本文链接：http://zhangshiyu.com/post/41208.html

数据解决变更

全家夺我军功，主母重生丧夫丧子全书白玉禾萧聿在线2025-08-23 13:40
重逢后，他掐断了我所有桃花全书江瓷顾沉舟在线2025-08-23 13:22
咸鱼翻身从刷开始（柳如烟李诗琪）_咸鱼翻身从刷开始柳如烟李诗琪2025-08-23 12:10
完结文老婆把女儿送给师弟练手后，后悔疯了列表_完结文老婆把女儿送给师弟练手后，后悔疯了（沈安姜向玉）2025-08-22 18:22

评论（0）

赞助本站

search zhannei

最新文章
裴少的心尖怂妻（时雅时蕙）_裴少的心尖怂妻时雅时蕙 撕碎99份离婚协议，贺总变疯狗（宋晚栀司珩）_撕碎99份离婚协议，贺总变疯狗 雪尽无闻旧时欢（云彻应云彻）_雪尽无闻旧时欢（云彻应云彻） 八零我有一个随身图书馆（苏小小南瓜）全书浏览_八零我有一个随身图书馆全书浏览 军婚有氧（景栀傅郁峥） 好看的唐兮辞许淮远_唐兮辞许淮远 舅妈求我接手表哥公司后，我喜提2000多万负债明瑶温玥向东完本_舅妈求我接手表哥公司后，我喜提2000多万负债（明瑶温玥向东） 全家夺我军功，主母重生丧夫丧子全书白玉禾萧聿在线 你是我痛绞心扉的遗书顾寒阳秦墨完本_你是我痛绞心扉的遗书（顾寒阳秦墨） 重逢后，他掐断了我所有桃花全书江瓷顾沉舟在线 咸鱼翻身从刷开始（柳如烟李诗琪）_咸鱼翻身从刷开始柳如烟李诗琪 影帝求我别离婚，我转身去了对家列表_影帝求我别离婚，我转身去了对家(季淮顾言陆景行)

关于我们 | 我要投稿 | 免责申明