宣讲家网站官德修养与作风建设洛阳网站建设
目录
01-2023年02月-月度考核
2月份完成项目情况
2月份学习情况
3月份学习计划
02-2023年03月-月度考核
01-2023年02月-月度考核
2月份完成项目情况
MySQL数据同步到ElasticSearch任务进展:
通过logstash加载mysql.conf配置文件的方式实现了
在MySQL数据库进行增改后于一分钟内将数据状态同步至ES中。
2月份学习情况
本月主要学习了以下内容:
①ElasticSearch:索引库维护、集群、Postman工具的使用、Java客户端操作索引库、SpringData操作ES集群②Springboot+ElasticSearch构建博客检索系统,logstash与kibana的安装及使用。③Hadoop:MapReduce、HDFS、Hive、FineBI实现可视化报表。
3月份学习计划
本月计划学习以下内容:
①主要学习内容①Logstash实现MySQL与ES的数据同步,在MySQL数据库中进行增删改操作后,数据状态能够及时反馈至ES中;②Logstash获取es日志文件后,将数据以json格式输出到es中进行存放;③SpringData操作ElasticSearch;④在linux上部署es。②次要学习内容①Apache Spark,大数据快速计算引擎;②SVN、Git、Docker,项目版本管理工具、项目打包。
02-2023年03月-月度考核
Linux服务器中MySQL数据库数据同步ElasticSearch
①安装线上运行版本的软件:jdk11、elk-8.5.1(es、logstash、kibana)、node.js-14.21.3、esHead插件;②连接线上测试数据库进行测试:通过logstash加载配置文件的方式,将MySQL数据同步到es中,并在kibana中进行查看到了数据增改的同步效果;③拍摄虚拟机快照保存虚拟机状态;④详细记录elk安装过程及启动步骤。
①Git①Git简介及安装使用;Git连接远程仓库;Git分支;②Linux①Windows安装Ubuntu版本Linux系统;②复习Linux常用命令;③复习Linux用户和权限知识点;④复习Linux实用操作;⑤Linux系统软件安装。③Hadoop①Hadoop集群搭建,scp命令、集群常用脚本。②Hadoop-HDFS,客户端API。③Hadoop-MapReduce,MR序列化。④Hadoop-Yarn,生产环境核心参数配置、配置多队列的容量调度器。⑤Hadoop-生产调优手册,HDFS集群压测。
01、Hadoop
①复习hadoop中的重要知识点,重点复习HDFS、MapReduce、Yarn的使用。②阅读书籍《 Hadoop权威指南_第四版_中文版》,以便对hadoop有更深的理解。
02、Spark(重点学习内容)
Spark 是一种基于内存的快速、通用、可扩展的大数据分析计算引擎。学习spark教程,重点掌握以下内容:
①Spark Core;②Spark SQL;③Spark Streaming;④Spark Mllib;⑤Spark GraphX。
Apache Flink是一个框架和分布式处理引擎,用于对无界和有界数据流进行状态计算。
①flink部署及架构;②Data Stream API;③flink处理函数。
Kafka是一个分布式的基于发布/订阅模式的消息队列,主要应用于大数据实时处理领域。
①生产者消费者模式实现;②外部系统集成;③生产调优方法。