当前位置:首页  >  行业资讯  > 正文

大数据Flink进阶(十一):Flink History Server配置使用

大数据Flink进阶(十一):Flink History Server配置使用
2023-04-09 23:10:03 来源:腾讯云

Flink History Server配置使用

基于Standalone或者Yarn模式提交Flink任务后,当任务执行失败、取消或者完成后,可以在WebUI中查看对应任务的统计信息,这些统计信息在生产环境中对我们来说非常重要,可以知道一个任务异常挂掉前发生了什么,便于定位问题。

当基于Standalone session模式提交相应任务时,集群重启后我们没有办法查看集群之前运行任务的情况,如果是基于pre-job方式提交任务,任务执行完成之后,那么相对应的统计信息也不会保存,基于Yarn运行的Flink任务也是一样道理。这样对于我们查看先前Flink作业统计信息或参数带来了不便。Flink中提供了History Server 来解决这个问题,可以在任务执行完成后保留相应的任务统计信息,便于分析和定位问题。


(资料图片)

History Server 允许查询由JobManager归档的已完成作业的状态和统计日志信息。已完成的作业归档由JobManager上传持久化到某个路径下,这个路径可以是本地文件系统、HDFS、H3等,History Server 可以周期扫描该路径将归档的Flink任务日志恢复出来,从而可以查看相应Flink任务日志情况。

一、Standalone History Server配置与验证

1、配置

在Standalone中配置History Server 服务需要选择一台节点当做History Server ,这台节点可以是JobManager/TaskManager节点,也可以是Standalone集群外的一台节点,这里选择node4节点作为Flink History Server 节点。Standalone配置HistoryServer 服务步骤如下:

1.1、在JM 和 TM 节点上配置 flink-conf.yaml

在Flink Standalone JobManager和TaskManager节点上配置flink-conf.yaml文件,指定Flink完成任务持久化的路径,这里选择HDFS目录作为任务日志持久化保存目录。在node1、node2、node3节点上配置$FLINK_HOME/conf/flink-conf.yaml文件,加入以下配置。

#Flink job运行完成后日志存储目录jobmanager.archive.fs.dir: hdfs://mycluster/flink/completed-jobs/

Flink会根据以上配置连接HDFS 目录存储任务数据,所以需要在node1、node2、node3节点上/etc/profile中配置HADOOP_CLASSPATH环境变量。

#vim /etc/profile,加入以下配置export HADOOP_CLASSPATH=`hadoop classpath`#source /etc/profile 使环境变量生效source /etc/profile

1.2、在History Server 节点上配置 flink-conf.yaml

在node4节点上配置$FLINK_HOME/conf/flink-conf.yaml文件,加入如下配置,配置HistoryServer。

#Flink History Server 节点historyserver.web.address: node4#Flink History Server 端口historyserver.web.port: 8082#Flink History Server 恢复任务的目录historyserver.archive.fs.dir: hdfs://mycluster/flink/completed-jobs/#Flink History Server 监控任务日志目录刷新时间间隔(毫秒)historyserver.archive.fs.refresh-interval: 10000

Flink会根据以上配置连接HDFS目录恢复任务数据,这里要求"historyserver.archive.fs.dir"参数配置需要与Flink各个节点上配置的"jobmanager.archive.fs.dir"参数路径保持一致。此外,需要在node4节点上/etc/profile中配置HADOOP_CLASSPATH环境变量。

# vim /etc/profile,加入以下配置export HADOOP_CLASSPATH=`hadoop classpath`#source /etc/profile 使环境变量生效[root@node4 ~]# source /etc/profile

1.3、启动 Flink 历史日志服务器

在node4节点上启动Flink History Server

#启动Flink 历史日志服务器[root@node4 ~]# cd /software/flink-1.16.0/bin/[root@node4 bin]# ./historyserver.sh start

2、验证

History Server 启动后,可以通过https://node4:8082 来访问历史日志服务页面。

我们可以通过向Standalone集群中提交任务来验证History Server是否能正常展示运行Flink任务的统计信息,步骤如下:

2.1、启动 Standalone 集群

[root@node1 ~]# cd /software/flink-1.16.0/bin/[root@node1 bin]# ./start-cluster.sh

2.2、提交任务

向Flink集群中提交任务,任务还是选择读取Socket端口数据实时统计WordCount。首先在node5节点上启动socket服务:

[root@node5 ~]# nc -lk 9999

在node4 客户端提交Flink任务(可以在任意节点提交Flink任务),命令如下:

[root@node4 ~]# cd /software/flink-1.16.0/bin/[root@node4 bin]# ./flink run -m node1:8081 -c com.mashibing.flinkjava.code.chapter3.SocketWordCount /root/FlinkJavaCode-1.0-SNAPSHOT-jar-with-dependencies.jar

提交任务后在HDFS中暂时不会生成hdfs://mycluster/flink/completed-jobs"目录,当Flink集群停止、任务取消、任务失败后才可以在该目录下看到job信息。

2.3、取消任务并查看历史日志

在node5节点向Socket 9999端口输入一些数据:

hello,ahello,bhello,chello,d

然后在Flink WebUI中取消当前任务:

取消任务后可以在"hdfs://mycluster/flink/completed-jobs"目录中看到取消任务的信息:

当任务取消后,也可以停止Flink集群,Flink集群重启后先前的任务统计信息不会展示,可以登录Flink历史日志服务器查看先前任务统计信息:

注意:在取消任务或者停止Flink集群后,需要等待一小段时间才能在Flink历史日志服务器中查看到对应的取消任务。

二、Yarn History Server配置与验证

1、配置

Flink基于Yarn运行时,当Flink任务形成的集群停止后,无法看到对应任务的统计信息,也可以通过配置History Server来实现基于Yarn的Flink集群停止后查看任务的统计信息。

这里选择node5节点为History Server,基于Yarn运行Flink任务配置HistoryServer服务步骤如下:

1.1、在node5 节点上配置 flink-conf.yaml

在node5节点上配置$FLINK_HOME/conf/flink-conf.yaml文件,最后配置以下配置项。

#Flink job运行完成后日志存储目录jobmanager.archive.fs.dir: hdfs://mycluster/flink-yarn/completed-jobs/#Flink History 服务器地址historyserver.web.address: node5#HistroyServer WebUI 访问端口historyserver.web.port: 8082#HistoryServer历史日志服务恢复任务信息目录historyserver.archive.fs.dir: hdfs://mycluster/flink-yarn/completed-jobs/#Flink History Server 监控任务日志目录刷新时间间隔(毫秒)historyserver.archive.fs.refresh-interval: 10000

Flink会根据以上配置连接HDFS 目录存储任务数据,所以需要在node5节点上/etc/profile中配置HADOOP_CLASSPATH环境变量。

#vim /etc/profile,加入以下配置export HADOOP_CLASSPATH=`hadoop classpath`#source /etc/profile 使环境变量生效source /etc/profile

1.2、启动 Flink 历史日志服务器并访问

在node5节点上启动Flink History Server

#启动Flink 历史日志服务器[root@node5 ~]# cd /software/flink-1.16.0/bin/[root@node5 bin]# ./historyserver.sh start

访问历史日志服务地址:https://node5:8082

2、验证

在node5节点基于Yarn提交Flink任务来验证History Server是否能正常展示执行完成的Flink任务统计信息。步骤如下:

2.1、向Yarn 集群中提交 Flink任务

向Yarn集群中提交Flink任务,任务还是选择读取Socket端口数据实时统计WordCount。在node5节点启动socket服务器:

[root@node5 ~]# nc -lk 9999

在node5节点向Flink集群中提交Flink任务,命令如下:

[root@node5 ~]# cd /software/flink-1.16.0/bin/# 提交Flink任务[root@node5 bin]#./flink run-application -t yarn-application -c com.lanson.flinkjava.code.chapter3.SocketWordCount /root/FlinkJavaCode-1.0-SNAPSHOT-jar-with-dependencies.jar

提交任务后在HDFS中暂时不会生成hdfs://mycluster/flink/completed-jobs"目录,当Flink集群停止、任务取消、任务失败后才可以在该目录下看到job信息。

2.2、取消任务并查看历史日志

在node5节点向Socket 9999端口输入一些数据:

hello,ahello,bhello,chello,d

然后登录Yarn(https://node1:8081) WebUI,找到提交的任务取消对应Flink任务:

取消任务后可以在"hdfs://mycluster/flink-yarn/completed-jobs"目录中看到取消任务的信息:

登录Flink历史日志服务器查看取消任务统计信息:

注意:在取消任务或者停止Flink集群后,需要等待一小段时间才能在Flink历史日志服务器中查看到对应的取消任务。

标签:

(责任编辑:news01)
大数据Flink进阶(十一):Flink History Server配置使用

大数据Flink进阶(十一):Flink History Server配置使用

基于Standalone或者Yarn模式提交Flink任务后,当任务执行失败、取消或者完成后,可以在WebUI中查看对应...
04-09 23:10:03
医疗机构设置申请书怎么填写_医疗机构设置申请书|每日动态

医疗机构设置申请书怎么填写_医疗机构设置申请书|每日动态

今天小编肥嘟来为大家解答以上的问题。医疗机构设置申请书怎么填写,医疗机构设置申请书相信很多小伙伴...
04-09 20:58:30
每日观察!深蓝首款车型SL03车内异响、变相降价,被车主集体投诉

每日观察!深蓝首款车型SL03车内异响、变相降价,被车主集体投诉

民生视角看车市 左右观车4月9日海南报道——由长安深蓝独立出来的全新新能源汽车品牌深蓝汽车,因首款...
04-09 18:55:40
每日热闻!肉酱汁遇上Q弹意面,必胜客致力打造家中的西餐厅|“豫制菜”上新季

每日热闻!肉酱汁遇上Q弹意面,必胜客致力打造家中的西餐厅|“豫制菜”上新季

【大河财立方记者段伟朵】当浓浓的番茄肉酱汁“遇上”Q弹意面,搭配牛奶就是一餐备受小朋友欢迎的大餐;...
04-09 17:44:12
百隆东方:2022年年扣非后归母净利润同比下降39.83%,投资收益增加7.52亿元

百隆东方:2022年年扣非后归母净利润同比下降39.83%,投资收益增加7.52亿元

百隆东方4月9日公告,2022年,公司实现营业总收入689亿元,同比下滑1%;归母净利润195亿元,同比上涨136%;基
04-09 16:04:02
英国学者:美欧持续加息是导致欧洲银行业动荡重要原因-天天热资讯

英国学者:美欧持续加息是导致欧洲银行业动荡重要原因-天天热资讯

新华社伦敦4月8日电(记者赵修知)近期,欧洲银行业风波引发全球关注。英国伦敦政治经济学院欧洲研究所...
04-09 14:12:40
5岁男孩坚持留3年长发,原因超酷的!

5岁男孩坚持留3年长发,原因超酷的!

光年长发照片。“我有长长的头发,我是个小男生,我要把头发捐给得癌症的小朋友。”近日,在河南新乡,...
04-09 11:51:25
禁止驶入!福建两海域实弹射击! 热点在线

禁止驶入!福建两海域实弹射击! 热点在线

00:34因为举行实弹射击训练,福建两海域7日发布航行警告。根据福州海事局公告,从4月8日开始到20日,在...
04-09 10:14:32
深圳机器人产业链去年总产值达1644亿元

深圳机器人产业链去年总产值达1644亿元

【深圳机器人产业链去年总产值达1644亿元】深圳特区报消息,日前,由中科院深圳先进技术研究和深圳市机...
04-09 08:53:08
网商贷15万额度被关闭,征信也刮花了,两年了额度也没有恢复!

网商贷15万额度被关闭,征信也刮花了,两年了额度也没有恢复!

网商贷实在太坑了,利息高得不得了,而且贷款只能等额本息。借了网贷不但没有帮助到自己,反而令我一度...
04-09 06:29:40
全球播报:几只猴子摘果子比40多比50少_几只拼音

全球播报:几只猴子摘果子比40多比50少_几只拼音

1、多少2、J,声母是“J”,韵母是“I”,第三声,入声;3、根4、Gn,声母“G”,韵母“en”,第一声平...
04-09 01:55:13
当前速讯:servicepack1下载32位_service pack是什么

当前速讯:servicepack1下载32位_service pack是什么

1、Servicepack服务包为客户端软件可订购或者可下载的一种更新, "Servicepack "修改现有问题,以
04-08 21:38:05
资兴市:汇聚“好人力量”引领文明新风尚-每日精选

资兴市:汇聚“好人力量”引领文明新风尚-每日精选

红网时刻新闻4月7日讯(通讯员周通李铁南王娜)4月7日,郴州市道德模范与身边好人现场交流活动走进资兴...
04-08 19:46:27
简讯:Comicomment: Another farce unfolds as political polarization divides U.S.

简讯:Comicomment: Another farce unfolds as political polarization divides U.S.

Justdaysaftertheso-calledsecond "DemocracySummit "intheUnitedStates,an
04-08 17:53:55
头条:我的抗战纪录片_我的抗战1

头条:我的抗战纪录片_我的抗战1

1、C试题分析:本题考查的是抗日战争的内容。2、由题文知:本题材料反映的是北平沦陷后的概况。3、193
04-08 15:50:37
陈芋汐身兼三项!2023跳水世界杯西安站中国队参赛名单出炉 全球播报

陈芋汐身兼三项!2023跳水世界杯西安站中国队参赛名单出炉 全球播报

近日,世界泳联正式公布2023年跳水世界杯西安站(4月14日至16日)中国队参赛名单。上海小囡陈芋汐将参加...
04-08 14:20:40
《春晚》观后感 《暖春》观后感_小学生观后感50字

《春晚》观后感 《暖春》观后感_小学生观后感50字

抄写作文网小编为大家提供《春晚》观后感《暖春》观后感_小学生观后感50字来供大家参考,欢迎阅读。《春...
04-08 12:20:57
重点聚焦!红糖煮荷包蛋的功效_红糖荷包蛋的做法

重点聚焦!红糖煮荷包蛋的功效_红糖荷包蛋的做法

1、  导语:红糖荷包蛋,撬动了我小时候的记忆,那时候这是最好的`滋补食材。如今,它依旧是传统温州...
04-08 11:06:03
当前聚焦:玩家很开心!《战神:诸神黄昏》更新奎爷终于可以光膀子

当前聚焦:玩家很开心!《战神:诸神黄昏》更新奎爷终于可以光膀子

近日,《战神:诸神黄昏》新游戏+模式上线引发玩家关注,其中不仅带来了此前玩家呼声极高的奎爷披风“黑...
04-08 09:11:17
焦点要闻:如何鉴别藕粉的质量 怎样辨别藕粉的质量呢

焦点要闻:如何鉴别藕粉的质量 怎样辨别藕粉的质量呢

1、察看粉色。藕粉接触空气容易氧化使粉色略呈白中稍带粉红;其他淀粉均不具有此种颜色。2、检查粉质。...
04-08 07:38:41
作品广议丨自觉的刻骨铭心的爱-观速讯

作品广议丨自觉的刻骨铭心的爱-观速讯

【作品广议】原标题:自觉的刻骨铭心的爱肖承森陪伴 李凡丁爱,是文学艺术的永恒表现主题。和其他艺术...
04-08 05:35:51
环球最新:单反相机入门教程图解 使用方法_单反相机入门教程图解

环球最新:单反相机入门教程图解 使用方法_单反相机入门教程图解

1、单反相机入门教程全民摄影的年代,抓着相机都可以叫做摄影师,如何成为一个成功的摄影师?单反相机入...
04-08 01:05:24
焦点快看:东城区人才服务中心社保_东城区人才服务中心

焦点快看:东城区人才服务中心社保_东城区人才服务中心

1、东城区人才服务中心人才市场地址:北京市东城区青年湖北里10号楼1号坐地铁安定门站下车然后做108124119
04-07 21:51:34
因生存情况未能改善 默沙东(MRK.US)与卫材叫停一项针对皮肤癌的后期研究 环球消息

因生存情况未能改善 默沙东(MRK.US)与卫材叫停一项针对皮肤癌的后期研究 环球消息

默沙东和日本医药公司卫材在周五表示,他们将停止一项Keytruda联合Lenvima治疗成人不可切除或转移性黑色...
04-07 20:39:13
价格下探3000元,增加17项配置,全新雷凌售11.38万元起 视焦点讯

价格下探3000元,增加17项配置,全新雷凌售11.38万元起 视焦点讯

近日,广汽丰田搭载第五代智能电混双擎的全新雷凌(参数|询价)正式上市,作为“10万级更可靠的智能电混轿...
04-07 19:21:12
军人换领驾驶证,更便利!-当前关注

军人换领驾驶证,更便利!-当前关注

4月7日,公安部召开新闻发布会,推出公安交管服务群众服务发展10项便利措施。其中,便利军人换领驾驶证...
04-07 18:20:13
压实平台主体责任,为食品违规营销戴上“紧箍咒” 天天亮点

压实平台主体责任,为食品违规营销戴上“紧箍咒” 天天亮点

面对商家广告宣传,陈女士没有过多犹豫就买了几盒“0脂”乳酸菌饮料。可到手后,一看配料表和成分表才发...
04-07 17:21:06
全球快资讯:济南治疗肝癌哪家医院好——发现肝血管瘤怎么办?

全球快资讯:济南治疗肝癌哪家医院好——发现肝血管瘤怎么办?

肝血管瘤多数是先天发育异常造成的,是血管的畸形,多数病情稳定,只需要随访观察,无需治疗。仅有在少...
04-07 16:08:49
每日速讯:贵州文化旅游产业招商大会召开

每日速讯:贵州文化旅游产业招商大会召开

4月7日,贵州文化旅游产业招商大会在贵阳市花溪区青岩古镇召开,会议现场签署战略合作协议5个,产业投资...
04-07 15:33:59
聆听书韵 共读经典 世界热点评

聆听书韵 共读经典 世界热点评

河南邓州将读书活动作为推进素质教育重要载体——聆听书韵共读经典■推动青少年学生读书行动进行时校园...
04-07 14:13:36

精彩推送