Flink动态加载代码，动态加载SQL方案

对于不断增加的新业务需求，通常的方式是改flink代码，然后重新release，但是这并不是一种很好的方式，现在比较流行的就是动态的加载代码，比如新增了一条sql，我要在不停止job的情况下让job感知到，比如我新加udf，也要让job感知到，或者新的业务代码。现在有什么好的方案吗？知乎上看到一个https://zhuanlan.zhihu.com/p/52007980 还没来得及细看。大家都有什么方案啊。

ld512870 · 发表于 2019-3-27 11:48:46

另外，吐槽一下，答疑的模块为啥没有flink模块。。。

s060403072 · 发表于 2019-3-27 16:53:40

ld512870 发表于 2019-3-27 11:48
另外，吐槽一下，答疑的模块为啥没有flink模块。。。

这个可以实现。需要使用Java 8 自带的 Nashorn虚拟机。Java 8 自带的 Nashorn虚拟机为什么可以实现加载那？
从引擎的原理入手，文中由于引擎是不可序列化，因此用了一个引擎池单例。

这个引擎的本质什么？
一个map变量，也就是可以理解为一个集合或则数据结构。这里面包含哪些内容？
一个key和value
Key为URL
Value为读取URL中的JS代码而创建的JavaScript引擎。

上面我们可以看到一个url对应一个JavaScript引擎。
当我们修改代码的时候，就修改配置。
引擎会定期读取的配置文件的时候会自动检测到新的URL并且启动一个新的引擎。

对于Flink来讲：
Flink作为流计算的框架，Flink的加载机制是：

生成DAG -> 序列化 -> 分发到各个节点 -> 加载DAG（这个时候会运行一些Rich的部分）-> 运行

而我们相当于在DAG中定义了一个动态的Node，所有的数据流到Node中来，然后再根据当前的加载情况去分发数据。

于是采用反复读取URL，对比有无改变来决定是否重新加载JavaScript引擎。

美丽天空 · 发表于 2019-3-29 00:27:38

来学习了

图文精华

Flink动态加载代码，动态加载SQL方案

已有(3)人评论

最佳新人

活跃会员

推荐 /2