flink-user-zh mailing list archives

Site index · List index
Message view « Date » · « Thread »
Top « Date » · « Thread »
From Xintong Song <tonysong...@gmail.com>
Subject Re: TM太多,作业运行失败问题
Date Wed, 20 May 2020 08:22:30 GMT
hi

最好能把完整的日志以及 error stack 发出来。
这个报错通常是 TM 运行的机器/pod 之间网络不通造成的,有可能和 kubernetes
的配置有关,但就目前的信息比较难确定。

Thank you~

Xintong Song



On Wed, May 20, 2020 at 3:50 PM <a511955993@163.com> wrote:

>
> hi, all
>
> 集群信息:
> flink版本是1.10.1,部署在kubernetes上。
>
> 现象:
> 需要200个slot,如果指定TM个数为40,每个TM的slot个数为4,可以正常运行作业。如果指定TM为200,每个TM的slot个数为1,集群可以正常构建,ui上Available
> Task Slots显示为200,提交作业的时候,就会出现如下报错:
>
> Cased by: java.net.NoRouteToHostException: No route to host.
>
> 目前我遭遇到的使用场景说明如上,希望得到一些回复和解答说明,非常感谢。
>
> Looking forward to your reply and help.
>
> Best
>
> | |
> a511955993
> |
> |
> 邮箱:a511955993@163.com
> |
>
> 签名由 网易邮箱大师 定制
Mime
  • Unnamed multipart/alternative (inline, None, 0 bytes)
View raw message