flink-user-zh mailing list archives

Site index · List index
Message view « Date » · « Thread »
Top « Date » · « Thread »
From Shi Quan <qua...@outlook.com>
Subject RE: Flink基于Event Time的长时间数据延迟问题
Date Tue, 28 May 2019 07:52:46 GMT
张智强:
          你好,从描述来看,觉得你特别适合用Flink的CEP,采用notFollowedBy和within结合的语义,如果你有兴趣尝试,方便的话告诉我你测试的效果。
          Session window用来做类似逻辑应该很费劲,因为水位是整窗口一起控制,即根据keygroup来控制,而不是基于用户来控制的。同时窗口的计算需要事件数据的触发。也就带来了你的困惑。

          另,没有附件,不知是否为我个人邮箱问题。

石权

________________________________
From: 690963922 <zhang_moly@qq.com>
Sent: Tuesday, May 28, 2019 11:30:28 AM
To: dev; user-zh
Subject: Flink基于Event Time的长时间数据延迟问题

尊敬的Flink Committer大神好:

      最近我们公司使用Flink框架做实时计算,有这样一个场景困扰着我们。情况描述如下:

      我们希望通过实时计算用户的浏览行为,在该用户浏览某页面15分钟后,没有继续浏览该页面,就给用户推送消息。目前遇到的问题是,我们的用户量不大,在凌晨02:00到04:00之间基本没有用户的日志。

      我们使用的是Flink 提供的Session Window,设置的GapTime是15分钟。如上所述,我们的代码在凌晨02:00到04:00之间,没有用户相关的数据流入,导致Session
Window无法触发。不能计算出在02:00之前的15分钟的用户数据。我们希望是,即使在02:00到04:00没有用户浏览行为,也可以将之前在Session
Window的数据进行触发计算。请问有什么办法,可以解决这个问题吗?

      下面是我们的代码:见附件

      期待大神的回复




                                                                                         
                                                                                         
                                              张智强

                                                                                         
                                                                                         
                                              2019年05月28日

Mime
  • Unnamed multipart/alternative (inline, None, 0 bytes)
View raw message