首页新闻找找看学习计划

park 分组后取id最大的记录的字段

0
悬赏园豆:30 [已关闭问题] 关闭于 2019-08-17 14:50

dataframe 结构:

| Id | UserID | GameLevel | RegisterTime | GameAge | VipLevel|

如题:, 按userid 分组, 取id 最大记录的GameLevel, 有没有什么好的方法可以取

我这里目前是取的 最后一条记录, 但是有时候最后一条记录不一定是id最大, 所以造成数据不准确,


stat_active_df = active_df.groupBy("UserID").agg(
        F.last("GameLevel").alias("GameLevel"),
        F.last(get_game_age("RegisterTime")).alias("GameAge"),
        F.last("VipLevel").alias("VipLevel"),
    )
Mirck的主页 Mirck | 初学一级 | 园豆:134
提问于:2018-11-01 16:33
< >
分享
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册