| Id | UserID | GameLevel | RegisterTime | GameAge | VipLevel|
如题:, 按userid 分组, 取id 最大记录的GameLevel, 有没有什么好的方法可以取
我这里目前是取的 最后一条记录, 但是有时候最后一条记录不一定是id最大, 所以造成数据不准确,
stat_active_df = active_df.groupBy("UserID").agg(
F.last("GameLevel").alias("GameLevel"),
F.last(get_game_age("RegisterTime")).alias("GameAge"),
F.last("VipLevel").alias("VipLevel"),
)