设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
资源
节点
飞墙
Follow
明白贴
影视
报酬
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
程序员
›
咨询个 SQL 数据去重的问题
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
字节跳动将(田某)告上法庭,要求赔偿 800
›
杭州余杭某小公司:劳动合同到期前,公司 h
›
求助:圣诞节有个 app 限免,误购买内购,
›
答应下周入职但是收到了更好的 offer,怎么
›
红米 K80 感觉配置是真的拉满啊
今日热议主题
公司新闻:手机下了软件后,被盗刷几十 W。
求推荐一款机械键盘 108 茶轴
已入职外包一个月,但是有个更好的 offer,
[收] 开心农场的源码,能正常上线的,代价
今年毕业两次了,真好啊,艹他妈的~
求助这种胶需要用什么清除?
有没有办法同一个域名,走外网访问用公网 i
这个网站上的模型展示以及操作是使用 three
有兄弟 30 岁才开始练习🎸的么
我开源的浏览器书签管理工具 OneNav 更新了
咨询个 SQL 数据去重的问题
kkbear
· 2024-9-6 10:34:09 · 103 次点击
目前有个流水表,大几千万的数据,可以简化如下:
会员号( member_id), 流水日期( trans_date)
有个需求,需要找出指定日期段内的会员数量(去重)
这个日期段时灵活的,可能时本月,本周,最近 7 天,最近 30 天
有什么方法能优化
1. 没办法根据日期段做汇总结果的统计表,因为日期段没有任何规律
2. 数据库为 mysql,目前用的 sum(distinct member_id) where trans_date between
举报
·
103 次点击
登录
注册
站外分享
微信扫一扫
QQ分享
微博分享
豆瓣分享
复制链接
显示全部
|
最新评论
7 条回复
沙发
wenxueywx
初学
2024-9-6 10:43:34
写错了? 统计数量怎么会用 sum 应该用 count 吧
没理解根据日期做汇总结果的统计表什么意思
板凳
asAnotherJack
小成
2024-9-6 10:44:29
怎么是 sum 呢,不该是 count 吗
地板
ZZ74
小成
2024-9-6 10:49:39
优化 ?现在是碰到什么问题了 查询慢?
5#
sagaxu
初学
2024-9-6 10:50:49
按一个月不超过 300 万数据增量估算,有联合索引(trans_date, member_id),低频词的在从库里查 1 个月也 OK
6#
8355
小成
2024-9-6 10:55:17
我倾向于用其他数据库做 例如 clickhouse 或着其他大数据方向的数据库计算,并不是用关系型数据库。
如果可以接受不是很精准的话可以用布隆过滤器
7#
x1n04
小成
2024-9-6 10:55:57
type 看看,再加点索引呢。
8#
NoOneNoBody
小成
2024-9-6 11:09:13
我只知道 pandas 做这个甚为简单,sql 就不晓得了
返回顶部