设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
资源
节点
飞墙
Follow
明白贴
报酬
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
问与答
›
求问数据清洗的简易方法
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
我写了一本书:《从零开始手搓数据库(Go)》
›
为啥最近小红书疯狂推送关于红楼梦及明朝相
›
儿子去外地见网友,有什么定位软件推荐?
›
跟大家讲个笑话 - 关于面基失败
›
京东的价格保护都变味了
今日热议主题
[更新] 我把 100%本地运行的刷算法题项目做
netbird 宣告了网段就无法局域网走 P2P 了
[教程]关于 CCS 独服帐号注册、闪购及后续
现在注册谷歌新账号还是很简单啊
如果你现在中了大乐透一等奖,你会?
收个美区 loon 兑换码,有的带价
出台全套箱说的 MBP M1Pro 10+14 32GB+1TB
求解,为什么部署的 tailscale 的 derp 服
关于 QQ 聊天记录找回的疑难杂症,求大佬指
求助个梅林+MC2+nas+qBittorrent 的问题
显示全部
|
最新评论
14 条回复
·
272 次点击
11#
SmartTom
小成
2024-8-30 10:06:40
求问数据清洗的简易方法
阿里的 DataX 吧,搭建也方便。功能基本满足。
12#
dif
小成
2024-8-30 10:57:00
求问数据清洗的简易方法
我都是根据实际情况做清洗,有些是用 sql,有些用 python,spark 之类的, 也没有一个完美的工具。
13#
flmn
小成
2024-8-30 11:21:19
求问数据清洗的简易方法
像你说的,行与行没关系,可以拆分成多份分别处理再合并呀,可以看看 Spark 。感觉用文件存储比数据库合适。
14#
MoYi123
小成
2024-8-30 14:02:23
求问数据清洗的简易方法
pg 里可以写 python 之类的很多编程语言.
15#
catamaran
小成
2024-8-30 17:21:58
求问数据清洗的简易方法
@TimG #10 如果用 clickhouse, 我是这么做的:客户端用 python 处理,一次读取 100 万行(看硬件情况),处理完成后写入新表。主要弄好分区键,clikchouse 我记得翻页会越来越慢。
1
2
/ 2 页
浏览过的版块
全部
分享创造
返回顶部