大佬们,请教一个 Python 下关于 duckdb 的数据导入很诡异的问题,困扰了我两天,不胜感激。

背景:
最近在搞一个小爬虫,用到了 duckdb 需要在导入的时候进行去重更新,因为导入的时候跨越数据时间久远无法在代码中就实现去重,只能通过 duckdb 的数据库机制去重

表结构如下
CREATE TABLE IF NOT EXISTS ticai (
"一级类目" TEXT,
"一级类目" TEXT,
"人数" BIGINT,
UNIQUE("一级类目", "一级类目"))

data_df 为一个 frame
columns 为列名
placeholders 为占位符个数

代码:
#拼接导入语句 INSERT OR REPLACE INTO 将现有行的每一列更新为要插入的行的新值
sql_str = f'"""INSERT OR REPLACE INTO ticai ({columns}) VALUES ({placeholders})"""'
#duckdb 执行批量导入
con.executemany(sql_str, data_df.values.tolist())

症状:
使用拼接语句执行 con.executemany ()就一直报错,结果如下
duckdb.duckdb.ParserException: Parser Error: syntax error at or near """"INSERT OR REPLACE INTO ticai (""

但是使用打印出来的 sql_str 拼接语句就能执行成功
con.executemany("""INSERT OR REPLACE INTO ticai ("一级类目", "二级类目", "人数") VALUES (?, ?, ?)""", data_df.values.tolist())

结果如下:<duckdb.duckdb.DuckDBPyConnection object at 0x000001586624C2F0>

超级诡异,我不是很精通 Python ,也木有在其他平台找到问题的症结,球球大佬们帮忙解答下
举报· 37 次点击
登录 注册 站外分享
1 条回复  
customsshen 小成 2024-9-11 11:25:02
单引号和双引号不能包含三引号
返回顶部