#### 问题描述

假设我的建表语句是

```sql
create table users
(
    id        bigint primary key,
    user_name varchar(120) not null
);
```

现在想要为 `user_name` 字段新增一个唯一索引。如果是在 `postgresql` 中,如下 sql 是可以正常执行的

```sql
create unique index uni_user_name on users (user_name);
```

但在 TDSQL 环境下,这条 sql 执行失败了,报错提示

```shell
ERROR:  Unique index of partitioned table must contain the hash/modulo distribution column.
```

#### 探索

TDSQL 是一款腾讯开发的分布式数据库系统,近期公司有打算兼容 TDSQL 。目前使用的数据库是 postgresql 。迁移数据时遇到了一个有关唯一索引的问题

以下是 TDSQL 官网的资料:

1. 非 shard key 字段不能建立唯一索引
2. 不指定 shard key 建表方法,系统默认使用第一个字段作为表的 shard key

分布键选择原则:

- 分布键只能选择一个字段。
- 如果有主键,则选择主键做分布键。
- 如果主键是复合字段组合,则选择字段值选择性多的字段做分布键。
- 也可以把复合字段拼接成一个新的字段来做分布键。
- 没有主键的可以使用 UUID 来做分布键。
- 总之一定要让数据尽可能的分布得足够散。

> [创建和删除数据表]( https://cloud.tencent.com/document/product/1129/39828)
>
> [创建和删除索引]( https://cloud.tencent.com/document/product/1129/39829)

#### 尝试解决

1. 将唯一索引的创建语句修改为包含 shard key

```sql
create table users
(
    id        bigint primary key,
    user_name varchar(120) not null
) distribute by shard(id);

create unique index uni_user_name_id on users (user_name, id);
```

可以正常执行,但这个组合的唯一索引失去了 `user_name` 字段唯一的限制

2. 将 `user_name` 设置为 shard key

```sql
create table users
(
    id        bigint,
    user_name varchar(120) not null
) distribute by shard(user_name);

create unique index uni_user_name on users (user_name);
```

这种情况下,如果表有多个唯一索引,也是不行的,因为 shard key 只能是一个字段,更不要说我的业务里面还有组合的唯一索引

3. 创建一个新表,命名为 `uni_users_user_name`,将 `user_name` 作为主键和 shard key 。创建一个触发器,在新增或者修改时,也去修改 `uni_users_user_name`,通过 `uni_users_user_name` 来校验 `user_name` 是否唯一

> 这种方案我并没有实践,一方面触发器现在已经很少使用了,使用的话会对现有的业务造成哪些影响也需要评估。另一方面,多个唯一索引需要建立多张表,如果组合唯一索引的话,又应该怎么处理呢?

```shell
create table uni_users_user_name
(
    user_name varchar(120) primary key,
    id        bigint
) distribute by shard(user_name);
```

#### 我的疑问

我想这个问题应该在其他分布式数据库中也存在的,但目前好像并没有好的解决方案。我去咨询了官方客服,她们给我的反馈是分布式数据库是有挺多的限制,建议我使用她们的 postgresql

我想问问各位,有没有较好的方案可以在不改动业务,或者小改动的情况下,解决业务上强依赖数据库唯一索引的问题
举报· 84 次点击
登录 注册 站外分享
5 条回复  
mark2025 小成 2024-10-23 17:18:27
普通项目根本用不到分布式数据库,单机 pg 数据库足以。不要自己给自己挖坑
263 小成 2024-10-23 17:40:25
其实可以用,TDSQL-C PostgreSQL 版

https://cloud.tencent.com/product/tdcpg
返回顶部