PostgreSQL deferrable initially deferred 造成的死锁问题

太长不看

PostgreSQL可以在约束(constraint)上使用deferrable特性,在执行插入/更新语句时,推迟检查约束。其中deferrable initially deferred推迟至commit语句执行时进行检查,而deferrable initially immediate推迟至该语句执行完成时进行检查。使用不当可能产生死锁问题。

现象

PostgreSQL日志出现死锁记录

2018-07-02 06:45:15 UTC:${IP_ADDR}(41404):${ACCOUNT}@${DB}:[2699]:ERROR:  deadlock detected
2018-07-02 06:45:15 UTC:${IP_ADDR}(41404):${ACCOUNT}@${DB}:[2699]:DETAIL:  Process 2699 waits for ShareLock on transaction 640992196; blocked by process 441.
    Process 441 waits for ShareLock on transaction 640992182; blocked by process 2699.
    Process 2699: COMMIT
    Process 441: update item set event_seq=$1 where id=$2
2018-07-02 06:45:15 UTC:${IP_ADDR}(41404):${ACCOUNT}@${DB}:[2699]:HINT:  See server log for query details.
2018-07-02 06:45:15 UTC:${IP_ADDR}(41404):${ACCOUNT}@${DB}:[2699]:CONTEXT:  while checking exclusion constraint on tuple (2654776,52) in relation "annotation"
2018-07-02 06:45:15 UTC:${IP_ADDR}(41404):${ACCOUNT}@${DB}:[2699]:STATEMENT:  COMMIT

环境

数据库

运行在AWS RDS db.r4.2xlarge实例上的postgres 9.5.10

两个实体表,item 1:N annotationannotation表通过item_id关联item表,并有唯一性约束(item_id, type)。

                        Table "item"
    Column     |           Type           |       Modifiers        
---------------+--------------------------+------------------------
 id            | uuid                     | not null
 event_seq     | bigint                   | not null default 0
Indexes:
    "item$pk" PRIMARY KEY, btree (id)
Referenced by:
    TABLE "annotation" CONSTRAINT "annotation$item$fk" FOREIGN KEY (item_id) REFERENCES item(id)
                    Table "annotation"
   Column    |           Type           |       Modifiers        
-------------+--------------------------+------------------------
 id          | uuid                     | not null
 item_id     | uuid                     | not null
 type        | character varying(128)   | not null
Indexes:
    "annotation$pk" PRIMARY KEY, btree (id)
    "annotation$item_id_type$uk" EXCLUDE USING btree (item_id, type) DEFERRABLE INITIALLY DEFERRED
Foreign-key constraints:
    "annotation$item$fk" FOREIGN KEY (item_id) REFERENCES item(id)

服务端

  • org.springframework.boot:spring-boot-starter-web:1.4.1.RELEASE
  • org.springframework.boot:spring-boot-starter-data-jpa:1.4.1.RELEASE
  • org.postgresql:postgresql:9.4.1208

实体定义

@Entity
public class Item {

    @Id
    @Type(type = "pg-uuid")
    private UUID id;

    private long eventSeq;

    @OneToMany(mappedBy = "item", cascade = CascadeType.ALL, fetch = FetchType.EAGER, orphanRemoval = true)
    private List<Annotation> annotations = new ArrayList<>();
}
@Entity
@Table(uniqueConstraints = {@UniqueConstraint(columnNames = {"type", "item_id"})})
public class Annotation {

    @Id
    @Type(type = "pg-uuid")
    private UUID id;

    @Column
    private String type;

    @ManyToOne()
    @JoinColumn(name = "item_id")
    private Item item;
}

JPA定义

public interface ItemRepository extends JpaRepository<Item, UUID>, JpaSpecificationExecutor<Item> {}

调用JPA保存

@Component
public class ItemServiceImpl implements ItemService {
    @Autowired
    private ItemRepository repository;

    @Override
    public void saveItem(Item item) {
            repository.save(item);
    }
}

原因分析

名词解释

PostgreSQL比较各色,对很多概念给了自己的称呼。为了避免误导,稍微翻译下。
relation,就是数据表——table
tuple,就是数据表的一行——row

问题定位

2018-07-02 06:45:15 UTC:${IP_ADDR}(41404):${ACCOUNT}@${DB}:[2699]:ERROR:  deadlock detected
2018-07-02 06:45:15 UTC:${IP_ADDR}(41404):${ACCOUNT}@${DB}:[2699]:DETAIL:  Process 2699 waits for ShareLock on transaction 640992196; blocked by process 441.
    Process 441 waits for ShareLock on transaction 640992182; blocked by process 2699.
    Process 2699: COMMIT
    Process 441: update item set event_seq=$1 where id=$2
2018-07-02 06:45:15 UTC:${IP_ADDR}(41404):${ACCOUNT}@${DB}:[2699]:HINT:  See server log for query details.
2018-07-02 06:45:15 UTC:${IP_ADDR}(41404):${ACCOUNT}@${DB}:[2699]:CONTEXT:  while checking exclusion constraint on tuple (2654776,52) in relation "annotation"
2018-07-02 06:45:15 UTC:${IP_ADDR}(41404):${ACCOUNT}@${DB}:[2699]:STATEMENT:  COMMIT

从日志文件中看,441与2699两个数据库线程死锁。但是刚看到的时候没法理解:一个线程COMMIT,一个线程update item,怎么会死锁呢?
我们知道,死锁是由于两个线程分别持有锁,同时需要申请对方所持有的锁。
但在代码中只有一个.save(item),查看实际执行的SQL为

begin;
insert into annotation (id,item_id,type) values('fdbf4e61-dcf6-4b40-87e6-c81c0a14c001','cd0dbe92-764a-4a91-af5b-055d9387f4b6','note');
update item set event_seq=30000 where id='cd0dbe92-764a-4a91-af5b-055d9387f4b6';
commit;

即使多线程并发,执行顺序也保证了先锁annotation表,再锁item表,不会循环加锁。

没什么进展。重新再看看日志

Process 441: update item set event_seq=$1 where id=$2

441线程比较清楚,update被阻塞了,这么说来2699已经持有了item表的锁。
可是2699被441阻塞了什么呢?

2018-07-02 06:45:15 UTC:${IP_ADDR}(41404):${ACCOUNT}@${DB}:[2699]:CONTEXT:  while checking exclusion constraint on tuple (2654776,52) in relation "annotation"

ummm....2699在commit的时候,需要“检查annotation表上的唯一约束”?
似乎跟annotation表上配置的

"annotation$item_id_type$uk" EXCLUDE USING btree (item_id, type) DEFERRABLE INITIALLY DEFERRED

能联系起来?

查找资料之后发现,DEFERRABLE INITIALLY DEFERRED的作用是将唯一约束检查推迟到commit时进行。这就能说通了:441提交时,需要检查annotation表的唯一性,也就需要对annotation表加锁。如果2699已经持有了annotation表的锁,441就得等待。所以这俩线程就互相持有对方需要的锁。

两个线程以如下顺序执行SQL,就会出现死锁:

--2699:
begin;
insert into annotation (id,item_id,type) values('adbf4e61-dcf6-4b40-87e6-c81c0a14c001','ad0dbe92-764a-4a91-af5b-055d9387f4b6','note');

--441:
begin;
insert into annotation (id,item_id,type) values('adbf4e61-dcf6-4b40-87e6-c81c0a14c002','ad0dbe92-764a-4a91-af5b-055d9387f4b6','note');

--2699:
update item set event_seq=30000 where id='cd0dbe92-764a-4a91-af5b-055d9387f4b6';

--441:
update item set event_seq=40000 where id='cd0dbe92-764a-4a91-af5b-055d9387f4b6';

--2699:
commit;

解决方案

  1. 问题是由deferrable initially deferred导致的。如果不加上这个选项,2699线程在insert into annotation的时候就会阻塞,也就不会产生死锁问题。

  2. 调整SQL语句顺序,先执行update item,再执行insert into annotation。先尝试对item表加锁。不过对于JPA框架来说不好调整。

  3. 由于在我们的实际业务中,是由于完全相同的两个请求同时到达服务器导致的,所以最终解决方案是:放着不管:)。一个线程检测到死锁,抛异常回滚。另一个线程可以正常提交。对实际业务没有影响。

参考链接

PostgreSQL文档
stackoverflow上关于deferrable含义的讨论

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,772评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,458评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,610评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,640评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,657评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,590评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,962评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,631评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,870评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,611评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,704评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,386评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,969评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,944评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,179评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,742评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,440评论 2 342

推荐阅读更多精彩内容