导入方案的思考

导入的背景

用户为了更方便进行批量的数据处理,系统提供导入功能来满足该需求。对研发人员来说,导入等价于批量处理数据。

导入存在的问题

系统层面:

  • 导入数据过多,导致内存溢出(OOM),系统负载飙升。
  • 大批量的事务提交。
  • 如果有对外依赖,外部依赖不稳定将导致 整个导入超时耗时。

用户层面:

  • 导入耗时过长,只能等待,无法做其他事情。如果存在超时的情况那更加难以接受。
  • 系统异常时,无法了解导入的结果。

方案

从用户层面的问题来看,长时间等待和无法了解导入的结果是无法忍受的。所以 系统应该 对导入任务进行异步处理,并提供导入结果查询。

从系统层面的问题来讲,既然是批量任务,那我们可以将其分解为小批量任务来处理。

一个实际的案例

背景:用户导入excel进行付款,这个过程需要根据导入的账单号批量到账单,然后对这个账单的金额修改,如果金额为0了,那么进行 账单状态的变更,并通知其他业务系统。

导入流程

  1. 提交异步任务
    初始化 导入任务,使用线程池 执行导入任务
  2. 解析
  3. 批量处理数据
    可以在解析到一定的条数时执行批量处理数据
  4. 插入导入结果
    一次批量处理完以后,插入导入结果。
  5. 完成任务

如上的方案是 解析一批数据,然后对这一批数据进行批量处理,并插入批量导入结果。

查询和下载

提供查询导入任务 和 下载导入结果以方便用户了解导入结果

表设计

使用的MySQL5.7.28

1.导入任务表

CREATE TABLE `t_import_task` (
  `id` bigint(20) NOT NULL AUTO_INCREMENT,
  `file_name` varchar(50) NOT NULL COMMENT '导入文件名称',
  `type` tinyint(1) NOT NULL COMMENT '导入类型',
  `status` tinyint(1) NOT NULL COMMENT '导入状态,0 导入中 1 导入完成',
  `creator` bigint(20) NOT NULL COMMENT '操作人',
  `creator_name` varchar(20) DEFAULT NULL COMMENT '操作人姓名',
  `start_time` datetime NOT NULL COMMENT '开始时间',
  `end_time` datetime DEFAULT NULL COMMENT '完成时间',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4

2.导入任务详情表

CREATE TABLE `t_import_task_detail` (
  `id` bigint(20) NOT NULL AUTO_INCREMENT,
  `import_task_id` bigint(20) DEFAULT NULL COMMENT '导入任务ID',
  `row_index` int(11) DEFAULT NULL COMMENT '第几行 从1开始',
  `row_data` varchar(2000) DEFAULT NULL COMMENT '每一行的数据',
  `status` tinyint(1) NOT NULL COMMENT '导入状态,0 未导入 1 导入成功 2 导入失败',
  `failure_reason` varchar(200) DEFAULT NULL COMMENT '导入失败原因',
  PRIMARY KEY (`id`),
  KEY `idx_import_task_id` (`import_task_id`)
) ENGINE=InnoDB AUTO_INCREMENT=65 DEFAULT CHARSET=utf8mb4

异常情况考虑

  1. 解析发生异常,会导致导入任务详情表中没有数据。此种情况用户也能观察到,因为导入的条数和下载的条数不相同。
  2. 解析到一半时,系统重启。此种情况和上面的情况一致。

进一步优化

  1. 多线程解析,加快解析速度。
  2. 多线程批量处理数据,加快处理速度。
  3. 导入结果数据过多,导致导入详情表数据过多,可以考虑定时清除导入数据。
  4. 在页面提供单行数据修改,并再页面提供单行数据重试功能。
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,242评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,769评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,484评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,133评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,007评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,080评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,496评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,190评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,464评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,549评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,330评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,205评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,567评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,889评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,160评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,475评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,650评论 2 335

推荐阅读更多精彩内容