在这个信息爆炸的时代,大数据的意义不仅在于“大”,而且在于“有用”。对于财税行业而言,如何利用这些大规模数据是赢得竞争的关键。如果能结合大数据、深度学习等技术,通过分析商品名称特征来确定其税码归属,对于企业财务、内审、税务稽查及审计领域将有不可限量的应用前景。
2017厦门国际大数据大赛·唯你网赛题解析
大数据在财税发票稽核与信息分析中的应用
唯你网依托在财税行业深耕多年的海量的经过专业化标记的票据资源以及行业领先的票据智能识别能力,运用互联网和大数据手段,在智能识别、智能审核、智能分析领域进行了探索和实践,推动了财税行业的变革。
发票大数据稽核应用
国家税务总局从2016年开始推行《商品和服务税收分类与编码》,编码表上列示了超过4000个税码;据不完全调查某国有大型超市就售卖15万种商品,京东有超过100万种商品,淘宝则更多,面对如此浩繁的商品品类,没有一个企业财务、税务或审计人员敢保证开票税码的100%准确。
大数据通过对发票信息深度分析、挖掘,解析发票关键信息转化成结构化数据,定义规则引擎,帮助审核会计进行初步财务处理。从而提高财务人员开票税码的准确率,实现全方位的实时监控,对相关涉税行为进行分析,快速找出风险点。
企业购销行为分析及应用
发票承载着企业购销两端的信息,以及企业采购和销售什么品类的商品、用什么样的价格进行买卖、购销行为发生的大致时间;依托这些脱敏的数据,充分发挥大数据的作用,从中分析挖掘企业的购销行为信息,判断企业大量销售或采购的商品信息,促进企业购销撮合、集中采购等商机实现价值转化;同时,还可以结合其他数据,提出基于发票明细的相关创新性应用。
数据时代,财务领域的崛起必定是企业在激烈的市场竞争中最敏感的,也是最善于从大数据里嗅到时代发展机遇和未来趋势的。唯你网大数据正以其高效、专业的处理技术服务于产业链上众多的大中小微企业,打造全链条大生态圈。
应题要求
本题为发散性课题,要求参赛者根据自身对该课题应用的理解,基于发票大数据资源,同时收集和补充其他相关数据,以政府、企业和个人等角度为出发点,运用自然语言处理、语义分析建模、深度学习等方法,提出基于发票明细的创新性应用;结合应用进行分析,以论文和实现原型的形式展开,要求包含详细分析过程、模型以及展现实际应用效果,并得出结论。