周三晚上参加了数据派的分享讲座,题目是《知识图谱和它在司法领域的运用》,三位老师分别从理论应用,国双公司在司法领域的应用产品以及用到的技术去介绍。
听完分享,总的来说还是困惑多一些,发现在实际做的过程中,人工参与的程度还是比较高的。
我理解到的信息其实是这块还没有突破关键技术,运用技术时也提到了几种方式(机器学习、统计学、神经网络学啥的)还各有弊端。计算机怎么能像人一样具有智慧呢?在《数学之美》里提到过,其实这方面的研究上世纪就在进行了,但是并没有很好的结果,语音识别、翻译也在很长的时间没有发展。后来是因为采用了统计学,才快速发展应用起来。所以,可能是被之前了解到的信息先入为主了,我不觉得机器需要用和人类一样的思考方式。
说回讲座本身吧。
知识图谱在司法领域实现了哪些应用呢?
我听到的有两方面应用,一个是能把法律文书的时间线路、线索整理出来(原告与被告),供法官查看。还有另外一个是,在多选几个文书时,能把几个文书间的逻辑关系整出来,大概就是a和b之间有多大概率是因果关系。
在实现司法领域应用时,他们是怎么做的?
我get到的信息是大量的学习。学习包括几方面,
1、法律基础知识学习,主要是和现有的数据库整合,分享者提到这块整合就挺困难的,因为各数据库的建设逻辑都不太一样。法律又是一个要求绝对正确而不是80%正确的事,所以在这个环节就要人工参与。
2、还需要法律实践的学习,这个就是靠学习判决书、法律文书,这个环节人工参与程度已经很高了。
3、法律实务与理论的学习,主要靠专家了。
最后,讲座到最后,我觉得说得很中肯的一点是,目前有多样技术,技术其实都是好技术,选用何种技术还是主要看业务需求。不从科研的角度来看,这种思维方式会帮助知识图谱更快地落地吧。