有几天没有记录。上周五去雁栖湖年中会议。然后周六回来。周日去新华社。
周一很忙。周二也较忙。
很好的进展是git和linux/vi,其实都没有想象中的难,用得熟练了,比windows反而简单。
git clone, git pull/push,git all -A .; git commit -m 'xxxxx'。就这几个基本命令了。
vi,i,esc,:wq,:q!呵呵。
======================
docker-compose,这篇刚好讲python+mongo+redis的使用,这就太好了。
http://www.toutiao.com/a6441432261590302978/?tt_from=weixin&utm_campaign=client_share&app=news_article&utm_source=weixin&iid=10887695310&utm_medium=toutiao_ios&wxshare_count=1
===========================
事件抽取。从逻辑上讲,是可能产品化的一个点。比如金融上,一个事件的脉络;
财经事件,舆情等,甚至量化投资。
分词啊,分类啊,话题分类,NER,甚至普通的信息提取,文摘等,都不足以单独成为一个产品。
产品摘要这个好像可以。
============事件就是基于“认知技术”。让计算机有认知能力。也可以用在QA。这个就太厉害了。
1,ACE2005,自动内容抽取。
先去github里找代码event extraction
https://github.com/jbjorne/TEES,biomedical领域,这个系统好像一直在开发,有没有通用的思路和功能可以?python的代码。
https://github.com/yifange/event_extraction,日常邮件抽取,有数据,有代码,这个有点意思和应用场景了。
https://github.com/brendano/OConnor_IREvents_ACL2013
,java的代码,有论文,有数据。政治相关的文档,抽取国际关系?