WordNet 是一个用来给英语词汇知识建模的词汇索引系统。它是一个在线数据库,包含了名词,动词,形容词,副词,这些词被分组成同义集合(同义词集)。每一个集合都表示不同的概念。WordNet可以用来计算相似度得分,并且可以被看作是自然语言条目组成的“结构体(ontology)”。WordNet最新的在线版本是2011年7月的v.3.1,包含了117659个同义词集,和206941个 word-sense对(不知道这是什么鬼)。名词,动词,形容词,副词被放入同义词集。
参考:
https://arxiv.org/ftp/arxiv/papers/1310/1310.8059.pdf