240 发简信
IP属地:广东
  • 实现spaCy训练词性标注模型

    词性标注是指为输入文本中的单词标注对应词性的过程。词性标注的主要作用在于预测接下来一个词的词性,并为句法分析、信息抽取等工作打下基础。通常地,实...

  • 使用Gensim库对文本进行词袋、TF-IDF和n-gram方法向量化处理

    Gensim库简介 机器学习算法需要使用向量化后的数据进行预测,对于文本数据来说,因为算法执行的是关于矩形的数学运算,这意味着我们必须将字符串转...

  • Resize,w 360,h 240
    利用spaCy对中文文本分词和去除停用词处理

    spaCy简介 spaCy语言模型包含了一些强大的文本分析功能,如词性标注和命名实体识别功能。目前spaCy免费支持的语言有:英文、德语、法语、...

  • 利用百度API进行淘宝评论关键词提取

    利用百度API自然语言处理技术中的评论观点抽取方面,对淘宝购物的评论进行分析,把关键词进行提取,方便买家快速了解该商品的相关特点,具体实现过程如...

  • Python模拟简易版淘宝客服机器人

    对于用Python制作一个简易版的淘宝客服机器人,大概思路是:首先从数据库中用sql语句获取相关数据信息并将其封装成函数,然后定义机器问答的主体...

  • Resize,w 360,h 240
    深圳二手房房源市场研究(下)

    PartⅡ:数据可视化 前言 根据上一篇文章,利用Python对房天下网站中深圳十个区的二手房房源信息进行了爬取,并保存到了本地。然后对数据集进...

  • Resize,w 360,h 240
    深圳二手房房源市场研究(上)

    PartⅠ:数据获取和数据清洗 写在前面 很早就有写博客的想法,一直对自己不自信所以没敢尝试,每次看其他大神的博客都很羡慕和崇拜,希望自己在未来...