关键词扩展
依托全网海量优质数据和深度神经网络技术,通过词语向量化来计算两个词之间的相似度

功能介绍

本技术用于计算两个给定词语的语义相似度,基于自然语言中的分布假设,即越是经常共同出现的词之间的相似度越高。
词义相似度是自然语言处理中的重要基础技术,是专名挖掘、query改写、词性标注等常用技术的基础之一

应用场景

  • 专名挖掘

    通过词语间语义相关性计算寻找人名、地名、机构名等词的相关词,扩大专有名词的词典,更好的辅助应用
  • query改写

    通过寻找搜索query中词语的相似词,进行合理的替换,从而达到改写query的目的,提高搜索结果的多样性

技术特色

  • 词表覆盖广

    使用珍岛大规模网页数据进行模型训练,样本数据丰富且时效性高,收录词汇覆盖度广,召回率高
  • 深度学习训练

    基于DNN深度学习大量样本训练模型,完成词语的向量化,建立高精度的词向量表示体系
  • 描述精度高

    基于高精度的词向量表示系统及海量样本训练学习,准确描述词义相似度,能满足高精度要求的业务场景需求

注册即可免费试用

  • 真怒了!台民众镜头前大骂:民进党是什么鬼 2019-03-11
  • 湖南省益阳市牵手第十二师二二一团举办“湘疆情深 爱洒兵团”捐赠仪式 2019-03-07
  • 多彩非遗  美好生活 2019-03-07
  • 省委召开冯新柱案“以案促改”专题警示教育会议 2019-03-06
  • 国内成品油价格因增值税税率调整相应下调 2019-03-04
  • 竹编:缝隙里的乡愁文章中国国家地理网 2019-03-04
  • 成果转化重要平台 创交会三年落地项目超过140项 2019-03-03
  • 6月15日译名发布:Opportunity Mars Exploration Rover} 2019-03-03
  • 久久为功,扎实推进生态宜居的美丽乡村建设 2019-03-02
  • 贸易战打败的是经济理论家,不是中美两国经济。 2019-02-28
  • 武大现“中国学生不得入内”标识?官方回应来了 2019-02-27
  • 陕西省陇县市:“十小警务”提升社会治理水平 2019-02-21
  • 全国Ⅰ卷数学试卷评析:重视基础、平稳过渡 2019-02-21
  • 全面从严治党永远在路上——辽宁代表团开放日侧记 2019-02-19
  • 的确如此。报刊亭取消的确是短视行为。把报刊亭设计的现代化一些,与城市绿化衔接起来,相得益彰,成为文化一景多好。 2019-02-18
  • 432| 751| 422| 860| 995| 581| 118| 658| 382| 312|