词典网
提问
热搜
消息
登录
注册
帮助中心
首 页
问答
圈子
组词
造句
拼音
反义词
近义词
词典网
»
问答
»
数据挖掘之同义词挖掘
数据挖掘之同义词挖掘
那么问题又来了?同义词词典怎么构建呢?首先,很多人会想到使用word2vec来挖掘同义词,实际上根据word2vec的原理可知,其挖掘的topK相近词其实是基于 共现关系的相关词,并不是只有近义词,因此会出现很大的噪声。使用word2vec挖掘 如上所示,虽然富裕的相近词,富有,富足有返回,但是穷困,平穷也有返回...
数据挖掘之同义词挖掘
在搜索过程中,需要使用同义词来达到提高召回的目的,例如用户搜索:口红,但是商品名称却不含口红关键词,比如商品名为:xxx彩色唇膏。但其实两个词是指代同一产品。那么在用户搜索的时候,就搜不到对应的产品。这时可以 同义词词典来解决这个问题,使用Elasticsearch做搜索引擎,在query和索引数据时,先将query和doc分词,然后使用同义词替换,将特定词替换成同义词索引。
如:同义词词典 口红 => 彩色唇膏 彩色唇蜜
那么问题又来了?同义词词典怎么构建呢?
首先,很多人会想到使用word2vec来挖掘同义词,实际上根据word2vec的原理可知,其挖掘的topK相近词其实是基于 共现关系的相关词,并不是只有近义词,因此会出现很大的噪声。
使用word2vec挖掘
如上所示,虽然富裕的相近词,富有,富足有返回,但是穷困,平穷也有返回,词义恰恰是反义词,因此使用完全无监督的word2vec挖掘近义词效果并不好。
关于word2vec挖掘同义词还有两个思路。
参考:
https://zhuanlan.zhihu.com/p/33942535
https://www.zhihu.com/question/40777785/answer/88189037
http://www.mamicode.com/info-detail-2486542.html
2022-07-23
cdw
阅读 20 次
更新于 2024-09-20 06:27:49
我来答
关注问题
0
1 个回答
词典网专题活动
其他近义词类似问题
成立的同义词
17次阅读
关键的近义词是什么
14次阅读
枢纽的同义词
17次阅读
打造的近义词有什么
17次阅读
完美结合的同义词?
13次阅读
目标的词语概念
13次阅读
词典网在线解答
立即免费咨询
近义词相关话题
日趋下降近义词
有用 (4)
直线下降近义词
有用 (4)
断崖式下降的近义词
有用 (4)
徐徐下降的近义词
有用 (5)
日益下降的近义词
有用 (5)
逐步下降的近义词
有用 (4)
下降近义词是什么词
有用 (3)
更改近义词的是什么
有用 (5)
苍翠的近义词是
有用 (5)
苍翠的近义词有什么
有用 (3)
返回顶部