[教程三] 写一个搜索:自定义词库;使用 Laravel Scout,Elasticsearch,ik 分词

代码:https://github.com/lijinma/laravel-scout-e... ,欢迎 Star

之前两篇文章:
写一个搜索:使用 Laravel Scout,Elasticsearch,ik 分词
解决搜索结果高亮问题

如何自定义分词

根据之前的代码,你应该已经可以做出来一个搜索的 Demo 出来了,这时候,一个问题跑到了你的脑海中:

ik 提供的分词不够用怎么办?

比如说,在搜索”把时间当作朋友“的时候,我希望结果不包含分词:"时间","朋友"等,因为这是一个专有的书名。

这个时候,你就用使用 ik 提供强大的自定义词库了,进入 ElasticSearch 文件夹里面:

$ ls -la plugins/analysis-ik/config/custom/

看到没有,这里面就是所有自定义的词库,你可以开始玩了,比如说,我现在要添加 把时间当作朋友, 我可以直接修改 plugins/analysis-ik/config/custom/mydict.dic
如下:

medcl
elastic
elasticsearch
kogstash
kibana
marvel
shield
watcher
beats
packetbeat
filebeat
topbeat
metrixbeat
kimchy
把时间当作朋友

修改完自定义词库你还需要做两步:

  1. 重启 ElasticSearch
  2. 重新 index 你的数据到 ElasticSearch执行命令:
$ php artisan scout:flush 'App\Post' 
$ php artisan scout:import 'App\Post'

这个时候你会觉得 Scout 简直太爽了,重新 Index 超级方便。

没添加”把时间当作朋友“为分词的时候搜索截图:

file

添加”把时间当作朋友“为分词的时候搜索截图:

file

我猜你已经明白了我的意思,希望这个简单的例子可以让你明白自定义词库。

最后的最后,推荐一本李笑来的书《把时间当作朋友》,电子版完全免费:

http://zhibimo.com/read/xiaolai/ba-shi-jia...

你肯定懂得,我写这篇文章,其实就是为了推荐这一本书,哈哈,目的达到了。
你实在无法想象,如果没有这本书,就不可能有这篇文章。

别忘了 Star 我的项目:https://github.com/lijinma/laravel-scout-e...

本作品采用《CC 协议》,转载必须注明作者和本文链接
写文字大部分时候是因为我希望能帮助到你,小部分时候是想做总结或做记录。我的微信是 lijinma,希望和你交朋友。 以下是我的公众账号,会分享我的学习和成长。
本帖由 overtrue 于 7年前 加精
lijinma
《L05 电商实战》
从零开发一个电商项目,功能包括电商后台、商品 & SKU 管理、购物车、订单管理、支付宝支付、微信支付、订单退款流程、优惠券等
《L03 构架 API 服务器》
你将学到如 RESTFul 设计风格、PostMan 的使用、OAuth 流程,JWT 概念及使用 和 API 开发相关的进阶知识。
讨论数量: 20
lijinma

@Summer 求加精,多谢

7年前 评论

:triumph: 好了,看完我要来动手了

7年前 评论
lijinma

@JokerLinly - 。- 快。。

7年前 评论
lijinma

@逗比欢乐多 感谢。

7年前 评论

V2上面已支持

7年前 评论
lijinma

@wpby 看到了,多谢哈。

7年前 评论
henter

不错不错~ :+1: :+1:

7年前 评论

@lijinma 为啥这么 NB 呢?

7年前 评论
lijinma

@henter 兄弟好。。

7年前 评论
lijinma

@overtrue 谢谢超哥夸奖啊啊啊

7年前 评论

你好,请问laravel版本5.2 php版本5.5以下的可以吗 ?

7年前 评论
lijinma

@SeanDZ 不行,因为需要 Scout,Scout 应该是 5.3 引入的

7年前 评论

php artisan scout:flush 'App\Post'
Imported [App\Post] models up to ID: 50
All [App\Post] records have been imported
但是 laravel索引回显:查询 1 个分片中用的 1 个. 0 命中. 耗时 0.001 秒

6年前 评论

@lijinma 原来是elasticsearch版本导致的~ 我在家无意中装个最新版本 能正常搜索出来了~~

6年前 评论

请问怎样知道命中的是哪个关键词呢,想做一个搜索热词功能

6年前 评论

$ php artisan scout:flush 'App\Post'
$ php artisan scout:import 'App\Post'
执行时 都提示 class 'App\Post' not found

6年前 评论

@miracle7kill'App\Post' 单引号改成"App\Post"双引号就行了 ,亲测可用

6年前 评论

中文分词不生效

场景:有一篇文章的标题是【孩子为什么叛逆】,我搜【孩子】或者【叛逆】可以搜索出来,但是我搜【孩子叛逆】就没有结果,已确认elasticsearch安装了ik插件,在elasticsearch-head插件上查询

{
  "query": {
    "match": {
      "content": "孩子叛逆"
    }
  }
}

是有结果的,不知道为什么在laravel就不行了呢

4年前 评论

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容,与人为善,比聪明更重要!