solr8.6.2 客户端界面介绍及配置中文分词器

启动solr服务
访问http://localhost:8080/solr/index.html

solr8.6.2 客户端界面介绍

  • Dashboard:仪表盘,显示了该 solr 实例开始启动运行的时间,版本,系统资源,jvm等信息。

  • Logging:显示 solr 运行出现的异常或错误

  • Core Admin:Solr Core的管理界面,可以添加SolrCore实例。

solr8.6.2 客户端界面介绍

主要有Add Core(添加核心),Unload(卸载和兴),Rename(重命名),Reload(重新加载核心),Optimize(优化索引)

Add Core是添加core:主要是在instanceDir对应的文件夹里生成一个core.properties文件

name:给core起名字

instanceDir:与我们在配置solr到tomcat里时的solrhome里新建的core文件夹名一致

dataDir:确认Add Core时,会在collection1目录下生成名为data的文件夹

config:collection1下的conf下的config配置文件(solrconfig.xml)

schema:collection1下的schema文件(schema.xml)
  • Java Properties:solr在JVM运行环境中的属性信息,包括类路径、文件编码、jvm内存设置等信息。可查看到java相关的一些属性的信息。

solr8.6.2 客户端界面介绍

  • Thread Dump:显示Solr Sever中当前活跃线程信息,同时也可以跟踪线程运行栈信息。

  • Core selector(重点)

    • Analysis(重点):此界面可以测试索引分词器和搜索分词器的执行情况
      solr8.6.2 客户端界面介绍
    • Dataimport:可以定义数据导入处理器,从关系数据库将数据导入到Solr索引库中。默认没有配置,需要手动配置
    • Document:通过/update表示更新索引,solr默认根据id(唯一约束)域来更新Document的内容,如果根据id值搜索不到id域,则会执行添加操作,如果找到则更新,通过此菜单可以创建索引、更新索引、删除索引等操作
    • Query(重点):通过/select执行搜索索引,必须指定“q”查询条件方可搜索。
      solr8.6.2 客户端界面介绍

配置中文分词器

配置 solr8 自带分词器

找到solr-8.6.2\contrib\analysis-extras\lucene-libs下的这个jar包,复制到配置的tomcat的webapps\solr\WEB-INF\lib目录下
solr8.6.2 客户端界面介绍

solr8.6.2 客户端界面介绍

然后配置配置文件,在solrhome的配置的管理员目录下,我这里是solrhome\demo_core\conf目录下的managed-schema文件。

solr8.6.2 客户端界面介绍

在文件中添加如下配置
solr8.6.2 客户端界面介绍

<!-- ChineseAnalyzer 自带的中文分词器 -->
<fieldType name="solr_cnAnalyzer" class="solr.TextField" positionIncrementGap="100">
    <analyzer type="index">
        <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
    </analyzer>
    <analyzer type="query">
        <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
    </analyzer>
</fieldType>

配置ik分词器

先下载solr8版本的ik分词器,下载地址:search.maven.org/search?q=com.gith...
分词器GitHub源码地址:github.com/magese/ik-analyzer-solr

下载jar包

solr8.6.2 客户端界面介绍及配置中文分词器

将jar包拷贝到tomcat\webapps\solr\WEB-INF\lib

solr8.6.2 客户端界面介绍及配置中文分词器

然后到solrhome\demo_core\conf目录下配置managed-schema文件
在配置文件中加入以下代码:

<!-- ik分词器 -->
<fieldType name="text_ik" class="solr.TextField">
    <analyzer type="index">
        <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
        <filter class="solr.LowerCaseFilterFactory"/>
    </analyzer>
    <analyzer type="query">
        <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true"     conf="ik.conf"/>
        <filter class="solr.LowerCaseFilterFactory"/>
    </analyzer>
</fieldType>

测试

启动 solr,测试一下刚刚配置的中文分词器。

solr8.6.2 客户端界面介绍

solr8.6.2 客户端界面介绍及配置中文分词器

本作品采用《CC 协议》,转载必须注明作者和本文链接
讨论数量: 0
(= ̄ω ̄=)··· 暂无内容!

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容,与人为善,比聪明更重要!
未填写
文章
247
粉丝
17
喜欢
213
收藏
58
排名:732
访问:9674
私信
所有博文
社区赞助商