solr8.6.2 客户端界面介绍及配置中文分词器
启动 solr 服务
访问 http://localhost:8080/solr/index.html
Dashboard
:仪表盘,显示了该 solr 实例开始启动运行的时间,版本,系统资源,jvm 等信息。Logging
:显示 solr 运行出现的异常或错误Core Admin
:Solr Core 的管理界面,可以添加 SolrCore 实例。
主要有Add Core(添加核心),Unload(卸载和兴),Rename(重命名),Reload(重新加载核心),Optimize(优化索引)
Add Core是添加core:主要是在instanceDir对应的文件夹里生成一个core.properties文件
name:给core起名字
instanceDir:与我们在配置solr到tomcat里时的solrhome里新建的core文件夹名一致
dataDir:确认Add Core时,会在collection1目录下生成名为data的文件夹
config:collection1下的conf下的config配置文件(solrconfig.xml)
schema:collection1下的schema文件(schema.xml)
Java Properties
:solr 在 JVM 运行环境中的属性信息,包括类路径、文件编码、jvm 内存设置等信息。可查看到 java 相关的一些属性的信息。
Thread Dump
:显示 Solr Sever 中当前活跃线程信息,同时也可以跟踪线程运行栈信息。Core selector
(重点)Analysis(重点)
:此界面可以测试索引分词器和搜索分词器的执行情况Dataimport
:可以定义数据导入处理器,从关系数据库将数据导入到 Solr 索引库中。默认没有配置,需要手动配置Document
:通过 /update 表示更新索引,solr 默认根据 id(唯一约束)域来更新 Document 的内容,如果根据 id 值搜索不到 id 域,则会执行添加操作,如果找到则更新,通过此菜单可以创建索引、更新索引、删除索引等操作Query
(重点):通过 /select 执行搜索索引,必须指定 “q” 查询条件方可搜索。
配置中文分词器#
配置 solr8 自带分词器#
找到 solr-8.6.2\contrib\analysis-extras\lucene-libs
下的这个 jar 包,复制到配置的 tomcat 的 webapps\solr\WEB-INF\lib
目录下
然后配置配置文件,在 solrhome 的配置的管理员目录下,我这里是 solrhome\demo_core\conf
目录下的 managed-schema
文件。
在文件中添加如下配置
<!-- ChineseAnalyzer 自带的中文分词器 -->
<fieldType name="solr_cnAnalyzer" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>
</fieldType>
配置 ik 分词器#
先下载 solr8 版本的 ik 分词器,下载地址:search.maven.org/search?q=com.gith...
分词器 GitHub 源码地址:github.com/magese/ik-analyzer-solr
下载 jar 包
将 jar 包拷贝到 tomcat\webapps\solr\WEB-INF\lib
下
然后到 solrhome\demo_core\conf
目录下配置 managed-schema 文件
在配置文件中加入以下代码:
<!-- ik分词器 -->
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="ik.conf"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>
测试#
启动 solr,测试一下刚刚配置的中文分词器。
本作品采用《CC 协议》,转载必须注明作者和本文链接
推荐文章: