加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

es中文分词器设置

(2023-06-02 21:47:37)
分类: 数据库es
keep_first_letter启用此选项时,例如:刘德华> ldh,默认值:true

keep_separate_first_letter启用该选项时,将保留第一个字母分开,例如:刘德华> l,d,h,默认:假的,注意:查询结果也许是太模糊,由于长期过频

limit_first_letter_length 设置first_letter结果的最大长度,默认值:16

keep_full_pinyin当启用该选项,例如:刘德华> [ liu,de,hua],默认值:true

keep_joined_full_pinyin当启用此选项时,例如:刘德华> [ liudehua],默认值:false

keep_none_chinese 在结果中保留非中文字母或数字,默认值:true

keep_none_chinese_together保持非中国信一起,默认值:true,如:DJ音乐家- > DJ,yin,yue,jia,当设置为false,例如:DJ音乐家- > D,J,yin,yue,jia,注意:keep_none_chinese必须先启动

keep_none_chinese_in_first_letter第一个字母保持非中文字母,例如:刘德华AT2016- > ldhat2016,默认值:true

keep_none_chinese_in_joined_full_pinyin保留非中文字母加入完整拼音,例如:刘德华2016- > liudehua2016,默认:false

none_chinese_pinyin_tokenize 将不是汉字的拼音字母进行分词,用于对拼音输入进行分词,默认值:true,如:liudehuaalibaba13zhuanghan- > liu,de,hua,a,li,ba,ba,13,zhuang,han,注意:keep_none_chinese和keep_none_chinese_together应首先启用

keep_original 当启用此选项时,也会保留原始输入,默认值:false
————————————————
版权声明:本文为CSDN博主「java_骨灰级」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/u013548106/article/details/111057549

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有