首页 / 知识
如何按Lucene.Net字段排序,并忽略常见的停用词,例如\\’a \\’和\\’the \\’?
2023-04-15 13:13:00

How to sort by Lucene.Net field and ignore common stop words such as 'a' and 'the'?我发现了如何通过Lucene.Net索引中的给定字段而不是分数来对查询结果进行排序;它所需要的只是一个已索引但未标记化的字段。但是,我仍无法弄清如何在不考虑停用词(例如" a"和" the")的情况下对该字段进行排序,例如,以下书名将以这种升序排列: 这样的事情有可能吗,如果可以,怎么办? 我正在使用Lucene.Net 2.3.1.2。 我将Lucene返回的结果包装到我自己的自定义对象集合中。然后,我可以用额外的信息/上下文信息填充它(并使用荧光笔类之类的东西来提取匹配的片段),并添加分页。如果您采用类似的方法,则可以创建一个"结果"类/对象,添加类似SortBy属性的内容,并获取要排序的任何字段,删除任何停用词,然后将其保存在此属性中。现在只需根据该属性对集合进行排序。 对于搜索,我发现带有排序选项链接的搜索lucene .net索引对于解决您的问题很有趣 似乎有一个陷阱22,您必须使用分析器对字段进行标记化以去除标点符号和停用词,但是您不能对标记化的字段进行排序。然后如何在不标记的情况下剥离停用词? 自从我使用Lucene以来已经有一段时间了,但是我的猜测是添加一个额外的字段,用于在其中已经删除了停用词的情况下对值进行排序和存储。您可能可以使用相同的分析器来生成该值。 创建索引时,创建一个仅包含希望排序的单词的字段,然后在检索时对该字段进行排序,但显示完整标题。 |
最新内容
相关内容
linuxps命令排序?
linuxps命令排序?,系统,状态,情况,基础,软件,进程,工具,命令,实时,发行,linux内存使用大小排序在 CentOS 中,可以通过 top 命令来查看 CPU 使用文件夹排序linux命令?
文件夹排序linux命令?,系统,数字,信息,工作,时间,命令,管理,设备,单位,工具,基本linux命令1、linux系统常用操作命令如下:ls:全拼list,功能是列出linux使用索引命令?
linux使用索引命令?,名称,系统,命令,文件,环境,工作,位置,目录,文件名,索引,在linux中如何用命令查找文件在哪1、使用查找命令 “find”命令允linux下抓取字段命令?
linux下抓取字段命令?,数据,系统,命令,单位,报告,工具,字符串,文件,范本,样式,Linux系统怎么使用awk命令处理文字数据?其中command是真正的awklinuxls命令排序?
linuxls命令排序?,工作,系统,信息,数据,命令,目录,标准,基础,管理,时间,Linux列出当前目录下的文件和目录用什么命令在Linux系统中,使用ls命令linux提取字段串命令?
linux提取字段串命令?,数字,字符串,状态,工具,命令,文件,范本,样式,正则,字段,linux如何获取两个字符串之间的内容?1、在 Linux 中,您可以使用linux排序数字命令?
linux排序数字命令?,标准,数字,单位,情况,系统,信息,命令,文件,顺序,参数,linux下用shell编写,键盘输入三个数,按大小排序输出1、这个问题可以linuxll排序命令?
linuxll排序命令?,系统,信息,地址,标准,工作,命令,时间,数据,文件,目录,Linux列出当前目录下的文件和目录用什么命令1、linux系统下用ls命令列linux命令忽略错误?
linux命令忽略错误?,系统,地址,工作,信息,设备,命令,设计,灵活,观察,标准,linux命令问题,在使用ls命令时,能不能不让输出错误信息--pid=进程号linux刷新索引的命令?
linux刷新索引的命令?,系统,工作,工具,管理,软件,设计,状态,基础,命令,预期,【Linux操作】---终端神器tmux一般使用命令和快捷键进行操作,可在linux命令按大小排序?
linux命令按大小排序?,数字,地址,时间,工作,标准,系统,命令,信息,单位,软件,linuxsort命令列表从大到小排序完如何保存Linux sort命令参数:-b:忽linux计数排序命令?
linux计数排序命令?,标准,命令,情况,工作,文件,系统,数字,管理,目录,内容,Linux文本处理命令的Sort命令sort命令的语法格式:sort[参数][文件]Li