public class AddressMatchSetting extends Object
中文地址模糊匹配设置类主要用来对中文地址模糊匹配操作进行一些设置,包括设置地址词典,参与中文地址模糊匹配的数据集以及参与匹配的字段集合。
构造器和说明 |
---|
AddressMatchSetting()
默认构造函数,构造一个新的 AddressMatchSetting 对象。
|
AddressMatchSetting(AddressMatchSetting addressMatchSetting)
根据指定的 AddressMatchSetting 对象构造一个与其完全相同的新对象。
|
限定符和类型 | 方法和说明 |
---|---|
int |
addSearchData(DatasetVector dataset,
String addressField)
添加用于地址匹配的数据集。
|
void |
clearSearchData()
清除所有用于中文地址模糊匹配的数据集。
|
DatasetVector[] |
getDatasets()
返回用于中文地址模糊匹配的数据集集合,即待匹配的中文地址将在这些数据集中搜索与其匹配的内容。
|
String |
getDictionaryFile()
返回地址词典文件的全路径,包括文件夹目录和文件名。
|
String[] |
getFields()
返回用来做中文地址模糊匹配的字段集合,即待匹配的中文地址将在参与匹配的数据集中的这些指定的字段中搜索与其匹配的项。
|
boolean |
removeSearchData(int index)
移除指定索引的数据集。
|
void |
setDictionaryFile(String value)
设置地址词典文件的全路径,包括文件夹目录和文件名。
|
boolean |
setSearchData(int index,
DatasetVector dataset,
String addressField)
用指定的数据集替换指定索引处的用于中文地址模糊匹配的数据集。
|
public AddressMatchSetting()
public AddressMatchSetting(AddressMatchSetting addressMatchSetting)
addressMatchSetting
- 指定的 AddressMatchSetting 对象。public DatasetVector[] getDatasets()
public String[] getFields()
public String getDictionaryFile()
AddressDictionary
类。
分词是把中文的汉字序列切分成有意义的词,比如说:我是一个学生,那么分词后的结果是:我/是/一个/学生。地址词典是这些有意义的词的集合。
注:地址词典
英文是以词为单位,词与词之间用空格隔开,例如【Thank you.】 计算机很容易通过空格来识别 you 是一个单词。而中文是以字为单位,通过字组成的句子来表述意思。例如,【我爱北京天安门】,计算机很难知道【天安门】是一个不能拆分的词,这就需要我们进行分词。把中文的汉字序列切分成有意义的词的过程,就是中文分词。而中文分词是基于地址词典进行的,地址词典就是一些有意义的词的集合。中文分词的准确与否,直接影响到中文地址模糊匹配结果的正确性和相关度的排序。
举例说明:【北京天安门】,如果地址词典里面有“北京”、“天安门”等词,则【北京天安门】就会被分词为“北京/ 天安门”。 只有输入 “北京”或“天安门”这两个词中的一个或两个都作为关键词进行搜索,“北京天安门”才能被匹配并搜索出来。
public void setDictionaryFile(String value) throws FileNotFoundException
AddressDictionary
类。
分词是把中文的汉字序列切分成有意义的词,比如说:我是一个学生,那么分词后的结果是:我/是/一个/学生。地址词典是这些有意义的词的集合。
注:地址词典
英文是以词为单位,词与词之间用空格隔开,例如【Thank you.】 计算机很容易通过空格来识别 you 是一个单词。而中文是以字为单位,通过字组成的句子来表述意思。例如,【我爱北京天安门】,计算机很难知道【天安门】是一个不能拆分的词,这就需要我们进行分词。把中文的汉字序列切分成有意义的词的过程,就是中文分词。而中文分词是基于地址词典进行的,地址词典就是一些有意义的词的集合。中文分词的准确与否,直接影响到中文地址模糊匹配结果的正确性和相关度的排序。
举例说明:【北京天安门】,如果地址词典里面有“北京”、“天安门”等词,则【北京天安门】就会被分词为“北京/ 天安门”。 只有输入 “北京”或“天安门”这两个词中的一个或两个都作为关键词进行搜索,“北京天安门”才能被匹配并搜索出来。
value
- 地址词典文件的全路径。FileNotFoundException
- 当地址词典文件不存在时抛出 FileNotFoundException 异常。public int addSearchData(DatasetVector dataset, String addressField)
dataset
- 待添加的用于中文地址模糊匹配的数据集。addressField
- 用于中文地址模糊匹配的字段。public boolean setSearchData(int index, DatasetVector dataset, String addressField)
index
- 要替换的数据集的索引,即在用于中文地址模糊匹配的数据集集合中的索引值。dataset
- 指定的数据集。addressField
- 指定的用来做匹配的字段。public boolean removeSearchData(int index)
index
- 要移除的数据集的索引,即在用于中文地址模糊匹配的数据集集合中的索引值。public void clearSearchData()
Copyright © 2021–2024 SuperMap. All rights reserved.