public class AddressDictionary
extends com.supermap.data.InternalHandleDisposable
该类用于管理分词词典。通过该类可以添加或删除地址词典中的词,可以实现文本文件与地址词典文件的相互转换,还可以实现多个地址词典的合并。目前已支持繁体地址词典。
分词是把中文的汉字序列切分成有意义的词,比如说:我是一个学生,那么分词后的结果是:我/是/一个/学生。地址词典是这些有意义的词的集合。
public void addressDictionaryTest(String dictionaryFile1, String dictionaryFile2, String newdictionaryFile) { // 根据指定的地址词典文件构造一个地址词典类对象,返回地址词典中词的个数 AddressDictionary addressDictionary = new AddressDictionary(dictionaryFile1); int wordsNumberA = addressDictionary.getCount(); // 向地址词典中添加指定的词 addressDictionary.add("长春工业学院"); addressDictionary.add("长春植物修景学院"); // 判断该地址词典中是否包含“长春建筑大学”这个词 boolean isContains = addressDictionary.contains("长春建筑大学"); // 删除地址词典中指定的词 addressDictionary.delete("长春建筑学院"); // 保存地址词典 addressDictionary.save(); // 返回地址词典中词的个数 int wordsNumberB = addressDictionary.getCount(); // 将地址词典文件转换成文本文件 AddressDictionary.dictionaryToText(dictionaryFile1,"G:\\Data\\coreDict.txt"); // 将两个地址词典合并为一个地址词典 AddressDictionary.mergeDictionary(dictionaryFile1, dictionaryFile2, newdictionaryFile); }
构造器和说明 |
---|
AddressDictionary()
构造地址词典类的一个新对象。
|
AddressDictionary(String dictionaryFile)
据指定的地址词典文件构造一个地址词典类对象。
|
限定符和类型 | 方法和说明 |
---|---|
int |
add(String word)
向地址词典中添加指定的词。
|
int |
add(String word,
int frequency)
向地址词典中添加指定的词及相应词频。
|
void |
clear()
清空地址词典中的所有词。
|
boolean |
contains(String word)
判断该地址词典中是否包含指定的词。
|
boolean |
delete(int index)
删除地址词典中指定序号的词。
|
boolean |
delete(String word)
删除地址词典中指定的词。
|
static DatasetVector |
dictionaryToTabular(String dictionaryFile,
Datasource targetDatasource,
String targetDatasetName)
将词典文件转换为属性表。
|
static boolean |
dictionaryToText(String dictionaryFile,
String textFile)
将地址词典文件转换成文本文件。
|
static boolean |
dictionaryToText(String dictionaryFile,
String textFile,
boolean isTraditional)
将地址词典文件转换成文本文件(繁体场景下使用)。
|
void |
dispose()
该方法用于释放占用资源。
|
String |
get(int index)
返回指定序号的词。
|
int |
getCount()
返回地址词典中词的个数。
|
int |
indexOf(String word)
返回指定的词在地址词典中的序号。
|
boolean |
load(String dictionaryFile)
加载指定的地址词典文件。
|
static boolean |
mergeDictionary(String dictionaryFile1,
String dictionaryFile2,
String dictionaryFileResult)
将两个地址词典合并为一个地址词典。
|
boolean |
modifyFrequency(String word,
int frequency)
修改词频。
|
boolean |
save()
保存地址词典。
|
boolean |
saveAs(String dictionaryFile)
将地址词典文件另存为指定的地址词典文件。
|
static boolean |
tabularToDictionary(DatasetVector sourceDataset,
String wordFieldName,
String frequencyFieldName,
String dictionaryFile)
将属性表转换为词典文件。
|
static boolean |
textToDictionary(String textFile,
String dictionaryFile)
将文本文件转换成地址词典文件。
|
static boolean |
textToDictionary(String textFile,
String dictionaryFile,
boolean isTraditional,
boolean isBIG5)
将文本文件转换成地址词典文件(繁体场景下使用)。
|
public AddressDictionary()
public AddressDictionary(String dictionaryFile)
dictionaryFile
- 指定的地址词典文件。public void dispose()
public int getCount()
public String get(int index)
index
- 指定序号。public boolean contains(String word)
word
- 指定的词。AddressDictionary
类的示例。public int indexOf(String word)
word
- 指定的词。AddressDictionary
类的示例。public int add(String word)
word
- 指定的词。AddressDictionary
类的示例。public boolean delete(String word)
word
- 指定的词。AddressDictionary
类的示例。public boolean delete(int index)
index
- 指定的序号。AddressDictionary
类的示例。public void clear()
AddressDictionary
类的示例。public boolean load(String dictionaryFile)
dictionaryFile
- 指定的地址词典文件的全路径。AddressDictionary
类的示例。public boolean save()
AddressDictionary
类的示例。public boolean saveAs(String dictionaryFile)
dictionaryFile
- 指定的地址词典文件。AddressDictionary
类的示例。public static boolean textToDictionary(String textFile, String dictionaryFile)
textFile
- 待转换的文本文件的全路径。dictionaryFile
- 指定的地址词典文件的全路径。AddressDictionary
类的示例。public static boolean dictionaryToText(String dictionaryFile, String textFile)
dictionaryFile
- 待转换的地址词典文件的全路径。textFile
- 指定的文本文件全路径。AddressDictionary
类的示例。public static boolean mergeDictionary(String dictionaryFile1, String dictionaryFile2, String dictionaryFileResult)
dictionaryFile1
- 待合并的地址词典文件全路径。dictionaryFile2
- 待合并的地址词典文件全路径。dictionaryFileResult
- 合并后的地址词典文件全路径。AddressDictionary
类的示例。public static DatasetVector dictionaryToTabular(String dictionaryFile, Datasource targetDatasource, String targetDatasetName)
dictionaryFile
- 待转换的地址词典文件的全路径。targetDatasource
- 指定的存储结果属性表的数据源。targetDatasetName
- 指定的结果数据集的名称。public static boolean tabularToDictionary(DatasetVector sourceDataset, String wordFieldName, String frequencyFieldName, String dictionaryFile)
sourceDataset
- 指定的待转换的数据集。wordFieldName
- 词语字段名称。frequencyFieldName
- 词频字段名称。dictionaryFile
- 指定的地址词典文件的全路径。public int add(String word, int frequency)
word
- 需要添加的词。frequency
- 词频。public boolean modifyFrequency(String word, int frequency)
word
- 指定的需要修改词频的词,该词需要在词典中存在。frequency
- 词频。public static boolean textToDictionary(String textFile, String dictionaryFile, boolean isTraditional, boolean isBIG5)
textFile
- 指定的文本文件全路径。dictionaryFile
- 待转换的地址词典文件的全路径。isTraditional
- 是否为繁体。isBIG5
- 是否为BIG5编码。BIG5编码是繁体中文字符集编码标准。Copyright © 2021–2024 SuperMap. All rights reserved.