共享目录 |
您可以将网络中共享的或本地文件目录中的 csv 文件、udb 数据集文件及子文件夹,以及本地文件目录中的 TIFF、GeoTIFF 栅格数据用于分布式分析。其中,将本地文件目录中存储的栅格数据(如 TIFF、GeoTIFF )注册到 iServer 后,可分布式入库到 HDFS 分布式存储库以及本地文件系统存储中。
您还可以将网络中共享的或本地文件目录中的 udb 数据集文件及子文件夹用于机器学习服务。
登录 iServer 服务管理器,依次点击“数据-数据注册”,进入注册数据存储页面(http://{ip}:{port}/iserver/admin-ui/data/dataRegistration),点击“注册数据存储”按钮,并配置以下参数:
点击“注册数据存储”按钮即完成注册。
在配置"共享目录"时,您可进行以下操作:
根据您决定使用的 Spark 集群节点数 :
建议:多个 Spark Worker 节点时,为避免映射盘符冲突,不要将数据所在的计算机作为 Spark Worker 节点。
根据您注册的文件类型 :
如果注册的是带有 csv 文件的文件目录,则需填写csv文件所在的目录的上一级目录。以下图为例,填写的路径为F:\file\test,其中,csv文件的字段、属性等格式必须相同。(仅支持已只读的方式打开csv文件目录)
注:如果您注册的是 csv 数据文件,需要经过验证,才可用于分布式分析服务。详见:csv 数据文件验证
配置步骤如下: