用集群脚本功能让2.0.0及之前版本的包月集群presto支持读取oss数据

    xiaoxiao2026-03-30  10

    参照 集群脚本功能介绍,本文介绍如何用集群脚本功能让2.0.0及之前版本的包月集群presto支持读取oss数据。

    准备脚本

    下载 脚本,放在您的oss合适的目录里。

    运行脚本

    集群列表页面点击对应集群的查看详情按钮左侧菜单单击集群脚本,进入该集群的集群脚本执行界面单击右上角创建并执行,进入创建界面。选择刚才的脚本,设置名字,执行的节点默认,点击执行,完成添加并执行操作。集群脚本列表可以看到新创建的集群脚本,点击刷新可以更新集群脚本的状态。等待集群脚本完成

    验证

    hive建表

    下文举了一二创建数据在oss上的uservisits表的例子,请将表名,字段,oss信息替换为您oss数据对应的信息

    CREATE EXTERNAL TABLE uservisits (sourceIP STRING,destURL STRING,visitDate STRING,adRevenue DOUBLE,userAgent STRING,countryCode STRING,languageCode STRING,searchWord STRING,duration INT ) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS SEQUENCEFILE LOCATION 'oss://<accessid>:<accesskey>@<bucketname>.oss-cn-hangzhou-internal.aliyuncs.com/<datapath>';

    presto查询

    退出hive cli,进入presto cli./presto --server localhost:9090 --catalog hive --schema default执行show tables能看见刚刚创建的表,执行select counT() from uservisits能查到oss数据的条目。如果未显示,可能是还未同步,稍等一会

    最新回复(0)