标题:
AWS EMR 上跑 Hadoop 运用过程中遇到的问题总结
[打印本页]
作者:
look_w
时间:
2017-11-4 12:46
标题:
AWS EMR 上跑 Hadoop 运用过程中遇到的问题总结
遇到问题“EMR_DefaultRole is invalid.”在AWS EMR上运行Hadoop的ngram的时候,出现下面错误:
查询【1】中的log可以发现是”EMR_DefaultRole is invalid.”,这个东西没有创建,那么可以使用【2】【3】中的办法解决,如果还不能解决,那就把IAM账户添加Administer的权限。
之后就可以使用:
aws emr create-default-roles
创建默认角色。
对于EMR的了解:【4】【5】【6】【9】
运行的时候看任务有些没有看到注意time zone,显示的任务只显示你之前设定的时区。
AWS的命令行看【7】【8】可以了解一些AWS的CLI的用法。
AWS的安装看【10】,在Ubuntu或者是OS上安装AWS的CLI。
AWS的账号注册看【11】了解AWS的注册。
AWS EMR的配置需要使用AWS的CLI进行操作,就需要进行配置。看【12】了解更多。
AWS的instance讲解【14】
Unsupported major.minor version 52.0遇到这种问题,就是你生成的java运行程序的版本和AWS上的版本不一致。比如你用java8生成的程序不能跑在AWS EMR默认的java7的平台上。
你可以把java程序改成java7的版本,但是依然会有问题,所以可以改成:
1) cd $PROJ3_ROOT
2) ant clean
3) ant
4) Reload 18645-proj3-0.1-latest.jar to aws bucket, if you already uploaded the jar file compiled with java 1.8 before.
5) run the NgramCount program on EMR cluster
欢迎光临 电子技术论坛_中国专业的电子工程师学习交流社区-中电网技术论坛 (http://bbs.eccn.com/)
Powered by Discuz! 7.0.0