最近一直在看简历,面试同学,发现符合要求的很少。本文是同学们进入阿里云等公司的hadoop内核研发岗位的一个指引,需要具备哪些要求,如果不具备则可以往这方面努力。
如果 以下的问题不能很好回答,还是多多学习啊。 如果很好回答,对阿里云有兴趣,欢迎找我。
这里涉及一般为
语言基础知识(一般需要在某语言2年以上经验)
比如:JVM的GC算法,JAVA多线程并发机制,线程安全机制,OOM咋办,core了咋办算法基础知识,冒泡排序、链表、树、线性回归……分布式理论:数据分布方式、Lease机制、日志技术、两阶段提交、CAP理论、Quorum机制操作系统……比如:
分析时数据倾斜了怎么办?hdfs写的链路是啥?集群的利用率不高,为什么?怎么调查?hbase二级索引是咋回事情?数据高可靠,服务高可用怎么做?system占用率比较高,一般啥原因?如果让你设计一个spark,你打算怎么设计?流式计算怎么流控?实时计算与离线怎么混合部署?一车分布式理论的知识?主要考察编码能力,一般来讲,经常写代码的同学可能比较上手。一般为5个题目,其中有2个算法题目。笔试过的同学80%都说比较简单,但是做起来就是不太理想。这个要注意平时写代码要记住关键的词(因为写代码没有自动补全,基本就是纸上或者在记事本上写的)
技术交流钉钉大群 阿里云 HBase+Spark社区 【强烈推荐!】 群内每周进行群直播技术分享及问答
加入方式1:点击link申请加入 https://dwz.cn/Fvqv066s 加入方式2:钉钉扫码加入: 相关资源:python入门教程(PDF版)