如果需要对成千上万的网络抓包数据文件,在规定的时间内进行解析,应该怎么做?
主要分3部分:
文件相关的表: 使用2个表来描述
bc_file_list:文件清单 bc_fs_list:文件对应的文件系统的详情任务相关的表:使用3个表来描述
bc_task_list: 任务清单 bc_task_filein:输入 bc_task_fileout:输出计算节点相关的表:使用1个表来描述
bc_launcher_list:有那些机器,每台机器指配给了哪个任务主要分为3个独立的程序
launcher:负责与数据库交互 ,获取需要处理的文件信息(注意并发),监控节点健康状态executor:负责与文件系统交互,启动具体的任务,监控任务执行状态task: 具体的任务程序,比如一个网络数据的解析程序分为3个独立程序的原因:
保证launcher的精简和健壮,不会任务任务的失败导致整个节点的调度挂掉保证对task的监控,如果某一task失败,也需要报告其状态,达到对任务的完整跟踪。1 台MySQL服务器1 个文件系统12 个计算节点45350 个文件
文件系统的网络带宽MySQL的负载
作者:https://yq.aliyun.com/u/huaheshang
相关资源:敏捷开发V1.0.pptx