EDW2016|NOSQL异军突起 阿里首发中国企业好声音

    xiaoxiao2024-04-17  5

    美国西部时间4月17日至4月22日,第20届企业数据世界EDW大会在加利福尼亚州圣迭戈(San Diego @ California)呈现了精彩纷呈的六天五晚议程。

    EDW大会全称是Enterprise Data World(即:企业数据世界),也是DAMAInternational(国际数据管理协会)的年会,每年4月召开,今年是第20届。回顾一周的会议,有这样几个特点:议题丰富精彩纷呈、参会者更加国际化、形式保持传统又有所创新、生态环境有所变化。下面且听我们一一解读。

    议题:NOSQL异军突起,三大分论坛深度聚焦

    DAMA协会成立之初,讨论焦点源于数据建模、元数据,后来逐渐发展到数据架构、数据治理、数据质量等数据管理主题的方方面面,对于最上层、最为个性化的数据分析应用和最基础的数据技术实现这两个环节,讨论相对较少。今年是大数据火热的第6个年头、也是EDW的弱冠之年,一向以稳健和基础的数据管理为主题的EDW会议中,也出现了更多的大数据话题,也许这意味着前几年一直处于探索和快速发展的大数据技术,已然进入了稳健发展阶段、渗透率不断增强,这在会议议题的设置方面已有一定体现。

    让我们来看议题分布图。在去年的议题分析中,“Governance& Stewardship数据治理和认责”以30个议题占各类议题之首,而今年,虽然其数量不变,但被NOSQL以42个议题抢占鳌头。

    会议主办方将NOSQL主题组织成为一个分论坛“NOSQL NOW!”,仔细想一想也不意外,DAMA创建之始主要讨论的数据模型和元数据不也是紧紧依托于关系型数据库么?如今数据库家族中的小兄弟们长大了,自然要得到传统领域的广泛关注。而在NOSQL相关的主题又可以进一步分为:对各类数据库的综合对比,对某类数据库的深度探讨,对NOSQL进行数据建模等几类,以后有机会我们专题解读。对议题感兴趣的小伙伴,可以访问访问官网了解详细议程:http://edw2016.dataversity.net

    NOSQL分论坛之外,会议还有两个分论坛,一是以首席数据官为主题的“CDOVision”,一是以金融行业业务本体为主题的“FIBO”:

    CDOVision——“首席数据官愿景”,顾名思义,主要目的是讨论方向性问题,让数据工作更好为企业价值服务。今年是CDOVision第三次以独立分论坛的形式存在,本次议题安排包括:“连接数据与战略与使命”,“企业分析战略”,“技术创新和领导力”,“建立可持续的数据文化”,“改变思维、保持承诺”,“信息资产管理——资产负债表的两侧”。可见,数据战略、数据价值、数据文化、思维变革、技术支撑,是目前首席数据官们比较关心或应该关心的话题。虽然国内企业尚未广泛设立首席数据官,但数据工作的方向与职责,则是企业高管、CIO和数据从业者们应该关注的。CDOVision上的讨论内容,我们会以单独的报道为您呈现,还请稍候。

    FIBO——“金融行业业务本体”,主要目的是讨论金融行业的知识本体的技术与应用,更好实现金融行业的业务术语、业务概念、业务知识及业务数据的标准化去年的会议也有FIBO分论坛,演讲者主要由FIBO的发起机构EDM Council承担,而今年,演讲者则来自应用方、厂商、高校,可见FIBO已经走出概念和理论阶段,进入技术实现和行业应用阶段。相比与国外有协会联合企业共同开发行业业务本体,国内有类似工作在开展,如银行、证券、保险行业都有行业性的数据标准和数据模型,然而其内容更偏IT,未以业务本体形式体现,其主要参与方也更多是行业信息化人员,业务人员参与有限。更好的数据治理、管理与应用,离不开业务人员的深度参与,我们倡议有更多业务人员关注行业业务概念和数据的标准化。

    在以上三个分论坛之外,会议的其他议题主要以四类形式呈现:Workshop——3小时专题研讨;AdvancedSeminar——6小时深度课程;ConferenceSession——45分钟分享讨论;Panel——四位领域专家圆桌讨论。在此之外,还有兴趣小组、五分钟的启发演讲等,满足各类深度的讨论所需。当然,会议之中还有众多厂商的展台将最新技术产品带给大家。囿于篇幅,我们就不展开说明了。

    开场与结局:无心插柳的设计,却意味深长

    在整个会议217项议题之中,有必要单独把开场与结局两场演讲单独拿出来与大家分享,在御数坊来看,也许这是会议主办方的一次无心插柳的设计,却对数据工作、数据人有意味深长的启示。

    本次会议开幕演讲由BB&T;的首席数据官James Tyo带来,主题是“Top 10 Signs YouNeed an Enterprise Data Office”(你需要建立企业数据办公室的十大迹象)。这是有关企业数据战略和数据组织的讨论,强调了企业数据组织的重要性和必要性并且提出了企业数据办公室成功的十大步骤。可见,开幕演讲从宏观和前瞻性角度进行战略引领。

    而与之相对应的,会议的闭幕演讲则以访谈式进行,由业界知名的两位数据质量专家Danette McGilvray和人称“Data Doc”的Tom Redman带来,主题是“Solving the Big Issues”(解决大问题)。那么什么又是两位数据质量专家眼中的大问题呢?在一个小时的问答中,专家为数据领域引入了一个新词汇“Provocateur”,即:挑衅者。这个词的引入,更多是倡导在企业中一贯扎实、靠谱的数据人,更有勇气去当企业中的“刺儿头”,不满于数据现状、努力去推动变革和创新,坚定而有韧性。

    DAMA中国副会长、御数坊CEO刘晨先生在会场上也向嘉宾分享了他的观点:与Provocateur对应的还有一词“Entrepreneur”即:创业者。在OLTP时代,数据人更多是在理解业务流程、创建数据模型,是一种相对被动的工作方式;而在OLAP和大数据时代,数据需求更加灵活甚至根本还不存在,需要数据人有更多的主动探索意识,更加勇敢的迈出一步去影响业务、去探寻数据价值、去推动变革的发生。而创业者,正是这样一个角色,无论是在公司内部工作,还是独立真正在创业。

    参会者:中国军团参会人数摘探花,阿里首发中国企业好声音

    从参会国家来看,本次会议当之无愧称为“数据世界“。按照官方公布的数据,本次会议共有来自全球38个国家、超过1000名数据从业者参加,参会国家数量和人员数量均创历史记录。美国本土人数最多,其次是近水楼台的加拿大共有33名参会人员。值得一提的是,本次会议有17位来自中国大陆的数据人士参会,继上届7人之后,再创新高。他们分别来自证券行业监管机构(5人)、工信部标准院(2人)、阿里(3人)、华为(6人)、御数坊(2人,也就是我们公司咯)。

    下图为中国军团内部小聚后合影留念。会后大家讨论一致决议:EDW这样的交流机会太难得了,应该尽快把中国版开起来!

    中国军团参会人数飙升,反映了国内大数据产业发展的热度,反映了与国际同行交流学习的渴望,更反映了中国数据人的信心——这信心在阿里数据治理团队的精彩演讲中被推向顶点。去年,DAMA China主席胡本立先生曾经带来中国数据好声音,而此次阿里的演讲则是中国企业第一次在EDW大会上正式发声。阿里数据治理团队三兄弟全部到场,演讲由图海和元甲二位带来,另一位数据安全专家天明则在台下助阵。他们的演讲主题是“Big Complex Data: A Forward Looking Case Study from China”,分别探讨了阿里数据平台的数据成本和数据质量的实践经验,无论是主题本身的前瞻性还是内容的落地程度,堪称本次会议最精彩的主题之一。当然,阿里擅于市场运营的特点也表现的淋漓尽致——技术专家元甲在现场为某宝海外版做了不少推广,引得观众纷纷下载APP。

    下图为图海在介绍数据成本管理实践。

    下图为元甲介绍阿里的大数据质量管理经验

    组织形式:数据、美食、美酒与艺术,全方位的享受

    虽然会议的主题是数据,但物质与精神方面的享受自然不能少。从每天早上的大陆早餐,到会议期间精致茶歇,从午餐的千人盛宴,到特殊时段的美食与美酒供应,会议主办方的贴心安排让参会者大快朵颐。

    大帐篷中千人盛宴,一度让我们想起普吉岛Fantasea演出的4000人大餐厅!

    霸气冲天的牛腿,有这样的美食供应,参会的小伙伴怎能不动力十足!

    而在艺术方面,给大家留下印象最深的,是演讲内容的“图像同传”——随着台上专家演讲慷慨激昂,台下艺术家快速捕获演讲要点,图文并茂的绘制于白板之上。演讲完毕时,一副足以传世的艺术作品跃然眼前,数据的理性之中,渗透着艺术的美妙!会后,主办方也会将这些精品制作成为电子版发布。这种专业与艺术的融合的新形势好像已经出现在国内的会议上了,各位可以多多关注。

    趋势:数据生态呈现新气象,理论与实践并肩前行

    囿于篇幅所限,我们无法将会议内外、台前幕后发生的各种事实和各家观点一一呈现,只能根据我们的所见、所闻、所感提出自己的观察,供各位小伙伴参考。数据治理与管理生态圈中,国际上可称之为Thought leaders数量不多,之前多各扛一杆大旗呐喊,各领一只队伍拼杀,而此次,我们发现已经有思想领袖的公司开始整合,如John Ladley和Kelle O’Neal,两位数据治理专家将公司合并。虽然没有机会与他们探讨,但不难想象,其初衷一定是整合市场资源、服务能力,获得最大化的商业价值。从公司理论来说,公司规模将保持在内部交易成本与外部交易成本相当的那一点。看来,在美国以前单兵作战的方式也许需要改进,从而更好满足客户需求。而在国内,目前普遍还是巨型公司在参与此领域,像御数坊这样的小而美专注公司少之又少,可能还处于从巨头向外分化的过程吧。另一方面,此次会议也颇受软件巨头的青睐,IBM,SAP,Amazon AWS是会议的主要三家赞助商,此外,还有二十余家各类软件或服务商赞助,其演讲内容也逐渐脱离单纯的产品介绍,主动向客户数据管理需求和整体咨询方案靠拢。我们想,商业驱动固然是一方面原因,更重要的,可能是美国各行业经过了多年的数据治理与管理的理论构建和实践,目前客户需要有更多落地需求。而体系化的理论和方法实践,在国内几乎只有银行业具备多年实践,对于其他大部分行业来说,数据治理还是新鲜事物。我们也建议大家理性看待数据治理与管理的工具平台建设,先理清思路,再考虑平台。

    结语:御数之旅,且行且珍惜

    EDW会议的内容太过丰富,总是觉得有太多整体或细节的内容言之未尽,远远不是这数千字可以记录的。我们后续会选择一些精要内容,再以专题报道的形式体现。如果说抛开各种技术细节,需要从整体上对这次御数之旅做些总结的话,可能我们对于开局与结局的思考,最为合适,因为有了思维和内心的主动和求变,数据甚至任何事情,都有向好的可能:

    当我们反思一首一尾两场论坛时,不禁又有更深一层体会:开幕演讲由CDO探讨宏观战略,而闭幕演讲的而主题词是Provocateur,由两位数据质量专家呈现。传统数据人在大数据时代,需要有新精神、新思维、新技能!以首席数据官开始,以数据质量结束,纵有顶天之能,也要有立地之本,追求质量与靠谱,任何时候都不会过时!这也是御数坊一直在追求的"御数有道,独具匠心"。

    原文发布时间为:2016-05-05

    本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

    相关资源:电信EDW系统环境介绍
    最新回复(0)