2009年,大数据进入国内,2013年开始爆发;2014年,"大数据"首次出现在《政府工作报告》;2015年,国务院正式印发《促进大数据发展行动纲要》;2016年,人工智能浪潮来袭,大数据产业步入万亿产业规模时代;2018年,随着新型智慧城市和数字城市的建设,各地的大数据和数字经济相关的园区加速落地,大数据产业规模持续增长;2020年,国务院在《关于构建更加完善的要素市场化配置体制机制的意见》中,首次将数据与土地、资本、劳动力并列为关键生产要素,并提出加快培育数据要素市场的要求;2021年,《中华人民共和国数据安全法》正式施行,国家在规范数据处理活动、保障数据安全、促进数据开发利用、保护个人与组织合法权益、维护国家安全和发展利益等方面进一步"严抓严控"。

据赛迪顾问预计,到2027年,我国大数据产业规模将会达到1.8万亿元。在此背景下,青云QingCloud为了更好地帮助企业挖掘海量数据价值,驱动数字化转型,于近日推出了青云大数据工作台。

深耕大数据,形成30款数据产品和服务"全家福"

青云QingCloud 大数据产品经理刘雄风介绍,青云自2014年开始布局大数据相关业务,历时4年,于2018年从广度上实现了数据产品和服务的全面覆盖。自2018年开始,青云又从产品和服务深度入手,全方位提升产品性能及服务质量。

自2014年至今,青云已经推出了近30款数据产品及服务,同时秉持开源开放的态度,集成了优秀合作伙伴的应用,形成了包括数据库与缓存、消息队列与中间件、大数据服务、数据仓库与BI、对象存储在内的数据产品生态。

"基于近30款产品及服务,青云打造了完整的、可插拔的、全流程的企业级大数据平台,在任何环节都能为客户提供他们所需要的数据产品和服务。"刘雄风指出。

基于此,青云已经为来自金融、制造、教育、医疗、交通、能源、政务、互联网等行业客户提供了优质的服务。

青云大数据工作台,应"云原生"而生

现阶段,如何实现数据同步、实时计算、数据统一监控和调度,以及权限控制、数据建仓等已经成为亟待解决的痛点。"客户的需求已经从最初的‘底层资源’问题,逐步升级到‘数据层’问题。"刘雄风指出。也正是因此,青云着力打造了大数据工作台。

刘雄风表示,青云大数据工作台基于打通大数据全链路的初衷,通过整合青云自身大数据产品和服务,为客户提供了一个一站式智能大数据开发与治理平台,帮助企业降低大数据使用门槛,实现数据的统一调度和计算,从而更好地挖掘数据价值,激发数据动能。

值得一提的是,青云大数据工作台是基于云原生架构打造。从整体架构来看,大数据工作台从最底层到最上层有五层架构,应对大数据全链路场景的需求。

第一层,云原生。大数据工作台基于云原生的开发架构,支持容器化部署。

第二层,全托管式计算引擎。大数据工作台提供全托管式计算引擎服务,基于Flink流批一体的计算引擎,同时兼容多种计算引擎为一体的计算资源服务。

第三层,全生命周期数据开发。大数据工作台提供全生命周期的数据开发服务,通过向导式的数据集成,支持可视化数据加工、调度管理、资源管理、网络管理等多种场景。

第四层,高效的数据同步。大数据工作台提供高效的数据同步服务,能够兼容结构化、非结构化、半结构化的数据,可对数据进行实时、增量和全量的同步。

第五层,应对丰富的业务场景。包括BI商业智能分析、用户画像、增长分析和数据大屏等应用,为业务决策提供有效的数据支撑。

刘雄风表示,基于云原生架构的大数据工作台,可以部署在开源的Kubernetes容器平台上。对于客户而言,其使用起来更加开放和包容,不会被云厂商绑定,跨云、跨容器、跨厂商均可运行。在功能层面,基于云原生所提供的特性能力、在线运维、弹性扩容以及跨云服务,能够保障服务的高可用和数据的高可靠,降低运维成本,提高资源利用率,优化大数据工作台的使用体验。

与此同时,大数据工作台还具备"开箱即用、弹性扩容、存算分离、开放兼容、安全可靠、生态整合"等六大特性。

持续丰富功能模块,释放数据价值

目前大数据工作台仅是1.0版本,主要具备"数据集成、数据加工、统一数据存储和服务"功能模块,可将企业数据安全地同步到云端,并在云上的大数据开发环境,将数据进行加工、处理,然后根据数据特性,将处理完的结果数据,存储在不同的存储介质中,以备使用。整个过程,大数据工作台还支持计算饱和度跟踪,提醒企业及时调整计算资源。

具体到功能使用场景,刘雄风指出,大数据工作台目前重点支撑精细化运营分析场景、实时计算场景、可视化开发运维场景、构建数仓场景。

精细化运营分析场景主要针对中小型互联网或移动互联网客户,为用户画像、推荐、数据分析、大屏展示和数据治理等需求提供服务支持。

实时计算场景面向智慧工厂,以及对实时数据加工处理有需求的客户,重点帮助客户开展IoT终端实时数据分析、实时客户日志分析等任务。

可视化开发运维场景针对以学习或科研为目的的客户,通过提供多维度计算支持,让客户能够轻松搞定科研数据的挖掘、处理和输出科研分析报告。

构建数仓场景主要是面向在青云云平台上使用了消息队列、数据库、数据仓库、大数据计算存储的客户,重点提供数据集成、实时或离线计算、数据存储等服务。

未来,大数据工作台将从数据治理、数据资产,以及优化体验三方面着重发力,持续丰富功能模块,不断优化使用体验,并在智慧工业、智慧零售、智慧政务、智慧校园四个"数智"场景重点发力,帮助企业激活数据资产,释放数据价值。