金山云发力人工智能 与Intel共同打造云端的大数据分析

日期: 2017-04-12 作者:杨旭 来源:TechTarget中国

根据国外研究机构对未来2025年全球的人工智能行业的产业规模进行的预测,到2020年,全球的人工智能行业大约有50亿美元的量级,到2025年将高达350亿美元。国内市场,由中国官方推动的广义AI联盟产业在2018年将达到1000亿人民币的市场规模。如此巨大的市场规模势必会吸引来更多的玩家,掀起一股强势的竞争浪潮。

金山云于2012年成立,专注云计算领域,现在是国内领先的云计算厂商,国内最大的OpenStack厂商,也是国内首家提供混合云部署方案的云企业。当前金山云的业务领域不仅覆盖了基础的存储,计算和网络领域,同时也对游戏、视频、医疗等垂直行业提供行业云方案。

金山云大数据和AI技术总监张东进

金山云大数据和AI技术总监张东进

在近期北京金山软件大厦举办的金山云和英特尔数据分析合作媒体沟通会上,金山云大数据和AI技术总监张东进首先表示:“金山云已经认识到人工智能行业的重要性。金山云会响应国家的号召,与广大科研院所以及英特尔等科技界的合作伙伴一起,构建金山云多层次的人工智能解决方案,包括底层的基础平台以及中间层的SaaS方案,再到更上层的行业解决方案。”

此次会上,金山云推出金山云Hadoop托管服务KMR(Kingsoft MapReduce)。KMR采用了基于英特尔至强处理器E5 v4产品家族的硬件平台,以Apache Hadoop和Apache Spark两大数据计算系统为基础,集成了常用的大数据分析组件,通过自动调度弹性计算服务(KEC),能够帮助企业用户快速构建分布式数据分析系统。

据金山云技术产品部高级产品经理杨亮介绍,KMR整合了大多数经典的大数据分析组件,更关键的是,金山云可以将客户数据与KMR数据打通,不管是客户在金山云上产生的数据或者在自己的数据中心产生的数据,可以做一站式的计算与分析。

另外,KMR还可与金山云的多种云服务产品结合,从而建立端到端的数据分析处理解决方案,进而让用户以更低廉的成本,不但能够获得更可靠的数据,更能灵活方便地对这些数据进行收集和管理。

金山云技术产品部高级产品经理杨亮

金山云技术产品部高级产品经理杨亮

概括来说,KMR具备四大优势:一是完全托管,集群分钟级快速部署;二是性能优化,大数据分析即时响应;三是生态丰富,云服务产品深度整合;四是弹性伸缩,企业TCO有效减负。

目前,KMR已为分布在电商、游戏等行业的10多家客户采用。例如知名网上购物商城当当网,拥有几十大类数百万种商品,在采用了金山云KMR之后,通过KMR服务快速创建Storm和Kafka集群,搭建实时数据处理系统,根据业务需求灵活调整资源配置,有效缓解了促销期间IT系统的压力,大幅减少了系统的维护工作和资源拥有成本。

英特尔助力金山云

金山云KMR解决方案采用了英特尔至强处理器E5 v4产品家族的硬件平台。E5 v4是针对大数据进行了优化的处理器。从英特尔的CPU的发展历程来讲,从E5的v1到v4,每一代性能都会有提升,无论是主频、还是对数据库性能的支持,还有大数据的支持。对于云上的大数据,不管是偏计算型的还是偏存储型的,都有对应的CPU产品来满足用户的应用多样化需求。

英特尔技术专家表示,针对不同的应用负载,英特尔提供不同型号的CPU。在云计算当中主推E5两路,对于企业用户和一些云特定的应用,比如数据库、CRM,英特尔则建议用户采用4路机器。同时,英特尔技术专家还谈到英特尔每一代CPU针对数据处理都添加了很多新特性来支持大数据和数据分析,如AVX指令集,SIMD指令集,TSX以及E5v4当中新加入的RDT等。

杨亮表示, 除了KMR底层依赖于英特尔提供的非常强大和稳定的平台,比如E5 v4系列的处理器以及SSD硬盘;同时,英特尔帮助金山云对一些开源项目或者是开源软件进行优化,比如像英特尔的BigDL模块,可以借此优化Spark机器学习的性能,让KMR也可以做一些简单的机器学习的工作。

张东进表示:“金山云的基础设施很多是构建在英特尔的硬件设施之上,英特尔领先的产品、技术还有理念,不仅对我们金山云有很大的帮助,也促进了整个行业的发展。”

云+大数据+机器学习=新概念

能够为行业客户提供高性能、易部署的大数据云处理平台,是KMR这一解决方案十分重要的价值,也是它的竞争力所在。一般来说,一个比较成熟健壮的大数据平台,从搭建到真正上线可能需要几个月的时间。因此,通过云端进行大数据分析成为一个更好的解决方案,能够帮助用户解决固有难题,包括多租户的实现,快速部署以及系统的灵活性和可靠性。

对此,英特尔技术专家认为,虚拟化、云计算在大数据里面不是必须的,但是没有云计算这个轮子,大数据里面所谓的按需分配、多租户、灵活扩展、动态配置都是不可能的;而如果企业要达到一个成本和可管理性、灵活性的一个折中,云计算是必须的。所以结合在一起就是云上的大数据,从而实现存储集群和计算集群的分离。

云上的大数据机器学习其实包括了三个很关键的词:云、大数据和机器学习。这三个如何结合呢?实际上这三个都不是新的概念,但是结合在一起就很新了:机器学习提供的是算法;大数据提供的是并行计算和分布式存储;云提供的是动态配置。利用机器学习的大脑,大数据的轮子来算,云里面提供了一个动态分配引擎,三者结合到一起实际上就实现了云上的大数据机器学习。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。