企业应用历程回顾及未来展望(三): 云时代的BI
一家云计算公司为什么要投入如此多的资金去收购数据可视化公司,仅仅是为了提升数据分析和展示的能力,从而为企业提供更多的服务么?另外,传统的BI厂商和云计算厂商结合后,是否会加速数据上云的过程,提升PAAS平台的服务能力呢 ?未来,商业智能最核心的价值和竞争力是什么
商业智能又被称为BI,主要指商业领域的数据分析和可视化展示。提到BI,最近的一则新闻似乎在行业里引起轰动,那就是领先SAAS公司Salesforce花了150亿美金收购了知名BI公司Tableau。
一家云计算公司为什么要投入如此多的资金去收购数据可视化公司,仅仅是为了提升数据分析和展示的能力,从而为企业提供更多的服务么?另外,传统的BI厂商和云计算厂商结合后,是否会加速数据上云的过程,提升PAAS平台的服务能力呢 ?未来,商业智能最核心的价值和竞争力是什么 ?
带着以上这些问题,首先还是来看下传统BI的价值,传统的商业智能主要是为更好地制订战略和决策提供良好的环境,为特定的应用系统(如客户关系管理CRM、供应链管理SCM、企业资源计划ERP)提供数据环境和决策分析支持。
当面向特定应用的特定战略和决策问题,商业智能从数据准备做起,建立或虚拟一个集成的数据环境。在集成的数据环境之上,利用科学的决策分析工具,通过数据分析、知识发现等过程,为战略制订和决策提供支持。整个过程中,集成的数据环境和决策分析工具是十分重要和不要缺少的。
那么,云计算时代的商业智能和传统的BI相比有哪些不同或者说结合的方式呢?
一、基于云计算模式的BI
1.1 云计算与商业智能结合
BI其实就是一种可视化应用和数据处理的能力。BI上云其实也就是利用云计算提供的海量平台。BI与云计算结合,或者说把BI转移到云计算平台上,将很大程度提高BI的运行速度、数据存储能力、数据分析能力、决策判断能力等。基础架构对应的IaaS平台可以提供基础设施,如虚拟化服务器,而PaaS云能够提供海量的数据存储空间,有助于企业存储越来越多的信息和数据。
最上层的SaaS层面向终端提供服务,按照不同的部署方式,企业的商业智能可选择公有云、私有云和混合云几种。
1.2 IaaS与虚拟服务器、虚拟存储、数据仓库
IaaS是指将IT基础设施能力(如服务器、存储、计算能力等)通过互联网提供给用户使用,并根据用户对资源的实际使用量或占用量进行计费的一种服务。IaaS所提供的资源是富有弹性的,也就是说,当用户需要的时候能够立即提供,而当用户不需要时候能自动回收。
虚拟服务器能够再一台物理服务器上运行多种虚拟服务器。而BI的最核心能力其实是位于PaaS层的数据仓库。当然,创建data warehouse直接在IaaS的虚拟服务器上就能完成。
BI最后给管理者提供的决策建议,其准确度与数据仓库的数据有很大的关系。高质量的数据越多,推荐的结果也更加精准。目前的线下服务器存储能力难以负荷巨大的数据信息量。将DW迁移到云上,有助于更大信息量的存储和分析。
1.3 SaaS与BI应用
SaaS是一种局域互联网提供软件服务的应用模式,它能够以较低的成本为用户提供软件服务,无需软件的安装、管理和支持等复杂的流程,使用户能够获得比本地更好的体验。
从架构成熟度上,BI在SaaS的实现以SaaS服务架构的4级成熟度为前提。4级成熟度包括表现层、调度层、业务层与数据层。BI实质上就是应用而已,构建在云上,显示出极佳的效果。
表现层提供SaaS的展示方式,决定应用能够实现的用户体验水平。BI的服务对象主要是信息技术人员,而不是管理者,BI的可视化效果将影响管理者对决策信息的接受程度。
所谓的可视化技术就是通过计算机图形学和图像处理技术,将数据转换为图形或图像显示等。展示层将BI分析得出的信息与结果用可视化形式表示出来,信息表达、解释和评估的可视化有助于理解所获得的信息并检验信息的实用性。
调度层将客户端发出的请求调度到何时的业务处理服务器上,提高SaaS的交付性能与资源利用率。业务层和数据层为BI应用提供支持。
与云计算技术结合的BI自下而上可划分为三个部分:最底层为基础层,负责BI的数据仓库、存储处理计算等;中间层为平台等,提供编程接口、逻辑实现等功能;最表层为实现层,根据用户的个性化定制,把数据分析的结果呈现给用户。
1.4 私有云、混合云和BI的结合
所谓的私有云,有点像云计算的基础设施,使用虚拟化技术,位于私有数据中心。私有云之所以更受企业认可,是因为私有云比公有云更有私密的保护性。虽然因此其共享性受到影响,但是由于BI里面分析的数据都是企业内部数据,采用私有云可以对数据进行较好的保护。因此BI上到私有云上,不仅可以使数据得到一定的保护,还可以享受云计算带来的便利。
所谓的混合云,就是公有云和私有云的结合,是在云中存在两种或者两种以上云的类型。混合云涵盖了公有云和私有云的属性,使得用户的数据和应用能够根据不同需要在不同的云中迁移。它使企业既有自己的云计算环境,同时也能够使用外部公共云计算的服务。兼顾了公有云的成本优势和私有云的安全性,受到企业的欢迎。
1.5 基于云计算的BI的优点
BI上云主要有以下几个优点:
- 提供更强大的数据存储和管理能力: 面对海量的数据,传统的数据仓库模式已经难以满足当今的需求。基于云计算模式的商业智能可以通过虚拟服务器、虚拟存储等服务,提供给企业更强大的数据存储和管理能力。
- 提供BI的实时性: 企业的现状,包括业务信息、客户信息等不断变化,要做出更为准确有效的决策,这就对BI的实时性提出了更高的要求。基于云计算模式的BI具有更快速、高效、稳健的运行性能,同时扩展性极强。
- 硬件冗余自动故障切换: 云计算将BI所需的数据、应用进行分块,建立在副本,保存在不同的服务器中,避免了物理硬件的损坏。
- 负载均衡: 云计算BI能够将工作均匀分配到不同服务器上,避免个别服务器工作负荷过大,让BI性能发挥到极致。
- 个性化定制: 将BI构建在云上, SaaS将从展现层、业务层、数据层等方面,提供更人性化、更符合企业自身的可定制化配置和用户可自定义功能。
- 成本低: 基于云计算模式的BI更符合企业追求低成本的理念,有助于扩大BI在中小企业中的发展力度,吸引更多的企业商家选择BI。
1.6 应用前景
云计算模式下的BI,企业可将大量数据存储到云中,减少企业硬件成本,获得弹性的存储量大小。
在SaaS上,BI可提供不同的扩展包,分为基础包、专业包、企业包。企业可根据自身需要购买不同层次的扩展包,这三个包给企业提供了更多的选择。
BI所依赖的云,在现阶段主要是以私有云为主。虽然公有云的成本更低,但是安全性还有待时间的考证。然而,随着云安全性的不断提升,可以预见,BI将逐步有私有云迁移到公有云,毕竟公有云成本更低。
随着云计算技术的不断完善,BI必将逐步迁移到该平台上,不同类型的企业都会逐步尝试采用这种低成本、高效率、可扩展的模式,具有广大的市场机会。
二、基于云端的数据处理能力
相比于传统的OLTP和OLAP,云端的数据处理目前最核心的技术在于机器学习,这也是为什么最近Apache Spark变得越来越流行,大有取代hadoop之势。因为Apache Spark除了性能更好以外,更重要的是融入了先进的机器学习库,可以建立聚类和预测模型,高效实现业务场景。
从业务层面,传统的BI分析仅仅能够展示现有的数据统计信息,没有任何趋势分析和决策建议,对管理层无法带来实质性的价值。而借助人工智能技术,建立的数据模型具有前瞻性和参考价值,帮助管理者洞察业务关键信息。
标准BI和机器学习的结合模式如下图所示:
从运营成本层面,本地建立机器学习模型成本非常的高,不仅需要昂贵的硬件设施,而且必须雇佣专业的数据科学家。而数据上云以后,可以直接建设在第三方的IaaS和PaaS平台上,调用第三方供应商开发的机器学习模型也相对简单高效。当然这个也带来了接下来我们要讨论的一个企业担忧的问题 - 云端安全。
三、云端安全性探究
3.1 安全性隐患
云计算的安全性一直是备受关注的问题。云安全主要包括系统安全和数据安全。在云计算环境下,用户对云计算数据中心的强依赖性,以及云计算服务对网络条件的高要求,系统安全目前非常受重视。
虚拟存储等服务,实际上是将企业的内部数据外包给服务商,使得数据的私密性成为了云计算服务的一个困扰。但是建立正确的安全模型、选择正确的安全方法,那么在云计算平台上可以实现对数据、系统安全性的保证。
3.2 安全解决方案
在基于云计算的BI中,针对安全问题,可以封装一个安全层。云模式BI的安全模型构建主要包括三个层面的安全性保障措施: 基础设施层、底部架构层、数据信息层。
在基础设施层上,根据安全防护需求,将云计算划分成几个安全域。各安全域之间通过防火墙进行隔离。虚拟机接收到的包必须经过虚拟网卡。这个虚拟网卡是通过 Host OS创建的,可对经过它的包进行过滤选择。倘若某个包是发往不允许接收的端口,则虚拟网卡会丢弃这个包,以免端口收到攻击。通过防火墙的隔离,确保安全域之间的数据传输的安全性和稳定性。
由于云计算需要建立在互联网上,因而对基础网络的安全性也有要求。云计算BI的平台应进行统一IP地址规划,对各部分再进行IP地址和数据链路地址绑定。此外还应建立异常流程监控体系,以防网络收到攻击。
在底层架构层上,主要针对的是IaaS服务。解决方法之一,就是将一系列虚拟机进行划分,在同一区域内的虚拟机拥有一致的安全水平,相互之间可以安全交换信息,并与非该区域的虚拟机隔离,通过特定的安全策略与可信虚拟域外的虚拟机进行通信。所有加入可信虚拟域内的虚拟机都需要事先通过安全认证。
在数据信息层里,可采取数据备份、身份认证、权限管理、加密传输等技术,实现对数据信息安全性和安全性的保护。为防止数据不慎损坏,需要对数据信息进行备份与恢复。通过对用户身份认证,确保以身份进行操作的操作者就是这个数字身份的合法拥有者,也就是保证操作者的物理身份与数字身份相对应。
结语
回到我们开始谈到的那则新闻,不难理解Salesfroce为什么要花大代价采购Tableau。主要还是因为Salesforce拥有大量的用户数据和云计算能力,而tableau拥有从数据仓库到数据分析和报表完整的BI产品体系,两者的结合可以增强彼此的产品和服务,将BI部署到云上,产生更强的竞争壁垒。
BI与云计算的集合是当下热门的问题。基于云计算模式的BI,其本质还是BI,云计算只是一个平台,它结合了两者的优势。云计算的海量存储、数据挖掘能力,为BI提供了良好的基础,同时其拥有的相比传统模式更为低廉的收费,使企业减少成本,有助于吸引中小企业的加入。
BI的核心竞争力在于机器学习等AI技术的植入。将BI与云计算结合,其强大的功能将为企业管理带来前所未有的助力。
本文由@静空一叶 原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Unsplash,基于CC0协议
作者暂无likerid, 赞赏暂由本网站代持,当作者有likerid后会全部转账给作者(我们会尽力而为)。Tips: Until now, everytime you want to store your article, we will help you store it in Filecoin network. In the future, you can store it in Filecoin network using your own filecoin.
Support author:
Author's Filecoin address:
Or you can use Likecoin to support author: