佳工机电网 在线工博会 我的佳工网 手机版 English
关键字  
  选择展区 >>
您的位置: 首页 > ERP/制造业信息化展区 > CIO信息化管理展厅 > 产品库 > BI商业智能 > 技术论文 > 正文 产品库 会展 人才 帮助 | 注册 登录  
CIO信息化管理
 按行业筛选
 按产品筛选
查看本类全部文章
e展厅 产品库 最新动态 技术文章 企业目录 资料下载 视频/样本 反馈/论坛
  技术应用 | 基础知识 | 外刊文摘 | 业内专家 | 文章点评 投稿 发表科技文章 
商业智能的性能
newmaker
欢迎访问e展厅
展厅
3
CIO信息化管理展厅
电子商务/企业门户, IT运维管理, 制造执行系统MES, 流程管理BPR/BPM, SOA/SaaS/云计算, ...
数据仓库引擎是BI中的核心,它的性能高低直接决定了BI的表现。

一个完整的BI(Business Intelligence)应用通常涉及数据仓库引擎及其相关的设计建模工具、ETL工具、前端展现工具等。这里的数据展现主要作用是以图表、Dashboard等形式将结果呈现给用户;ETL负责将原始数据进行抽取、转化、清洗、装载进数据仓库;数据仓库负责执行数据的存储和管理,并执行前端展现工具提交的各种查询分析任务。在BI应用中,数据仓库类似于汽车的引擎,居于核心地位,它的性能高低直接决定了BI应用的响应速度。而在大型BI应用中,性能是一个非常关键的问题,特别是那些有着海量数据、需要完成复杂查询任务的系统,数据仓库引擎的选择就更为关键。

不同的技术路线

综观目前的数据仓库市场,能提供这一个工具的供应商并不多,一线的厂商主要有Teradata、IBM、Oracle、Sybase、Microsoft等。尽管同为数据仓库引擎,但是这些供应商各自所走的技术路线并不同,不同的技术也导致了它们的产品具有完全不同的特点。

Teradata应该算最为特立独行的一个。Teradata数据仓库主要运行在NCR WorldMark SMP硬件的Unix操作系统平台上(该公司也提供基于Windows NT的Teradata),它的高性能主要通过Teradata与NCR硬件平台海量并行处理服务器(Massively Parallel Processing, MPP)结合,以及采用特有BYNET协议和查询优化等技术实现并行等机制来实现。由于采用一些专有的硬件和技术,因此,价格较高,是数据仓库中的贵族。

IBM、Oracle和Microsoft的数据仓库引擎属于同一类,它们都提供数据库产品,其数据仓库引擎和数据库引擎从技术上说有很多相似之处。这种技术路线给它们带来的好处是,其数据仓库解决方案很自然地从数据库技术拓展和延伸而来,集成性、延续性比较突出。

与IBM、Oracle等相比,虽然Sybase也同时提供数据库和数据仓库产品,但是,其Sybase的数据仓库引擎却走了一条与其数据库、也与Oracle、IBM完全不同的技术路线。其中最大的不同就是在Sybase数据仓库引擎(即Sybase IQ)中采用列存储架构,而所有关系型数据库引擎广泛采用的则是行式存储。

列存储技术

在关系型数据库内核中,数据库是按行来存储数据记录的,也就是说数据库表最典型的表示为一条数据页链,每一数据页中有一行或者多行数据记录。而在数据仓库应用中,从查询性能的观点出发,这种存储方式并不可取。因为在OLTP(在线事务处理,即传统数据库应用)环境中,一个事务处理是与一行(或多行)数据有效对应的,而在OLAP(在线分析处理,即BI应用)环境中,以查询处理最多,而查询是基于特定的列来选择的。Sybase IQ是按列来组织数据的,每张表是一组相互独立的页链,每个页链代表表中的一列。

基于列存储所带来的一个直接好处是,在压缩方面比传统的关系型数据更加有效。这是因为同一列的所有数据域有相同的类型,因而每一列都可以为优化的效率和检索进行压缩。而基于行的存储,各个不同的域拥有各不相同的数据类型,尽管这非常适合交易进程,但并不适合压缩,因为压缩很可能只能采用一种最低通用原则。

事实上,在压缩效果上,Sybase非常自信。Sybase中国公司CTO卢东明对记者表示,Sybase IQ能保证至少3倍以上的压缩比。高的压缩能力能带来存储成本的节约,有人曾经对数据的存储成本进行过估算,目前每管理1TB数据的软硬件加人力成本大约为5万美元左右。

列存储的另一个好处是性能上的提高。在行存储方式的情况下,如果需要访问数据必须读出完整的一行,而不管你实际感兴趣的是其中哪一个或几个域。因此,这可能形成只需要50K的数据却需要读出500k的情况。而在采用列存储方式时,可以只读出所需要的列数据。读出数据量的减少直接后果就是性能的提高。特别是在处理大数据量、复杂的跨多表查询时,列存储在性能上的提升非常明显。

除此之外,Sybase IQ还采用了其他的一些专有技术,如位图索引和BitWise索引技术等。“由于这些技术的采用,最终保证了Sybase IQ查询速度的极大改进,这种速度的提高能达到10倍以上。因此,我们认为Sybase IQ的技术是革命性的。”Sybase的卢东明在接受记者采访时表示。

目前,上述三种不同的数据仓库技术到底哪种更好,各家都有自己的说法。因此,对用户而言,具体选择时还需多了解同类型的BI应用。不过,用户倒是乐观其成,毕竟竞争可以带给用户更好的技术和产品。(end)
文章内容仅供参考 (投稿) (如果您是本文作者,请点击此处) (6/4/2007)
查看更多BI商业智能相关文章: more
·规则业务为BI系统添智能 newmaker (5/23/2007)
·给中小企业普及商务智能早不早? (4/14/2007)
·BI项目中ETL设计与思考 newmaker (4/13/2007)
·角逐商业智能世界 Mary Hayes Weier 翁美飞 译 (4/10/2007)
·BI与其他软件融合将成为新的应用趋势 newmaker (4/3/2007)
·寻找BI成功的秘诀 孙林 王君 (4/2/2007)
·2007 Gartner商业智能峰会:重定义BI Hannah Smalltree (3/20/2007)
·企业级数据仓库建模思想在商务智能领域的应用 IDS Scheer中国 刘芳 (3/10/2007)
·做一个成功的决策支持项目 IDS Scheer中国高级咨询顾问 曹建华 (3/10/2007)
·商业智能面临数据集成统一的问题 newmaker (3/10/2007)
查看更多CIO信息化管理相关文章: more
·推动遗留系统现代化革新的三种方式 Taylor Bornstein (3/27/2022)
·食品物流服务提供商Farm Trans借助Mendix解决方案构建高效欧洲供应链 Mendix (9/16/2021)
·制造业企业信息化过程中普遍面临的问题 CAXA (6/1/2007)
·CIO提升地位办法--适应更多数据 newmaker (6/1/2007)
·中小企业危机四伏--专家漫谈IT拯救危机 郝鹏 赵东 (5/30/2007)
·如何在短时间内就从SOA中获得价值 Sidney Hill, Jr (5/30/2007)
·MES 入门:逛超市体会MES newmaker (5/29/2007)
·内容管理:企业信息化新重点 newmaker (5/26/2007)
·中小企业六西格玛软件三问 丁海骜 严雪林 (5/26/2007)
·中小企业CIO自己编织的信息化“魔咒” (5/26/2007)
查看相关文章目录:
·ERP/制造业信息化展区 > CIO信息化管理展厅 > BI商业智能 > CIO信息化管理文章
文章点评 查看全部点评 投稿 进入贴吧


对 CIO信息化管理 有何见解?请到 CIO信息化管理论坛 畅所欲言吧!


网站简介 | 企业会员服务 | 广告服务 | 服务条款 | English | Showsbee | 会员登录  
© 1999-2024 newmaker.com. 佳工机电网·嘉工科技