Tag: 数据仓库

大数据量的数据库select?

我即将开始一个应该有一个相当大的数据库的新项目。 表的数量不会很大(<15),大多数数据(99%)将被包含在一个大表中,这几乎是插入/只读(没有更新)。 这张表中的估计数据量每天将增长到50万条 ,我们至less要保留1年才能做好各种报表。 需要将(只读) 复制数据库作为备份/故障转移,并且可能在高峰时间卸载报告。 我对这个大型数据库没有第一手的经验,所以我问在哪种情况下哪个数据库是最好的select。 我知道Oracle是安全的,但如果有人对Postgresql或Mysql有类似的设置经验,那么我更感兴趣。

数据仓库与OLAP多维数据集?

任何人都可以解释什么是数据仓库和OLAP立方体之间的真正区别? 他们是不同的方法相同的事情? 其中一个与其他人相比是否被弃用? 其中之一是否有任何性能问题? 欢迎任何解释

数据仓库注意事项:何时和为什么?

这里有一点背景: 我知道什么是数据仓库 ,或多或less。 我已经阅读了数十篇关于数据仓库的指南,我已经使用了SSAS,我知道什么是星型模式,维度表和事实表,我知道ETL是什么以及如何去做。 这不是一个“如何”的问题或者对教程的要求。 我的问题是,我读过的关于数据仓库的所有资料似乎都掩盖了构build数据仓库的基本原理 。 它们都是比喻性的,或者在某些情况下,从字面上开始,“ 所以你决定build立一个数据仓库…… ”除了我还没有做出这个决定。 所以我希望SO成员能指点一下,或者帮助拿出某种半客观的testing。 有些东西可以适应某个特定的系统,最后是“我们需要一个数据仓库”或者“不,今天的回报太小”。 我认为我应该能够回答的具体问题是: 在什么时候构build数据仓库是一个值得考虑的select? 换句话说,我应该寻找什么样的迹象,指标或其他标准,这可能表明一个标准的交易环境已经不够了。 全function数据仓库有哪些替代scheme? 在事务数据库和沼气标准复制的“报告服务器”中的非规范化是想到的两个; 在提交DW之前还有其他的我应该探讨吗? 为什么数据仓库比上述select更好? 如果答案是“取决于”,那么它依赖于什么? 什么时候不应该尝试构build数据仓库? 我对所有被视为“最佳实践”的事物持怀疑态度,而不考虑上下文。 当然,必须有一些情况下DW是错误的select – 它们是什么? 有没有什么实际的例子可以看到通过引入数据仓库而得到改进的系统? 一些能够向我解释的,端到端的,他们需要什么types的决策或分析,他们如何决定如何投入,以及仓库如何适应更大的环境? 我不想做一个“让我们从AdventureWorks数据库中创build一个多维数据集” – 这个实现与我无关,我对所涉及的规范和devise以及整个思维过程感兴趣。 我一般不要问多方,但我认为这些都是非常密切的。 我愿意接受任何解答至less前四个问题的答案,尽pipe最后的答案确实有助于在我的脑海中形成这种结果。 链接是好的,如果有人已经写了这个,只要他们是合理的简洁和具体(链接到Ralph Kimball的主页=没有帮助)。 希望我已经明确提出了这个问题 – 在此先感谢您的答案!

OLAP数据库是否需要非规范化才能读取性能?

我一直认为数据库应该是非规范化的读取性能,因为它是为OLAP数据库devise完成的,并没有夸大3NF太多的OLTPdevise。 PerformanceDBA在各种岗位上,例如,针对基于时间的数据的不同方式的performance,通过规范化为5NF和6NF(标准forms)来维护数据库应该总是精心devise的范例。 我的理解是否正确(以及我理解的正确)? OLAP数据库(低于3NF)的传统非规范化方法/范式devise出现什么问题?3NF对OLTP数据库的大多数实际情况是否足够? 例如: “简单的事实是,6NF,正确执行,是数据仓库”(PerformanceDBA) 我应该承认,我无法理解非规范化促进阅读performance的理论。 任何人都可以给我提供这个和相反的信念的合理解释吗? 在试图说服我的利益相关者说OLAP /数据仓库数据库应该正常化时,我可以参考哪些资源? 为了提高可见性,我从这里复制了评论: “如果参与者在他们已经看到或参与的6NF中添加(披露)了多less实际(不包括科学项目)的数据仓库实施,这将是一件好事。 – Damir Sudarevic 维基百科的数据仓库文章告诉: “Ralph Kimball的标准化方法(也称为Ralph Kimball的一维方法)也被称为3NF模型 (第三范式),其支持者被称为”Inmonites“,他们相信Bill Inmon的方法,其中声明数据仓库应该是使用ER模型/标准化模型进行build模“。 看起来规范化的数据仓库方法(Bill Inmon)被认为不超过3NF(?) 我只想了解什么是数据仓库/ OLAP是非规范化的同义词的神话(或无处不在的公理化信仰)的起源? Damir Sudarevic回答说,他们的做法很好。 让我回到这个问题:为什么非规范化被认为有利于阅读?

星型模式devise

Star-Schemadevise对于数据仓库是不可或缺的吗? 或者你可以用另一种devise模式来做数据仓库吗?

数据库和数据仓库有什么区别?

数据库和数据仓库有什么区别? 它们不是同一个东西,或者至less是写在同一个东西(即Oracle RDBMS)?