Skip to main content

前言(Preface)

原文:Readings in Database Systems, Fifth Edition (2015),编辑 Peter Bailis、Joseph M. Hellerstein、Michael Stonebraker。原书文本采用 CC BY-NC-SA 4.0 许可;本译文按同一许可发布。

距离上一版《数据库系统读本》已经过去十年,数据管理领域在这十年间迅猛扩张。今天的数据库和数据密集型系统处理着前所未有的数据规模,这在很大程度上由“大数据”的兴起,以及存储和计算成本的大幅下降所推动。云计算和微体系结构趋势,使分布式与并行性几乎成了无处不在的关注点。数据来自越来越多类型的异构格式和来源,规模不断增长,并被用于越来越广泛的任务。结果是,通用数据库系统在多个维度上发生了显著演化:从新的存储介质和处理器设计,到查询处理架构、编程接口,再到事务处理和分析领域中新出现的应用需求。此刻令人兴奋:市场剧烈变化,研究中也涌现出许多新思想。

在这个快速变化的时期,我们对传统“红宝书”的更新,既希望为读者提供数据库领域核心概念的基础,也希望对若干选定趋势给出评论。有些新技术与几十年前的前辈惊人相似;我们认为,让读者熟悉这些一手资料很有价值。与此同时,技术趋势正在迫使人们重新评估数据库系统几乎所有方面,许多经典设计也需要修订。我们编选这本文集的目标,是呈现重要的长期经验和基础性设计,并突出我们认为最具新意、最相关的新思想。

因此,我们选择了一个混合体:既包括数据库早期文献中的经典传统论文,也包括在近期发展中最有影响力的论文,涵盖事务处理、查询处理、高级分析、Web 数据和语言设计等主题。每章都附有一篇简短评论,用来介绍这些论文,并说明我们为什么选择它们。每篇评论由一位编辑撰写,但所有编辑都提供了意见;我们希望这些评论不会缺少观点。

选择阅读材料时,我们寻找符合一组核心标准的主题和论文。第一,每个选题都代表数据管理中的一个主要趋势,这一点由研究兴趣和市场需求共同体现。第二,每个选题都是经典或接近经典的;我们寻找每个主题最具代表性的论文。第三,每个选题都是一手资料。对于本书中的许多主题,都存在优秀综述,我们也会在评论中引用它们。不过,阅读一手资料能够提供历史语境,让读者接触塑造了有影响力解决方案的思考方式,并帮助确保读者在这个领域中打下扎实基础。最后,这本文集代表的是我们当前对于“什么最重要”的品味;我们期待读者带着批判眼光阅读这本文集。

与《红宝书》前几版相比,一个重大变化在于我们处理最后两个部分:分析和数据集成的方式。无论在研究界还是市场中,这两个主题显然都是当今数据管理中最大的问题之一。它们在研究和实践中也都快速演化。面对这种变动状态,我们发现很难就这些主题的“经典”阅读材料达成一致。在这种情况下,我们决定省略正式阅读材料,改为提供评论。这显然会导致我们对该领域现状给出一种高度带有偏见的看法。因此,我们不建议把这两个部分当作《红宝书》传统上试图提供的那种“必读材料”。相反,我们把它们视为可选的结尾材料:“对移动靶的偏见式看法”。提醒读者阅读这两个部分时要有所保留,甚至要比阅读本书其余部分时更加保留。

我们免费发布这一版《红宝书》,并为我们的文本采用一种宽松许可,允许以多种格式进行无限制的非商业再分发。我们没有去获取推荐论文的版权许可,而只是提供指向 Google Scholar 搜索的链接,以帮助读者找到相关论文。我们期待这种电子格式能让“书”的版本更新更频繁。我们计划在适当时候继续演化这个文集。

最后说明一点:这个文集从 1988 年起就一直存在,我们也期待它在未来继续长期存在。因此,我们在灰胡子编辑之外加入了一点“年轻血液”。在适当时候,这本文集的编辑阵容也可能继续随时间演化。

Peter Bailis

Joseph M. Hellerstein

Michael Stonebraker