简单分析SQLite4的一些设计改变
1.0 内容提要
SQLite4 是一个放在库中的紧凑的,自包含的,零维护的的ACID数据库引擎, 像SQLite3一样, 但具有改进的接口和文件格式.
运行时环境封装到了一个对象之中.
使用了一个很不错的键值对存储引擎:
- 一个独立的大型键空间 - 不是SQLite3中那种每个表单独的键空间和索引.
- 按字典顺序的键排序.
- 多个存储引擎,可在运行时互换.
- 默认在磁盘上的存储殷勤使用了一个日志结构的合并数据库.
表的PRIMARY KEY真正被用作存储引擎的键.
可以使用小数点运算.
外键约束和递归触发器默认是启用的.
覆盖指数可以显示声明.
2.0 概述
SQLite4 对于SQLite3而言,是一个可选方案,而不是一个替代方案. SQLite3 还没有过时. SQLite3 和 QLite4 将会并行受到支持. SQLite3 遗留的好处不会被抛弃. SQLite3 还将会被持续的维护和改进. 但如果需要的话,新系统的设计者现在将可以选择 SQLite4 而不是 SQLite3.
SQLite4 努力保持了SQLite3的最优秀特性,同时在不破坏兼容性的前提下解决了SQLite3中无法修复的问题. SQLite3 和 SQLite4 中将会持续保持一样的特性有:
- SQLite4 是放在一个库中并链接到一个大型应用程序的完整的,关系型,事务性的, ACID, SQL 数据库引擎. 没有服务器,I/O直接面向硬盘.
- SQLite4 的源代码任何人可以用于任何目的. 没有版权、发布或者公开源代码或者编译二进制文件方面的的限制. 不用去担心烦人的许可证.
- 使用了动态类型,而不是大多数其它的SQL数据库引擎所使用的僵化的静态类型.
- (默认)在磁盘上的镜像是一个单独的使用良好且稳定文件格式的磁盘文件, 使得SQLite4库适合于作为一个应用程序的文件格式使用.
- SQLite4 将会是快速且可靠的,无需管理员操心它就能运作的蛮好.
- SQLite4 的实现只有最简化的依赖,因而它可以很容易的集成到嵌入式系统或者其它非常规的运行时环境.
实现上仍然采用常用的汇编语言C。与SQLite3相比,SQLite4使用了更多C99特性,不过仍然可以使用常见的编译器编译。SQLite4使用了诸如size_t,int64_t,uint64_t以及其他标准数据类型。
SQLite4的编程接口与SQLite3的非常相似,只不过命名前缀都从sqlite3_更改为sqlite4_。SQLite3中旧的和作废的接口已经从SQLite4中剔除了。给一些函数增加了参数,有时对参数稍作修改或者对其参数顺序进行重新排序。修改了某些接口名字,使其更加符合其功能。总体上来说,SQLite4的编程接口与SQLite3的非常相似,这样移植一个SQLite3上的应用到SQLite4上只需花一个小时或者两个小时完成搜索替代就可以了。
SQLite3和SQLite4没有共用任何符号,因此把SQLite3和SQLite4同时嵌入到同一进程,同时使用它们都是可行的.
3.0 SQLite4的主要改变
3.1 运行时对象
SQLite4中一些接口的第一个参数接收一个(新加的)指向一个sqlite4_env对象的指针,它定义了运行时环境。需要接收sqlite4_env指针的示例程序包括:
- sqlite4_open()
- sqlite4_malloc(), sqlite4_realloc(), and sqlite4_free()
- sqlite4_mprintf()
- sqlite4_random()
- sqlite4_config()
一个sqlite4_env对象实例定义了SQLite4与其他系统交互是如何交互的。一个sqlite4_env对象包含的方法能够:
- 分配,进入,离开和收回互斥体
- 分配,调整和释放堆内存,
- 访问和控制底层键/值存储引擎,
- 使用高质量随机种子初始化内建PRNG,
- 取得当前时间和日期与本地时区,
- 记录error日志消息.
标准平台(windows和Unix)的SQLite4构建包含了一个全局sqlite4_env对象,通常这个对象适配于所在平台。如果一个接口程序的参数中有一个指向sqlite4_env对象的指针,而且传给这个参数的指针是空指针时,这个接口程序就会使用默认的全局sqlite4_env对象。另外,某些应用可能要求在相同的地址空间上运行两个或者多个SQLite4实例,同时每个实例使用了各自不同的互斥原语,不同的内存堆以及不同的时间日期函数等等。SQLite4通过对每个数据库实例创建不同的sqlite4_env对象来满足这种需求。sqlite4_env对象中还废除了全局和静态变量,这样就可以非常容易地把SQLite4移植到哪些对静态或者全局数据提供有限支持的嵌入式系统中。
3.2 简化的键/值存储引擎
相对于SQLite3,SQLite4使用的键/值存储引擎拥有一个大大简化了的接口。这个存储引擎是可拔插的;通过对qlite4_env对象在打开新的数据库连接前做适当的改动,它可以在运行时被改变。
SQLite4 需要一个实现了有序键/值对的存储引擎,它的键和值是任意长度的二进制数据。键必须惟一,且按字典排序。也就是说,键应该根据一个比较函数进行排序,例如:
int key_compare(const void *key1, int n1, const void *key2, int n2){
int c = memcmp(key1, key2, n1<n2 ? n1 : n2);
if( c==0 ) c = n1 - n2;
return c;
}
给定一个探针键,SQLite4需要能够找到它最近的键,然后以字典序升序或降序遍历键。向一个已有的键插入数据时会覆盖旧数据。事务,包括原子提交和回滚,由存储引擎负责。
SQLite4经由表和索引,将所有数据存储到一个单独的键空间, 与此相反,SQLite3中每个表和索引都需要一个单独的键空间。SQLite4的存储也与SQLite3不同,因为它需要存储引擎以字典序对键进行排序, 而SQLite3使用了一个非常复杂的比较函数来决定记录的存储顺序。
SQLite4与存储引擎之间的通信是通过一个定义完善的并且简单的接口进行的。新的存储引擎可以在运行期间进行替换:只要在指定数据库连接之前替换sqlite4_env对象里的某些函数指针就可以了。
如果替换的存储引擎不支持回滚,那么这就意味着SQLite4无法运行ROLLBACK。如果替换的存储引擎不支持事务嵌套,那么这就意味着SQLite4无法运行嵌套事务。因此,嵌入到SQLite4中的存储引擎的功能越少,对应的整体的系统功能就会越差。
默认情况下内置的存储引擎是日志结构的合并式数据库。它比LevelDB要快很多倍,支持嵌套式事务,它把整个内容存储在单一的磁盘文件里。SQLite4的未来版本还可能包含一个内置的采用B树结构的存储引擎。
3.3 现在的PRIMARY KEY是真正的主键
Sqlite3允许声明表中的任何单个或多列为主键。但在内部,SQLite3只将PRIMARY KEY简单地当做唯一约束来对待。实际中用于存储使用的键是每一行的rowid。
Sqlite4则相反,它真实地使用声明的表主键(更确切地说是PRIMARY KEY的编码值)作为键而插入存储引擎。SQLite4表通常没有rowid(除非在表没有PRIMARY KEY的情况下,这时需要一个rowid作为隐式主键。)这意味着内容在磁盘中按主键的顺序存储。这也意味着可以通过对PRIMARY KEY的一次查询即可定位记录。在SQLite3中,主键上的一个搜索意味着在自动创建的索引中先找到rowid,然后依据该rowid对主表做一个二次搜索。
SQLite4 需要 PRIMARY KEY 的所有元素不能为空. 这是一条SQL标准. 由于早期版本的疏忽, SQLite3 没有在PRIMARY KEY 列上强制加上这条NOT NULL约束,到该漏洞被发现的时候SQLite3已经在被广泛使用了, NOT NULL 约束的激活就可能会对太多的程序造成影响.
3.4 十进制数
SQLite4 使用十进制算数做所有的数字计算. SQLite4 从不使用C类型的double或者float(除了在double和内部十进制表示之间转换时使用语接口例程中). 相反,所有数字值在内部表示方式为一个带有3位数字的基于10的指数的18位十进制数. 这一表示方式的特性有:
- 即使是在缺乏对于IEEE 754 binary64浮点数字支持的平台上,其运作起来也是可靠和兼容的.
- 货币计算通常可以精确的进行,不需要四舍五入.
- 任何有符号和无符号的64位整数都能被精确的表示.
- 浮点数范围和精确度超出了 IEEE 754 binary64 浮点数.
- 正无穷和负无穷以及 NaN (Not-a-Number) 都有良好的表示方式.
SQLite4 使得整型和浮点型数字之间没有了差别. 不过期却有精确和近似数之间的分别. 在 C/C++ 中, 整形数是精确的而浮点数是近似的. 但SQLite4并不一定如此. 浮点数字在SQLite4可以是精确的. 可以用64位表示的整型数在SQLite4中总是精确的,而大型的整型数则可能是近似的.
SQLite4 数字格式是面向内部使用的. 数字可以在整型和double型之间转换,用于输入和输出. 磁盘上的存储空间需要从1到12位的SQLite4数字值, 这取决于其大小和重要的位数.
3.5 外键约束和递归触发器是默认开启的
外键约束在SQLite3的早期版本中是没有的,并且他们默认关闭了向后兼容的能力。但是外键约束一直是有效的,并且在SQLite4中是默认打开的。所有的外键约束都是默认延迟的,尽管他们能够被定义成立即创建。但是,没有有效的机制去触发外键约束,不管是延迟创建还是立即创建。
SQLite3提供了递归触发器,但是这只是在一个运行时才有效的功能。在SQLite4中,所有的触发器在所有的时间段里都是递归的。
3.6 明确的索引覆盖
SQLite4 像 CREATE TABLE 语句中条件了一个可选的子句,该子句定义了在索引中重复的附加列信息. 这可以让应用程序开发者在SQLite4中无需使用任何花招就可以明确地创建覆盖索引. 例如:
CREATE INDEX cover1 ON table1(a,b) COVERING(c,d);
上面的 cover1 索引可以在存储引擎中用一个单一的查找操作来进行形式如 "SELECT c,d FROM table1 WHERE a=?1 AND b=?2" 的查询. 索引中如果没有附加的 COVERING 子句, SQLite4 也许会在存储引擎中做两次操作; 一次操作基于a和b的值来找到主键,而第二次操作则基于主键来找到c和d的值. COVERING 子句使得c和d的值在索引中就可用,这意味着它们无需第二次查找就可以从索引中提取出来.
COVERING 语句上有一个变化:
CREATE INDEX cover2 ON table(x,y) COVERING ALL;
COVERING ALL 语句的意思是数据表的所有列都在索引中被重复一份,这就确保了原来的数据表永远也不会被访问到,以完成一个使用了这个索引的查询. 这种方法的缺点,当然就是信息重复,而且因此让数据库文件更大. 但是通过在索引指标上明确指定COVERING关闭,SQLite4可以让应用程序开发者权衡着从应用程序中腾出空间和时间来让其更加适用.