VastbaseE100

基于开源技术的HTAP数据库管理系统。性能优异,稳定可靠,提供诸多专属领域特性。

Menu

产品功能

        Vastbase E100作为关系型数据库,拥有大量的数据类型、丰富完善的SQL语法、强大的查询优化器、并发控制手段、存储优化手段等。其中针对IT系统开发与调优、数据库管理与维护过程中最常用、具有较高价值的功能点,下本文将进行简要的说明与指引。

索引

        索引是增强数据库性能的常用方法。索引允许数据库服务器比没有索引时更快地查找和检索特定行。但索引也会增加整个数据库系统的开销,因此应该明智地使用它们。Vastbase E100提供多种不同的索引类型,以在不同的业务场景中提供更高的处理效率:
        - B-Tree:适用于等值和范围查询,比如使用<、<=、=、>=、>运算符之一进行比较。
        - Hash:适合很长的关键字做等值检索的情况。
        - GIN: 倒排索引接口常被用于多值列的检索,例如全文检索类型、数组类型。
        - RUM:Rum索引适合全文检索,属于GIN的增强版本。
        - GiST:合适空间类型、范围数据和多值情况。
        - SP-GiST:类似于如GiST索引,是一种提供了支持各种搜索的基础结构。
        - Brin:适用于大范围的连续检索,如时序数据、线性数据等。
        - Bloom:Bloom索引属于lossy索引,支持任意列组合的等值查询。
        - Zombodb:Zombodb索引让Vastbase E100可以直接读写ES,提供SQL接口的搜索引擎,实现数据的透明搜索。
        - 表达式索引:Vastbase E100允许索引是基于表的一列或多列计算的函数或标量表达式。此功能对于根据计算结果快速访问表非常有用。
        - 条件索引:AtasDB可以给一个索引设置一个过滤条件,仅仅让可能需要被查询的数据建立索引能够大大减小索引容量并提高检索速度。

表分区

        Vastbase E100支持对数据表进行分区。分区是指将一个大表分成较小逻辑存储对象,从物理上分开存储。索引的层级也能得到降低,从而使查询性能得到提升。同时在运维的便利性上也能得到一定程度的提升。Vastbase E100目前支持范围分区、列表分区、哈希分区和复合分区多种模式。
- 列表(List)分区
        通过显式列出每个分区中出现的键值来对表进行分区。
- 范围(Range)分区
        该表被分区为由键列或列集定义的“范围”,在分配给不同分区的值范围之间没有重叠。例如,可以按日期范围或特定业务对象的标识符范围进行分区。
- 哈希(Hash)分区
        通过为每个分区指定模数和余数来对表进行分区。每个分区将保存分区键的哈希值除以指定模数的行将产生指定的余数。
- 复合分区
        在上述的分区模式的基础上,再次进行二次甚至三次的子分区,形成多层级的分区结构,这适合数据量特别庞大的情况。

外部数据包装器

        如今企业IT系统存在着各异的数据源,Vastbase E100实现了部分SQL / MED规范,允许用户使用常规SQL查询访问驻留在Vastbase E100之外的数据,这些数据称为外部数据。通过外部数据包装器能够直接连通外部的各种外部数据源,包括传统的关系型数据库、NoSQL数据库、文件、大数据平台、搜索引擎等等,把当中的数据以外部表的方式进行便捷地访问。

并行查询

        Vastbase E100支持并行查询,查询优化器会自动根据该查询估计的开销判断是否需要启用并行操作,以及在执行计划的哪个步骤进行并行,在开启并行功能后能利用更多CPU内核,从而充分发挥硬件性能,大幅提升数据检索效率。这个功能是完全自动化,无需人工干预的。

高可用集群组件

        Vastbase E100提供基于日志的数据复制功能,通过将日志从主节点实时传输到从节点,使得从节点随时保持与主节点一致实现数据库的高可用性。从节点可以运行在只读模式,根据需要可以实现对应用的读写分离功能。
        Vastbase E100高可用集群组件会自动对节点的主机、网络、数据库可用性等关键资源状态进行监控,当主节点发现出现严重故障时,集群组件会自动将从节点转换为主节点,实现秒级的业务接管,保障业务连续性。
        根据用户的架构设计需要,可以使用一主多从的模式满足业务系统不同等级的可用性需求,比如灾备、两地三中心等。

分布式架构

        Vastbase E100的分布式集群架构对上层应用提供统一的连接入口:Coordinator协调器,并通过协调器进行全自动、对应用透明的任务分发,并自动进行数据分片,将指令与数据按照经过优化的算法,寻找最佳的路径分发和存放到多个不同的运算(Worker)节点,查询时自动进行任务分配、结果校验与分类汇总。应用只需要专注在自身的业务逻辑上,无需关心数据存储、控制与查询逻辑,即可获得极佳的性能和扩展性。
        Vastbase E100分布式集群支持全局事务,会话与事务有效性被全自动、智能地维护到集群的每一个节点上,上层应用完全无需对后台的并行处理作任何考虑,无论集群后台由多少个节点组成,上层应用只需要将其视作一个单机版的数据库即可获得良好的并发能力和高可用性。