# 图数据库
# 市场背景与特点
随着各行各业对于智能化的更高要求,除了需要存储更大规模的数据之外,对于异构数据、汇集新数据、基于复杂关联分析等能力的需求也越来越强,图数据库可以很好的补充传统数据库的不足,以相互补充的方式,更好的满足市场需求。
如今,已经有越来越多的应用场景背后出现了图数据库的身影,基于知识图谱的搜索增强、基于社交关系的商品推荐、基于交易行为的风险预测等等

图数据的定义可描述为:
以顶点(点)、关系(边)为基础单元,适用于表示数据与数据之间拓扑关系的一种数据结构。
图数据库的定义可描述为:
以图数据为存储单元,以高效存储、查询图数据为目标,更适合处理复杂关联型数据的数据管理系统,属于非关系型数据库(NoSQL)。
通常在图数据库中,数据实体会以点进行存储,而实体与实体之间的关系会以边进行存储,由于关系被直接存储为基础数据单元,这样的架构使得图数据库能够更灵活、更快速的响应基于复杂关联的查询。
eZoo图数据库(eZooDB),是高可用、易扩展、国产化的原生分布式图数据库。
# 与关系型数据库的区别
- 存储模型不同
在关系型数据库中,基础数据结构是表
,通过抽象化将数据转换为统一结构,再将最终结构化的数据存储在表中。
而在原生图数据库中,基础数据结构是点
和边
,通过点集合与边集合,完整的存储了整个数据集的拓扑关系,其他数据则作为点、边的属性进行存储。

- 查询分析模型不同
关系型数据库主要的计算模型是基于行扫描(select)、行连接(join)、行过滤(filter)等。
由于数据实体之间的关系已被抽象并拆分存储在了不同表之中,如果想要查询小王有哪些好友?
,首先需要把两张表进行连接操作,再通过扫描、过滤,最后找到的目标数据。
如果想要查询小王的好友的好友是谁?
、哪些人不是小王的好友?
等基于深层关系、关系组合的查询,则复杂程度成倍增加。

而图数据库的计算模型是基于拓扑学的理论,通过图游走、图算法等方式,通过关系、及多重嵌套的关系,非常灵活、快速的找到目标数据。

# 我们的优势
- 国内自主研发,高效安全可控
eZooDB是国内自主研发的、原生分布式图数据库,安全性高,可控性强。采用C++,从底层开始研发,功能灵活同时具备超高性能,软件部署包小,并且适用性好。
- 毫秒查询效率,性能全球领先
eZooDB打通了底层数据存储与上层计算,提供一站式的数据处理与分析服务,最大化的发挥了各个模块的优势。通过集成集成底层数据存储、高性能计算、图深度学习模块,助力挖掘更多、更深层次的数据价值。
- 超高计算性价比,降低总成本
得益于eZooDB超高的计算性能,以往必须使用大规模集群才能满足的计算场景,只需要几个eZooDB节点即可完成。搭配灵活的商业模式,帮主客户实现总体成本(TCO)最低的刚性需求。
- 分布式高可用,生产安全保证
支持分布式数据存储,保证生产环境的数据安全,提升了系统稳定性、可用性与处理效率,同时具有易于扩展,搭建灵活的特征。
# 案例场景
图数据库非常适合社交网络、欺诈检测、推荐引擎、实时图谱等需要存储高度互联数据集的场景。
例如:在一个典型的社交网络中,常常会存在谁认识谁
、上过什么学校
、常住什么地方
、喜欢什么餐馆
等类似的查询,传统关系型数据库对于超过2张表进行关联查询就已经十分低效,难以胜任,但图数据库可轻松应对各种复杂关系组合的查询。
我们准备了几个经典案例场景的快速入口:
更多案例分享,欢迎查阅eZoo案例场景。