版本

# 图算法


# 简介

eZooDB基于图论与机器学习理论,为用户提供了多种图算法,可以帮助用户探索数据的非显性关系,分析并挖掘数据的深层价值。例如:发现图中相似节点或关键节点,快速查找点间特定路径,发现图中特定结构等。

eZooDB图算法包括中心度、社区发现、相似度、路径匹配、点映射、拓扑链接预测等六大类,同时包括各种企业场景下的特殊发掘算法,共计30余种,可以满足业务场景中丰富的图上的探索需求,帮助用户进行各类数据分析。

eZoo-Studio中的的图算法模块,可以帮助用户快速地了解eZooDB的算法功能,同时:

  • 在小规模的数据场景中,获得直观的,全局的查看体验,快速了解图中数据的分布与特点。
  • 辅助无技术基础的业务人员高效地使用图算法,可视化查看分析结果,进行数据分析。
  • 所有算法具有预先设计的内置参数,可一键查询,使用户快速获得查询结果。

探索页面选择左侧标签栏的图算法分析,可以在下拉菜单选择不同的算法应用。

目前eZoo-Studio中仅支持部分eZooDB的图算法,后续我们会持续更新其他算法。

本文档将会在每类算法中选取部分算法为例,介绍eZoo-Studio的算法功能使用,关于其他算法的信息可查看图算法接口的详细技术文档


# 中心度算法

中心度算法主要用于识别图中特定节点的角色及其对网络的影响,快速发现图中更“重要”的节点。不同的中心度算法具有不同的判断策略,在不同的场景下有不同的应用,例如:

  • 在金融风控场景中,追踪资金流向,分析股权关系
  • 在互联网络或城市网络管理场景中,发现关键设备或设施节点,调整网络结构
  • 在供应链分析场景中,分析供应商影响,发现重点企业
  • 在舆情监控场景中,发现重点传播节点,分析传播链路
  • 在市场运营场景中,辅助店铺选址,广告投放分析

# Pagerank算法

Pagerank算法根据边上权重值,基于传播模型,计算图中节点的重要程度,可用于进行重要基因探索,交通流量预测等。

  • 界面左侧可以配置算法查询的相关参数,调整算法模型。

  • 点击查询后就可以在右侧看到算法结果。其中,中心度较大的点,体积也会变得更大。

  • 点击表格视图,或点击右侧菜单栏,可以看到各个节点的中心都分数。


# 社群发现算法

社群指在一个图上紧密相连的点集合,而社群发现算法用于划分图中节点,或发现符合需求的社群。根据不同的发现策略,一张图可能会被划分成不同的社群。在不同的场景下,社群发现算法有不同的应用,例如:

  • 在反欺诈场景中,发现洗钱团伙,进行可信计算
  • 在市场运营场景中,分析产品定位,填补市场空缺
  • 在电商场景中,绘制用户画像,进行商品的智能推荐
  • 在生物医疗场景中,分析生物分子,发现医疗社群结构

# LPA算法

LPA(Label Propagation Algorithm in semi-synchronous way)算法基于半同步标签传播理论,通过半监督学习,将图中的节点进行社群划分,具有很好的分类表现。

  • 界面左侧可以配置算法查询的相关参数,调整算法模型,平衡计算消耗与分类效果。

  • 点击查询后就可以在右侧看到算法结果。其中,处在同一社群的节点会被框在一起。

  • 点击表格视图,或点击右侧菜单栏,可以看到各个社群,以及其中包含的节点。

# k-core算法

k-core算法目的是发现图中指定核心度的子图结构,帮助用户发现一个网络中的核心团体。

  • 界面左侧可以配置算法查询的相关参数,选择适合的核心度进行发现。

  • 点击查询后就可以在右侧看到算法结果。其中,符合核心度的子图结构会被框选。

  • 点击表格视图,或点击右侧菜单栏,可以看到核心社群的节点信息。

最近一次更新时间: 9/26/2022, 10:00:46 AM