版本

# 反欺诈反洗钱


# 背景

欺诈是一个影响所有行业和政府服务的巨大且日益严重的问题。全球每年会因欺诈造成超过3.7万亿美元的损失,企业每年平均也因欺诈而损失5%的收入。并且企业需要付出三倍以上的欺诈补救成本,用于处理拒付、费用、利息和人工等事宜。

传统的欺诈检测只能关注离散的数据点,例如特定的账户、个人、设备、IP地址等。然而,当今老练的欺诈者通过形成由合成身份以及迂回的反响渠道组成的欺诈团伙来逃避检测。

要发现欺诈团伙,就必须超越对单个数据点的研究,更广泛地了解跨多种数据之间的连接关系,将多个不同的数据源相互协同起来分析以检测复杂欺诈行为。

如何将不同数据源整合在一起,探索关联关系,并赋予更好的数据挖掘性能?一个优秀的解决方案就是利用图谱将数据表达出来,我们会得到数据更深层次的理解和更有效的反欺诈解决方案。


# 图建模

金融反欺诈、反洗钱等场景下,通常是基于账户、转账等信息构建图谱,交易金额在反欺诈中也是重要的考量标准,它通常被作为属性进行存储。

根据这些信息,图可定义为:

  • 节点:客户账户等。
  • 边:属于交易等。

# 解决的业务问题

下面我们将探寻如何用图来解决各种问题:

# 从可疑账户中检测欺诈集团

欺诈集团由非常长的交易循环和不同用户之间的关系组成,欺诈者利用这些循环来逃避检测。这些长循环也用于复杂的网络犯罪,犯罪者在多个系统中创建长登陆路径以免被发现。

这些长路径难以被检测的原因是,它们需要深入的多跳遍历来探寻交易图中参与欺诈的个人之间的关系。

图数据支持高性能的多跳查询,可以有效解决这个问题。例如查找从可疑账户开始并在5到10个交易后又循环回到可疑账户的长交易循环。

这本质上是一个简单的路径查询,我们选定起点终点均为同一节点,设置指定跳数,查询是否存在符合条件的路径即可。

# 寻找最有影响力的客户/账户

可以应用PageRank等标准图算法,通过寻找最有影响力的客户和账户来找到深度协调的活动。

# 反洗钱

在洗钱活动中,有一种资金分解/聚合模式,其中许多小交易(低于某个已知触发阈值)被用于拆分大笔资金,然后跨账户进行多次交易以进一步避免被发现,最终将资金聚合回账户。

通过编写Cypher查询语言,可以检测到这种模式的交易。

最近一次更新时间: 9/26/2022, 8:03:06 AM