大数据架构和模式,第 5 部分 对大数据问题应用解决方案模式并选择实现它的产品-2
- UID
- 1066743
|
大数据架构和模式,第 5 部分 对大数据问题应用解决方案模式并选择实现它的产品-2
解决方案模式:获得高级业务洞察这种模式比入门模式更高级。它在索赔处理的三个阶段预测欺诈:
- 索赔已经解决。
- 索赔处理正在进行中。
- 刚刚收到索赔请求。
对于前两种情况,可以批量处理索赔,而且可以启动欺诈检测流程,它可能是常规报告流程的一部分,也可以由业务请求启动。第 3 种情况可以近实时地进行处理。索赔请求拦截器会拦截索赔请求,启动欺诈检测流程(如果指示器报告这可能是一个欺诈案件),然后通知在系统中识别的利益相关者。越早检测到欺诈,风险或损失的严重性就会越低。
图 2. 获得高级业务洞察的解决方案模式
图 2 使用:
- 非结构化数据存储
- 结构化数据存储
- 经过转换的结构化数据
- 经过预处理的非结构化数据
- 实体解析
- 欺诈检测引擎
- 业务规则
- 大数据浏览器
- 对用户的警告和通知
- 索赔请求拦截器
在这个模式中,组织可以在分析之前选择对非结构化数据进行预处理。
数据被获取并按原样存储在非结构化数据存储中。然后,它被预处理成可以被分析层使用的格式。有时,预处理可能会非常复杂和费时。您可以使用机器学习技术进行文本分析,Hadoop Image Processing Framework 对于处理图像很有用。最广泛使用的技术是 JSON。经过预处理的数据随后被存储在结构化数据存储中,如 HBase。
此模式的核心组件是欺诈检测引擎,由高级分析功能构成,可以帮助预测欺诈。被明确定义并经常更新的欺诈指标有助于识别欺诈行为。下面欺诈指标可以帮助检测欺诈,并且可以使用技术来实现打击欺诈行为的系统。下面是常见欺诈指标的列表:
- 保单生效后不久进行索赔。
- 在处理索赔时发生严重核保失误。
- 被保险人在追求快速解决时具有明显的攻击性。
- 被保险人愿意接受小额赔偿,而不是记录所有损失。
- 文件的真实性值得怀疑。
- 被保险人在背后偿还贷款。
- 所产生的伤害是不可见的。
- 不存在已知伤亡的高价值索赔。
- 个人集群之间存在关系,包括保单持有人、医疗机构、联营公司、供应商与合作伙伴。
- 持牌及非持牌医疗服务提供者之间存在联系。
仅使用传统方法不足以预测诈骗。用户还需要使用社交网络分析来检测持牌及非持牌医疗服务提供者之间的联系,并检测保单持有人、医疗机构、联营公司、供应商与合作伙伴之间的关系。验证文件的真伪,并找到个人的信用评分,这是用传统方法难以完成的艰巨任务。
在分析过程中,对所有这些指标的搜索可能会在庞大数量的数据上同时发生。每一个指标都被加权。所有指标的加权总值表示预测欺诈的准确性和严重程度。
在分析完成后,可以向相关利益方发送警报和通知,并且可以生成报表,以显示分析结果。
此模式适合于需要使用大数据进行高级分析的企业,包括进行复杂的预处理,以利用先进的技术(如特征提取、实体解析、文本分析、机器学习和预测分析)可以进行分析的形式存储数据。这种模式不涉及采取任何行动或根据分析的输出提供建议。 |
|
|
|
|
|