Stata:异常值检测算法-分离森林-iforest
(2023-02-04 16:42:32)
标签:
stata异常值检测算法分离森林iforest |
分类: Stata数据处理 |
全文阅读:https://www.lianxh.cn/news/70c082bb378cc.html
目录
1. 简介
iforest
- 异常数据跟样本中大多数数据不太一样;
- 异常数据在整体数据中占比较小。
一般的异常检测方法主要是通过对正常样本的描述,给出一个正常样本在特征空间中的区域,对于不在这个区域中的样本,视为异常。这类方法只优化正常样本的描述,而不优化异常样本的描述,可能造成大量误报或只检测到少量异常。
其次,异常数据的一般刻画方法必须用到各种统计、距离、密度的量化指标来描述异常数据跟其他样本的疏离程度。而 iforest