OutlierDetection.md

import pandas as pd
i_data = pd.read_csv(data_path)
i_data.index = pd.DatetimeIndex(i_data.index)
import saqc
i_saqc = saqc.SaQC(i_data)
>>> saqc.fields
['incidents']
>>> saqc.show('incidents')
>>> i_saqc = i_saqc.roll(field='incidents', target='incidents_mean', func=np.mean, winsz='13D')
>>> i_saqc = i_saqc.roll(field='incidents', target='incidents_median', func=np.median, winsz='13D')
>>> i_saqc = i_saqc.fitPolynomial(field='incidents', target='incidents_polynomial', polydeg=2 ,winsz='13D')
from scipy.signal import filtfilt, butter
def butterFilter(x, filter_order, nyq, cutoff, filter_type):
    b, a = butter(N=filter_order, Wn=cutoff / nyq, btype=filter_type)
    return filtfilt(b, a, x)
i_saqc = i_saqc.processGeneric(field='incidents', target='incidents_lowPass', func=lambda x: butterFilter(x, cutoff=0.1, nyq=0.5, filter_order=2))
>>> i_saqc = i_saqc.evaluate()
>>> data = i_saqc.getResult()[0]
>>> data.plot()
i_saqc = i_saqc.procesGeneric(['incidents', 'incidents_model'], target='incidents_residues', func=lambda x, y: x - y)
z_score = lambda D: abs((D[14] - np.mean(D)) / np.std(D))
i_saqc = i_saqc.roll(field='incidents_residues', target='incidents_scores', func=z_scores, winsz='13D')
i_saqc = i_saqc.roll(field='incidents_residues', target='residues_mean', winsz='27D',
                             func=np.mean)
i_saqc = i_saqc.roll(field='incidents_residues', target='residues_std', winsz='27D',
                             func=np.std)
i_saqc = i_saqc.processGeneric(fields=['incidents_residues','incidents_mean','incidents_std'], target='incidents_scores', func=lambda x,y,z: abs((x-y) / z))
i_saqc = i_saqc.evaluate()
i_saqc.show('incidents_scores')
i_saqc = i_saqc.flagRange('incidents_scores', max=3).evaluate()
>>> i_saqc.show('incidents_scores')
>>> i_saqc = i_saqc.flagGeneric(field=['incidents_scores'], target='incidents', func=lambda x: isFlagged(x))
>>> i_saqc = i_saqc.flagGeneric(field=['incidents_scores'], target='incidents', func=lambda x: x > 3)
>>> i_saqc = i_saqc.evaluate()
>>> i_saqc.show('incidents')
>>> i_saqc = i_saqc.flagGeneric(field=['incidents','incidents_residues'], func=lambda x,y: isflagged(x) & (y < 50), flag=-np.inf)
>>> i_saqc = i_saqc.evaluate()
>>> i_saqc.show()
>>> i_saqc = i_saqc.flagGeneric(field=['incidents_scores', 'incidents_residues'], target='incidents', func=lambda x, y: (x > 3) & (y > 20))
>>> i_saqc = i_saqc.evaluate()
>>> i_saqc.show()