Source code for seisnn.model.evaluator

"""
Evaluator settings.
"""

import os

import tensorflow as tf
from obspy.core.utcdatetime import UTCDateTime
from datetime import datetime

from seisnn.core import Instance
from seisnn.model.attention import TransformerBlockE, TransformerBlockD, \
    MultiHeadSelfAttention, ResBlock
from seisnn.plot import plot_error_distribution
import seisnn.example_proto
import seisnn.io
import seisnn.sql
import seisnn.utils


[docs]class BaseEvaluator:
    database = None
    def get_dataset_length(self):
        count = None
        try:
            db = seisnn.sql.Client(self.database)
            count = len(db.get_waveform())
        except Exception as error:
            print(f'{type(error).__name__}: {error}')

        return count

    @staticmethod
    def get_model_dir(model_instance):
        config = seisnn.utils.Config()
        save_model_path = os.path.join(config.models, model_instance)
        return save_model_path

    @staticmethod
    def get_eval_dir(dir_name):
        config = seisnn.utils.Config()
        eval_path = os.path.join(config.eval, dir_name.split('.')[0])
        seisnn.utils.make_dirs(eval_path)

        return eval_path


[docs]class GeneratorEvaluator(BaseEvaluator):
    """
    Trainer class.
    """

[docs]    def __init__(self,
                 database=None,
                 model_name=None):
        """
        Initialize the evaluator.

        :param database: SQL database.
        :param model_name: Saved model.
        """
        self.database = database
        self.model_name = model_name
        self.model = None

[docs]    def predict(self, tfr_list, batch_size=500):
        """
        Main eval loop.

        :param tfr_list: List of .tfrecord.
        :param str name: Output name.
        """
        model_path = self.get_model_dir(self.model_name)

        self.model = tf.keras.models.load_model(
            model_path,
            custom_objects={
                'TransformerBlockE': TransformerBlockE,
                'TransformerBlockD': TransformerBlockD,
                'MultiHeadSelfAttention': MultiHeadSelfAttention,
                'ResBlock': ResBlock
            })

        dataset = seisnn.io.read_dataset(tfr_list)
        n = 0
        for val in dataset.prefetch(100).batch(batch_size):
            progbar = tf.keras.utils.Progbar(len(val['label']))
            val['predict'] = self.model.predict(val['trace'])
            iterator = seisnn.example_proto.batch_iterator(val)
            for i in range(len(val['predict'])):
                config = seisnn.utils.Config()
                instance = Instance(next(iterator))

                sub_dir = getattr(config, 'eval')
                sub_dir = os.path.join(sub_dir, self.model_name)

                file_name = instance.get_tfrecord_name()
                net, sta, loc, chan, year, julday, suffix = file_name.split('.')
                tfr_dir = os.path.join(sub_dir, year, net, sta)
                seisnn.utils.make_dirs(tfr_dir)
                save_file = os.path.join(tfr_dir, f'{n:0>6}.' + file_name)
                instance.to_tfrecord(save_file)
                progbar.add(1)
                n = n + 1

    def score(self, tfr_list, batch_size=500, delta=0.1, height=0.5,
              error_distribution=True):
        P_true_positive = 0
        S_true_positive = 0
        P_error_array = []
        S_error_array = []
        num_P_predict = 0
        num_S_predict = 0
        num_P_label = 0
        num_S_label = 0
        dataset = seisnn.io.read_dataset(tfr_list)
        for val in dataset.prefetch(100).batch(batch_size):
            iterator = seisnn.example_proto.batch_iterator(val)
            progbar = tf.keras.utils.Progbar(len(val['predict']))
            for i in range(len(val['predict'])):
                instance = Instance(next(iterator))
                instance.label.get_picks(height=height)
                instance.predict.get_picks(height=height)

                for pick in instance.label.picks:
                    if pick.phase == 'P':
                        for p_pick in instance.predict.picks:
                            if p_pick.phase == pick.phase:
                                if pick.time - delta <= p_pick.time <= pick.time + delta:
                                    P_true_positive = P_true_positive + 1
                                    P_error_array.append(p_pick.time - pick.time)

                        num_P_label += 1
                    if pick.phase == 'S':
                        for p_pick in instance.predict.picks:
                            if p_pick.phase == pick.phase:
                                if pick.time - delta <= p_pick.time <= pick.time + delta:
                                    S_true_positive = S_true_positive + 1
                                    S_error_array.append(p_pick.time - pick.time)
                        num_S_label += 1
                for pick in instance.predict.picks:
                    if pick.phase == 'P':
                        num_P_predict += 1
                    if pick.phase == 'S':
                        num_S_predict += 1
                progbar.add(1)
        print(f'num_P_predict = {num_P_predict}, num_S_predict = {num_S_predict}')
        print(f'num_P_label = {num_P_label}, num_S_label = {num_S_label}')
        for phase in ['P', 'S']:
            precision, recall, f1 = seisnn.qc.precision_recall_f1_score(
                true_positive=eval(f'{phase}_true_positive'), val_count=eval(f'num_{phase}_label'),
                pred_count=eval(f'num_{phase}_predict'))
            if error_distribution:
                plot_error_distribution(eval(f'{phase}_error_array'))
            print(
                f'{phase}: precision = {precision},recall = {recall},f1 = {f1}')