[test-suite] r283650 - Put my filter/analyze/display tool into the repository.

Fri Oct 7 20:28:26 PDT 2016

Author: matze
Date: Fri Oct  7 22:28:26 2016
New Revision: 283650

URL: http://llvm.org/viewvc/llvm-project?rev=283650&view=rev
Log:
Put my filter/analyze/display tool into the repository.

Added:
    test-suite/trunk/util/
    test-suite/trunk/util/compare.py   (with props)

Added: test-suite/trunk/util/compare.py
URL: http://llvm.org/viewvc/llvm-project/test-suite/trunk/util/compare.py?rev=283650&view=auto
==============================================================================

--- test-suite/trunk/util/compare.py (added)
+++ test-suite/trunk/util/compare.py Fri Oct  7 22:28:26 2016
@@ -0,0 +1,328 @@
+#!/usr/bin/env python2.7
+"""Tool to filter, organize, compare and display benchmarking results. Usefull
+for smaller datasets. It works great with a few dozen runs it is not designed to
+deal with hundreds.
+Requires the pandas library to be installed."""
+import pandas as pd
+import sys
+import os.path
+import re
+import numbers
+import argparse
+
+def read_lit_json(filename):
+    import json
+    jsondata = json.load(open(filename))
+    testnames = []
+    columns = []
+    columnindexes = {}
+    info_columns = ['hash']
+    for test in jsondata['tests']:
+        if "name" not in test:
+            print "Skipping unnamed test!"
+            continue
+        if "metrics" not in test:
+            print "Warning: '%s' has No metrics!" % test['name']
+            continue
+        for name in test["metrics"].keys():
+            if name not in columnindexes:
+                columnindexes[name] = len(columns)
+                columns.append(name)
+        for name in test.keys():
+            if name not in columnindexes and name in info_columns:
+                columnindexes[name] = len(columns)
+                columns.append(name)
+
+    nan = float('NaN')
+    data = []
+    for test in jsondata['tests']:
+        if "name" not in test:
+            print "Skipping unnamed test!"
+            continue
+        name = test['name']
+        if 'shortname' in test:
+            name = test['shortname']
+        testnames.append(name)
+
+        datarow = [nan] * len(columns)
+        if "metrics" in test:
+            for (metricname, value) in test['metrics'].iteritems():
+                datarow[columnindexes[metricname]] = value
+        for (name, value) in test.iteritems():
+            index = columnindexes.get(name)
+            if index is not None:
+                datarow[index] = test[name]
+        data.append(datarow)
+    index = pd.Index(testnames, name='Program')
+    return pd.DataFrame(data=data, index=index, columns=columns)
+
+def read_report_simple_csv(filename):
+    return pd.read_csv(filename, na_values=['*'], index_col=0, header=0)
+
+def read(name):
+    if name.endswith(".json"):
+        return read_lit_json(name)
+    if name.endswith(".csv"):
+        return read_report_simple_csv(name)
+    raise Exception("Cannot determine file format");
+
+def readmulti(filenames):
+    # Read datasets
+    datasetnames = []
+    datasets = []
+    prev_index = None
+    for filename in filenames:
+        data = read(filename)
+        name = os.path.basename(filename)
+        # drop .json/.csv suffix; TODO: Should we rather do this in the printing
+        # logic?
+        for ext in ['.csv', '.json']:
+            if name.endswith(ext):
+                name = name[:-len(ext)]
+        datasets.append(data)
+        suffix = ""
+        count = 0
+        while True:
+            if name+suffix not in datasetnames:
+                break
+            suffix = str(count)
+            count +=1
+
+        datasetnames.append(name+suffix)
+        # Warn if index names are different
+        if prev_index is not None and prev_index.name != data.index.name:
+            sys.stderr.write("Warning: Mismatched index names: '%s' vs '%s'\n"
+                             % (prev_index.name, data.index.name))
+        prev_index = data.index
+    # Merge datasets
+    d = pd.concat(datasets, axis=0, names=['run'], keys=datasetnames)
+    return d
+
+def add_diff_column(d, absolute_diff=False):
+    values = d.unstack(level=0)
+
+    has_two_runs = d.index.get_level_values(0).nunique() == 2
+    if has_two_runs:
+        values0 = values.iloc[:,0]
+        values1 = values.iloc[:,1]
+    else:
+        values0 = values.min(axis=1)
+        values1 = values.max(axis=1)
+
+    # Quotient or absolute difference?
+    if absolute_diff:
+        values['diff'] = values1 - values0
+    else:
+        values['diff'] = values1 / values0
+        values['diff'] -= 1.0
+    # unstack() gave us a complicated multiindex for the columns, simplify
+    # things by renaming to a simple index.
+    values.columns = [(c[1] if c[1] else c[0]) for c in values.columns.values]
+    return values
+
+def filter_failed(data, key='Exec'):
+    return data.loc[data[key] == "pass"]
+
+def filter_short(data, key='Exec_Time', threshold=0.6):
+    return data.loc[data[key] >= threshold]
+
+def filter_same_hash(data, key='hash'):
+    assert key in data.columns
+    assert data.index.get_level_values(0).nunique() > 1
+
+    return data.groupby(level=1).filter(lambda x: x[key].nunique() != 1)
+
+def filter_blacklist(data, blacklist):
+    return data.loc[~(data.index.get_level_values(1).isin(blacklist))]
+
+def print_filter_stats(reason, before, after):
+    n_before = len(before.groupby(level=1))
+    n_after = len(after.groupby(level=1))
+    n_filtered = n_before - n_after
+    if n_filtered != 0:
+        print "%s: %s (filtered out)" % (reason, n_filtered)
+
+# Truncate a string to a maximum length by keeping a prefix, a suffix and ...
+# in the middle
+def truncate(string, prefix_len, suffix_len):
+    return re.sub("^(.{%d}).*(.{%d})$" % (prefix_len, suffix_len),
+                  "\g<1>...\g<2>", string)
+
+# Search for common prefixes and suffixes in a list of names and return
+# a (prefix,suffix) tuple that specifies how many characters can be dropped
+# for the prefix/suffix. The numbers will be small enough that no name will
+# become shorter than min_len characters.
+def determine_common_prefix_suffix(names, min_len=8):
+    if len(names) <= 1:
+        return (0,0)
+    name0 = names[0]
+    prefix = name0
+    prefix_len = len(name0)
+    suffix = name0
+    suffix_len = len(name0)
+    shortest_name = len(name0)
+    for name in names:
+        if len(name) < shortest_name:
+            shortest_name = len(name)
+        while prefix_len > 0 and name[:prefix_len] != prefix:
+            prefix_len -= 1
+            prefix = name0[:prefix_len]
+        while suffix_len > 0 and name[-suffix_len:] != suffix:
+            suffix_len -= 1
+            suffix = name0[-suffix_len:]
+
+    if suffix[0] != '.' and suffix[0] != '_':
+        suffix_len = 0
+    suffix_len = max(0, min(shortest_name - prefix_len - min_len, suffix_len))
+    prefix_len = max(0, min(shortest_name - suffix_len, prefix_len))
+    return (prefix_len, suffix_len)
+
+def format_diff(value):
+    if not isinstance(value, numbers.Integral):
+        return "%4.1f%%" % (value * 100.)
+    else:
+        return "%-5d" % value
+
+def print_result(d, limit_output=True, shorten_names=True,
+                 show_diff_column=True, sortkey='diff'):
+    # sort (TODO: is there a more elegant way than create+drop a column?)
+    d['$sortkey'] = d[sortkey].abs()
+    d = d.sort_values("$sortkey", ascending=False)
+    del d['$sortkey']
+    if not show_diff_column:
+        del d['diff']
+    dataout = d
+    if limit_output:
+        # Take 15 topmost elements
+        dataout = dataout.head(15)
+
+    # Turn index into a column so we can format it...
+    dataout.insert(0, 'Program', dataout.index)
+
+    formatters = dict()
+    formatters['diff'] = format_diff
+    if shorten_names:
+        drop_prefix, drop_suffix = determine_common_prefix_suffix(dataout.Program)
+        formatters['Program'] = lambda x: "%-45s" % truncate(x[drop_prefix:-drop_suffix], 10, 30)
+        # TODO: it would be cool to drop prefixes/suffix common to all
+        # names
+    float_format = lambda x: "%6.2f" % (x,)
+    pd.set_option("display.max_colwidth", 0)
+    out = dataout.to_string(index=False, justify='left',
+                            float_format=float_format, formatters=formatters)
+    print out
+    print d.describe()
+
+if __name__ == "__main__":
+    parser = argparse.ArgumentParser(prog='compare.py')
+    parser.add_argument('-a', '--all', action='store_true')
+    parser.add_argument('-f', '--full', action='store_true')
+    parser.add_argument('-m', '--metric', action='append', dest='metrics',
+                        default=[])
+    parser.add_argument('--nodiff', action='store_false', dest='show_diff',
+                        default=None)
+    parser.add_argument('--diff', action='store_true', dest='show_diff')
+    parser.add_argument('--filter-short', action='store_true',
+                        dest='filter_short')
+    parser.add_argument('--no-filter-failed', action='store_false',
+                        dest='filter_failed', default=True)
+    parser.add_argument('--filter-hash', action='store_true',
+                        dest='filter_hash', default=False)
+    parser.add_argument('--filter-blacklist',
+                        dest='filter_blacklist', default=None)
+    parser.add_argument('--merge-average', action='store_const',
+                        dest='merge_function', const=pd.DataFrame.mean,
+                        default=pd.DataFrame.min)
+    parser.add_argument('--merge-min', action='store_const',
+                        dest='merge_function', const=pd.DataFrame.min)
+    parser.add_argument('--merge-max', action='store_const',
+                        dest='merge_function', const=pd.DataFrame.max)
+    parser.add_argument('files', metavar='FILE', nargs='+')
+    config = parser.parse_args()
+
+    if config.show_diff is None:
+        config.show_diff = len(config.files) > 1
+
+    # Read inputs
+    files = config.files
+    if "vs" in files:
+        split = files.index("vs")
+        lhs = files[0:split]
+        rhs = files[split+1:]
+
+        # Filter minimum of lhs and rhs
+        lhs_d = readmulti(lhs)
+        lhs_merged = config.merge_function(lhs_d, level=1)
+        rhs_d = readmulti(rhs)
+        rhs_merged = config.merge_function(rhs_d, level=1)
+
+        # Combine to new dataframe
+        data = pd.concat([lhs_merged, rhs_merged], names=['l/r'], keys=['lhs', 'rhs'])
+    else:
+        data = readmulti(files)
+
+    # Decide which metric to display / what is our "main" metric
+    metrics = config.metrics
+    if len(metrics) == 0:
+        defaults = [ 'Exec_Time', 'exec_time', 'Value', 'Runtime' ]
+        for defkey in defaults:
+            if defkey in data.columns:
+                metrics = [defkey]
+                break
+    if len(metrics) == 0:
+        sys.stderr.write("No default metric found and none specified\n")
+        sys.stderr.write("Available metrics:\n")
+        for column in data.columns:
+            sys.stderr.write("\t%s\n" % column)
+        sys.exit(1)
+    for metric in metrics:
+        problem = False
+        if metric not in data.columns:
+            sys.stderr.write("Unknown metric '%s'\n" % metric)
+            problem = True
+        if problem:
+            sys.exit(1)
+
+    # Filter data
+    proggroup = data.groupby(level=1)
+    initial_size = len(proggroup.indices)
+    print "Tests: %s" % (initial_size,)
+    if config.filter_failed and hasattr(data, 'Exec'):
+        newdata = filter_failed(data)
+        print_filter_stats("Failed", data, newdata)
+        newdata = newdata.drop('Exec', 1)
+        data = newdata
+    if config.filter_short:
+        newdata = filter_short(data, metric)
+        print_filter_stats("Short Running", data, newdata)
+        data = newdata
+    if config.filter_hash and 'hash' in data.columns and \
+       data.index.get_level_values(0).nunique() > 1:
+        newdata = filter_same_hash(data)
+        print_filter_stats("Same hash", data, newdata)
+        data = newdata
+    if config.filter_blacklist:
+        blacklist = open(config.filter_blacklist).readlines()
+        blacklist = [line.strip() for line in blacklist]
+        newdata = filter_blacklist(data, blacklist)
+        print_filter_stats("In Blacklist", data, newdata)
+        data = newdata
+    final_size = len(data.groupby(level=1))
+    if final_size != initial_size:
+        print "Remaining: %d" % (final_size,)
+
+    # Reduce / add columns
+    print "Metric: %s" % metric
+    if len(metric) > 0:
+        data = data[metrics]
+    data = add_diff_column(data)
+
+    sortkey = 'diff'
+    if len(config.files) == 1:
+        sortkey = data.columns[0]
+
+    # Print data
+    print ""
+    shorten_names = not config.full
+    limit_output = (not config.all) and (not config.full)
+    print_result(data, limit_output, shorten_names, config.show_diff, sortkey)

Propchange: test-suite/trunk/util/compare.py
------------------------------------------------------------------------------
    svn:executable = *