On the irrelevance of hypothesis testing in the computer age

Geoffrey R. Loftus in Behavior Research Methods, Instruments, & Computers 1993, 25 (2), 25() 256

Hypothesis testing, while by far the most common statistical technique for generating conclusions from data, is nonetheless not very informative. It emphasizes a banal and confusing question (“Is it true that some set of population means are not all identical to one another?”) whose answer is, in a mathematical sense, almost inevitably known (“No”). Hypothesis testing, as it is customarily implemented, ignores two issues that are generally much more interesting, important, and relevant: What is thepattern of population means over conditions, and what are the magnitudes of various variability measures (e.g., standard errors of the mean, estimates of population standard deviations)?

so auch in G. Lind “Effektstärken: Statistische, praktische und theoretische Bedeutsamkeit empirischer Befunde”, Privatdruck 2012

Was aber selten (viel zu selten!) in Erwägung gezogen wird, ist die Möglichkeit, Befunde auf ihre theoretische, inhaltliche Bedeut- samkeit hin zu untersuchen: Welche Wertedifferenz ist für unser subjektives Empfinden und unsere Handlungen bedeutsam? Ab welcher Effektstärke können wir davon sprechen, dass eine Therapie- methode oder eine pädagogische Intervention wirklich etwas bringen und den Aufwand lohnen, den alle Beteiligten investieren müssen? Tritt der Effekt immer oder nur unter bestimmten Bedingungen auf? Ist er an Besonderheiten der Studie (Umfang des Samples, Streuung der unabhängigen Variablen) gebunden? Passt der Effekt zu dem, was wir bereits über die Variablen wissen, die wir untersuchen, oder stellt er fundiert geglaubte Theorien in Frage?