Category Archives: Software

On the irrelevance of hypothesis testing in the computer age

Geoffrey R. Loftus in Behavior Research Methods, Instruments, & Computers 1993, 25 (2), 25() 256

Hypothesis testing, while by far the most common statistical technique for generating conclusions from data, is nonetheless not very informative. It emphasizes a banal and confusing question (“Is it true that some set of population means are not all identical to one another?”) whose answer is, in a mathematical sense, almost inevitably known (“No”). Hypothesis testing, as it is customarily implemented, ignores two issues that are generally much more interesting, important, and relevant: What is thepattern of population means over conditions, and what are the magnitudes of various variability measures (e.g., standard errors of the mean, estimates of population standard deviations)?

so auch in G. Lind “Effektstärken: Statistische, praktische und theoretische Bedeutsamkeit empirischer Befunde”, Privatdruck 2012

Was aber selten (viel zu selten!) in Erwägung gezogen wird, ist die Möglichkeit, Befunde auf ihre theoretische, inhaltliche Bedeut- samkeit hin zu untersuchen: Welche Wertedifferenz ist für unser subjektives Empfinden und unsere Handlungen bedeutsam? Ab welcher Effektstärke können wir davon sprechen, dass eine Therapie- methode oder eine pädagogische Intervention wirklich etwas bringen und den Aufwand lohnen, den alle Beteiligten investieren müssen? Tritt der Effekt immer oder nur unter bestimmten Bedingungen auf? Ist er an Besonderheiten der Studie (Umfang des Samples, Streuung der unabhängigen Variablen) gebunden? Passt der Effekt zu dem, was wir bereits über die Variablen wissen, die wir untersuchen, oder stellt er fundiert geglaubte Theorien in Frage?


CC-BY-NC

New insights by single-cell genomics

Congress report Annual AGD Meeting 2018, Potsdam Oct. 5–6

Welcome and Opening of Symposium by  Peter Nürnberg, President of the AGD and Joachim L. Schultze, Chair of the Program Committee.

Joachim L. Schultze
Peter Nürnberg

The AGD meeting was interesting and a great primer for all of us who are not directly working with single cells.

Maybe it is an unusual research field – dissecting single cells in the first stage is not a trivial task. And single cell  means single cell experiment that can be replicated only in other cells. The current readout is  RNA content at a given time while genomics and proteomics still need to be integrated. Experiments cover mainly abundant RNAs and for cost reasons only the 3′ ends. The statistical analysis usually is a 2 dimensional PCA (known to overfit noise) so this not a trivial approach at all. Newly identified cell cluster need careful confirmation as addressed in the talk of Andreas Schlitzer.

Continue reading New insights by single-cell genomics


CC-BY-NC

If privacy is outlawed, only outlaws will have privacy

http://www.philzimmermann.com/EN/essays/WhyIWrotePGP.html

Throughout the 1990s, I figured that if we want to resist this unsettling trend in the government to outlaw cryptography, one measure we can apply is to use cryptography as much as we can now while it’s still legal. When use of strong cryptography becomes popular, it’s harder for the government to criminalize it. Therefore, using PGP is good for preserving democracy. If privacy is outlawed, only outlaws will have privacy.


CC-BY-NC

Statistics for dummies

This is how we did it for ages

# devtools::install_github("neuropsychology/psycho.R")
library(psycho)

df <- psycho::affective
aov_results <- aov(Adjusting ~ Sex * Salary, data=df)
              Df Sum Sq Mean Sq F value Pr(>F)    
Sex           1   35.9   35.94  18.162 2.25e-05 ***
Salary        2    9.4    4.70   2.376   0.0936 .  
Sex:Salary    2    3.0    1.51   0.761   0.4674    
Residuals   859 1699.9    1.98                     
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
386 observations deleted due to missingness

And this is what R-bloggers recommends

analyze(aov_results)
The effect of Sex is significant (F(1, 859) = 18.16, p < .001) and can be considered as small (Partial Omega-squared = 0.019).
The effect of Salary is not significant (F(2, 859) = 2.38, p = 0.09°) and can be considered as very small (Partial Omega-squared = 0.0032).
The interaction between Sex and Salary is not significant (F(2, 859) = 0.76, p > .1) and can be considered as very small (Partial Omega-squared = 0).

Seriously!


CC-BY-NC

Das Digitale der Theologie

Christian Henkel, Institut für Ökumenische und Interreligiöse Forschung / Universität Tübingen, hat einen interessanten Beitrag auf feinschwarz verfasst:

Jetzt kommt wieder so ein Digitalisierungsessay. Pünktlich zu Katholikentag, CEBIT oder re:publica rauscht es in der christlichen Blogosphäre und auf Twttr von neuen social media Kampagnen. Schön bunt ist die Welt dort draußen. So bunt, dass ich mich in die monochrome Idylle meiner Kindheit vor dem C64 meines Vaters zurücksehne, 8, 1.

Abgesehen davon, dass der Titel “Digital Denken” nicht so recht passt, ist es ein tiefsinniger Beitrag, der hinter offenem Quellcode den Schöpfer sucht, hinter Blockchain die Autorität, der man Vertrauen schenken kann und hinter Data Mining das Fides quaerens intellectum von Augustinus hinterfragt.

Es lässt sich also eine Debatte um die Digitalisierung führen, die nicht mit Neoanglizismen beginnt und bei der schnellen Internetinfrastruktur auf dem Land endet.

Großartig!


CC-BY-NC

Erpressung

Das Reviewsystem der Zeitschrift “Allergy” läuft seit Jahren auf der etwas hausbackenen Manuscript Central Platform. Dann wurde daraus Scholar One, das zuletzt nun Clarivate Analytics einverleibt wurde (dem früheren Geschäftsbereich Intellectual Property und Science von Thomson Reuters).
Bei letzten Einloggen – um ein Manuskript zu reviewen – musste ich dann zwangsweise die DSGVO akzeptieren, ansonsten hätte ich das PDF des Manuskriptes nicht bekommen.

 

 

Clarivate Analytics hat angekündigt diesen Monat auf Amazon Webservices umzustellen. Warum dann überhaupt noch europäische DSVGO abfragten?


CC-BY-NC

25. Mai 2018, EU-Datenschutz-Grundverordnung DSGVO: Eine Lösung für das Youtube Problem

Selbst wenn man auf seinem Blog keine Werbebanner, kein Google Analytics und nicht mal Cookies verwendet, bleiben trotzdem einige Aufgaben zu erledigen. Wie ist das mit HTTPS? Ab sofort zwingend. Wie ist das mit Akismet? Erstmal abgeschaltet, da Kommentare nicht erlaubt sind. Und das Kontaktformular? Abgeschaltet. Und Impressum? Ergänzt um zeitlimitierte IP Datenspeicherung.
Dann bleibt also noch die Einbindung externer Seiten zu überarbeiten. Dafür gibt es nun eine Änderung im WordPress Theme Header, welche nur den Content zeigt, denn der Leser aktiv anklickt.

$(document).ready(function(){
  $('iframe[src*="youtube.com"]').each(function(e) {
    var src=$(this).attr('src');
    $(this).attr('name',src );
    $(this).attr('src','/404');
    $(this).after('<img class="me" src="/images/img/externalcontent.png" onclick="$(\'.me\').hide();showyou();"/>');
    $(this).hide();
  });
});
function showyou() {
  $('iframe[name*="youtube.com"]').each(function(e) {
    var src=$(this).attr('name');
    $(this).attr('src',src);
    $(this).show();
  });
}

Was ist der Grund den Iframe nicht nur zu verstecken, sondern auch noch eine Fake URL zu setzen? Auch ein unsichtbarer iframe kann Daten ziehen und Cookies setzen.


CC-BY-NC

Is the GWAS reporting of p-values highly flawed?

Since the advent of Nature Genetics I wonder why this journal is publishing articles based on significance and not on effect size. Only recently I found an interesting blog about “the smaller the p-value, the higher the likelihood ratio under the alternative vs the null” fallacy

This statement ignores the fact that under low power conditions, 100% of the significant effects will be based on overestimates of the true effect. This is what Gelman’s Type M error is all about.

Prima vista, I can’t find any error in the argument there. The GWAS power is high  for alleles of 5% frequency but what about 1% or 0.1% minor allele frequency? More about type M errors by Andrew Gelman 2016, basically an error of magnitude – claiming with confidence that theta is small in magnitude when it is in fact large or by claiming with confidence that theta is large in magnitude when it is in fact small. The GWAS publication bias is ultimately leading to systematic Type M errors.


CC-BY-NC

How to drop your Facebook account and create your own timeline with RSS

After leaving Researchgate and Linkedin earlier – never used Instagram and Strava – I am thinking now how to delete also the Facebook account without loosing all my “friends”.

There seems to be a nice solution as I can add any Facebook account to my RSS feed in Miniflux using RSS bridge. This is dead easy, just enter the username and add the resulting feed to the reader.

There is only one downside: All Facebook accounts  (and groups!) need to make their content public available and not just to Facebook and Cambridge Analytica marketing departments.
The fake privacy as well as the assumed exclusivity of Facebook contacts is a built-in design cheat right from the beginning of the social media.


CC-BY-NC

Is the Pareto principle good for science?

The Pareto principle (also known as the 80/20 rule, the law of the vital few, or the principle of factor sparsity) states that, for many events, roughly 80% of the effects come from 20% of the causes.

Is the Pareto principle good for science? Yes, if you are interested in prices, doctorates, honours, achievements, academy membership, AMEX gold card. No, if you are interested in the progress of science, separating wheat from chaff, common goods like educating students. Yes, if you do not have tenure. No, if you have achieved it.


CC-BY-NC

Zingales ist dagegen

Luigi Zingales ist dagegen, die großen Internet Konzerne zu zerschlagen. In dem letzten Spiegel Interview sagt er.

Zingales: Wenn Sie mich vor einem Jahr gefragt hätten, ob Superhelden wie Facebook und Amazon zu solchen Feindbildern werden könnten, hätte ich gesagt: unmöglich. Aber das hat sich tatsächlich geändert. Und dennoch halte ich eine Zerschlagung auch jetzt noch für zu aggressiv. Die Konsequenzen wären nicht abzuschätzen. Erst einmal muss es auch einen klaren Konsens darüber geben, was genau eigentlich das Problem ist.

Das kann man Zingales erklären. Die Konzerne nutzen immer mehr ihre Macht, ihren Einfluss zu vergrössern, Kunden zu gängeln und dabei so wenig Steuer wie möglich zu zahlen.

Das merkt man spätestens dann, wenn man von Amazon gesperrt wird, ohne große Vorwarnung. Damit sind auch alle digital gekauften Inhalte wie Musik, Filme oder E-Books weg.

Google verfolgt User auch mit ausgeschalteter Location Service.

Ebay macht dubiose Rabattaktionen. Der Rabatt wird aber mit windigen Ausreden nicht ausgezahlt.

Facebook sammelt Daten auch über nicht angemeldete Nutzer.

Die Schufa hat eine dubiose Risikobewertung.

Die Konsequenzen einer Welt ohne Google, Amazon, Facebook und Ebay? Wieder zurück zur regionalen Ökonomie und Ökologie – Kleinanzeigen, Supermärkte und Tante Emma Läden, war die Welt wirklich so schlecht?


CC-BY-NC

Nagoya

Die Allianz der Wissenschaftsorganisationen warnt eindringlich vor weitreichenden Konsequenzen für die Umwelt- und Lebenswissenschaften sowie die Biodiversitätsforschung, sollte zukünftig auch die Nutzung von digitalen Sequenzinformationen (DSI) genetischer Ressourcen den Regelungen des Nagoya-Protokolls (NP) und der Konvention über die biologische Vielfalt (CBD) unterliegen.

https://www.fraunhofer.de/de/presse/presseinformationen


CC-BY-NC

Install brew under Lion?

To give an early Macbook Air from 2010 some useful tasks, a package manager is needed. The basic requirement is always Xcode 4.6.3 (from 2013) while also the command line tools are necessary. Continue reading Install brew under Lion?


CC-BY-NC