Category Archives: Software

Ein Fahrrad Abstandswarner

Nach Stromzähler und Gasuhr kommt hier nun mein drittes Raspberry Pi Zero Projekt: ein Abstandswarner für vorbeifahrende Fahrzeuge. Das erste Mal habe ich davon in einem wissenschaftlichen Artikel gelesen, dann gab es den Radmesser in Berlin (das Projekt war toll aber die Kiste dann doch etwas sperrig).

Auch auf Kickstarter stand mal was und dann gibt es auch noch den 200€ Varia Radar von Garmin – allerdings hatte keines der bisherigen Projekte eine Kamera eingebaut.

Laser und ToF hatte es mir immer schon angetan, dann probieren wir das auch mal hier.

Continue reading Ein Fahrrad Abstandswarner

Another problem in AI: Out-of-distribution generalization

Not sure if it is really the biggest but certainly one of the most pressing problems: Out-of-distribution generalization. It is explained as

Imagine, for example, an AI that’s trained to identify cows in images. Ideally, we’d want it to learn to detect cows based on their shape and colour. But what if the cow pictures we put in the training dataset always show cows standing on grass? In that case, we have a spurious correlation between grass and cows, and if we’re not careful, our AI might learn to become a grass detector rather than a cow detector.

As an epidemiologist I would have simply said, it is colliding or confounding, so every new field is rediscovering the same problems over and over again.

 

 

Not unexpected AI just running randomly over pixels is leading to spurious association. Once shape and colour of cows has been detected, surrounding environment, like grass or stable is irrelevant. That means that after getting initial results we have to step back, simulate different lighting conditions from sunlight to lightbulb and environmental conditions from grass to slatted floor (invariance principle). Also shape and size matters – cow spots will keep to some extent size and form irrespective if it is a real animal or children toy (scaling principle). I am a bit more sceptical about including also multimodal data (eg smacking sound) as the absence of these features is no proof of non-existence while this sound can also be imitated by other animals.

Personalized PDFs

Scientific publishers are creating now more and more dynamic PDFs. Why do we know? There is an unexpected loading delay of a PDF from Routledge / Taylor & Francis group that I observed recently. First I thought about some DDos protection, but is indeed a personalized document.

These websites are all being contacted while creating this PDF:

Scitrus.com seems to be part of a larger reference organizer network and links to scienceconnect.io. Alexametric.com is the soon to be retired Alexa internet / Amazon service. Snap.lidcdn.com forwards to px.ads.linkedin.com, the business social network. Then we have Twitter ads, Cloudflare security and Google Analytics. All major players now know that my IP is interested in COVID-19 research. Did I ever agree to submit my IP and time stamp when looking up a rather crude scientific paper?

This is  exactly what the German DFG already warned us about last October

For some time now, the major academic publishers have been fundamentally changing their business model with significant implications for research: aggregation and the reuse or resale of user traces have become relevant aspects of their business. Some publishers now explicitly regard themselves as information analysis specialists. Their business model is shifting from content provision to data analytics.

Another paper describes the situation as “Forced marriages and bastards”…

My question is : Will Francis & Taylor  even do more? The structure of PDFs allows including objects including Javascript. When examining “document.pdf” using pdf-parser  I could not find any javascript or my current IP in clear text.  I cannot exclude however that the chopped up IP is stamped somewhere in the document. So I will have try again at a later time point and redo a bitwise analysis. of the same PDF delivered on another day.

At least the DFG document says that organisations might argue that such software allows for the prosecution of users of shadow libraries. While I have doubts that this is legal, we already see targeted advertisement as I received this PDF from Wiley that included an Eppendorf ad.

Screenshot 20.1.2022

When I downloaded this document a second time using a different IP it was however identical. Blood/Elsevier only let’s you even download only after watching a small slideshow…

Screenshot 20.1.2022

Die Anfänge

Mein erster Computer war ein  Sharp PC 1211 als Dauerleihgabe von einem Freund um damit T-test und Wilcoxon Test ab 1983 zu rechnen. Konnte immerhin 1424 Zeilen BASIC Code verstehen und sogar ausdrucken.

Getippt hat mir die handgeschriebene Promotionsarbeit eine Freundin auf einer Olivetti Schreibmaschine mit Zeilenspeicher, die Grafiken entstanden auf einem CAD Plotter! bei dedata. Es folgten dann ein IBM XT im Labor und ein ausgeliehener Schneider PC zu Hause …

Wechselrichter und Stromzähler mit FRITZ!Box verbinden

Es wäre interessant, die Daten der Photovoltaik zur Steuerung von Steckdosen zu nehmen, um Geräte nur bei Überschuss anzuschalten. Und zwar ohne teure extra Hardware oder einen Smartmeter der alle Haushaltsdaten nach aussen funkt (als Einladung in ein gerade leerstehendes Haus).

Das geht einfacher als gedacht. Der Fronius Wechselrichter ist im Heimnetz unter http://192.168.187.x/solar_api/v1/GetPowerFlowRealtimeData.fcgi zu erreichen. Die aktuelle Wattzahl  kommt im json Format.

Die FRITZ!Box kann das zwar im Augenblick nicht verarbeiten (AVM hat es aber als Produktvorschlag akzeptiert) kann aber eine Steckdose schalten.

Also brauchen wir doch einen zweiten Rechner. Ich nehme dafür einen Raspberry Pi Zero (der Pi Zero 2 ist vergriffen aber auch nicht notwendig)  am besten in der Ausführung WH mit Pinleiste.  Stromversorgung kommt von einem Netzteil in Nähe des Sicherungskasten/Stromzählers, zum Test über 3 Tage reicht aber auch eine übliche  Powerbank.

Zunächst wird das OS auf eine alte micro SD Karte installiert und die Karte in den Pi Zero gesteckt. Sobald der Pi Zero im WLAN erscheint, kann man headless d.h, ohne Peripheriegeräte via SSH weiter konfigurieren etwa mit Apache/PHP.  Dazu brauchen wir noch einen USB IR Lesekopf, der am Stromzähler das Blinken der Diode ausliest. Mit einem cronjob werden im Minutenabstand die Daten abgeholt. Abfrage des Logarex Wechselstromzählers

stty -F /dev/ttyUSB0 300 -parodd cs7 -cstopb parenb -ixoff -crtscts -hupcl -ixon -opost -onlcr -isig -icanon -iexten -echo -echoe -echoctl -echok
echo -n -e '\x2F\x3F\x21\x0D\x0A' >> /dev/ttyUSB0
timeout 10s cat /dev/ttyUSB0

Ab einer bestimmten Leistung der PV kann dann die Steckdose eingeschaltet werden, im Prinzip mit

watt=$(curl http://x.x.x.x/solar_api/v1/GetPowerFlowRealtimeData.fcgi | jq '.Body.Data.Inverters[1].P')
if [[ $watt -gt 200 ]]
then
http://fritz.box/webservices/homeautoswitch.lua?switchcmd=setsimpleonoff&ain=13077%200012360-1&onoff=1

Die Hardware passt in ein kleines FLIRC Gehäuse, die Kosten liegen unter 50€, dazu kommt noch die schaltbare Steckdose.

 

Update 26.1.22

Der Abfragecode ist nun in ein PHP Skript verpackt und gibt die Daten in einer hübschen d3.js Grafik aus.

Im Augenblick läuft nun die Datensammlung inklusive stündlicher openweathermap Abfrage um später mal noch ein R-CNN zur Vorhersage zu programmieren.

 

Update 23.2.22

Der Lesekopf funktioniert einwandfrei mit dem Drehstromzähler Logarex LK13BDxxxx obwohl die Shell Kommandos nur sehr primitiv in ein PHP Skript eingebaut waren. Mit dem Einbau eines bidirektionalen Smartmeters SGM-C4-xxxxxx funktioniert das  leider nicht mehr und zwar nicht etwa weil die Kommunikation nun mit 9600/8/N/1 läuft sondern weil die binäre SML Zeichen, die nun jede Sekunde kommen, nicht richtig interpretiert werden können.

stty -F /dev/ttyUSB0 9600 cs8 -cstopb -parenb
timeout 2s cat /dev/ttyUSB0 | od -tx1

Ein Python2 Downgrade für den php_loader machte für mich keinen großen Sinn, node liess sich bei mir nicht auf dem Pi Zero installieren und smeterd brach leider mit einer Fehlermeldung ab. Einzig libsml hatte Erfolg

apt-get install uuid-dev uuid-runtime
git clone https://github.com/volkszaehler/libsml
cd libsml
make
examples/sml_server -s /dev/ttyUSB0

Die -s Option ist undokumentiert, ist aber wichtig denn nur sie findet genau einen Datensatz. Aus dem Datensatz lassen sich die Zeilen 1.8.0 und 2.8.0 über regex Ausdruck als Zählerstand auslesen.

 

Update 2.3.22

Auf Anfrage kann ich das komplette Messgerät verleihen, falls jemand denselben Zähler testweise auslesen oder das Gerät klonen möchte.  Wenn sich der Pi Zero nicht das eigenes WLAN findet, startet er einen eigenen Hotspot, ist damit also autonom überall verwendbar.

From Markdown to Bookend and back

When writing text in Typora, I need Bookends to insert references.

Export to RTF format for creating the bibliography isn’t a big deal but using the new RTF in Typora needs Pandoc on the command line as Typora’s import function is broken.

brew install pandoc
pandoc --wrap=none --extract-media=images -f rtf -t markdown myfile.rtf -o myfile.md

Seems that pandoc destroys footnotes and inline images making this combination not a first choice for larger documents.

Why I changed my markdown editor from Atom to Typora

I have been customizing Atom over the years but moved recently to Typora  as it has it all built in. Typora will hopefully work also with long documents (which I haven’t tried so far). There is a

  • great focus mode
  • seamless import of figures
  • LaTeX WYSIWYG
  • Flowchart and Mermaid integration
  • and I can insert my Bookend references (via RTF export)

Good scientific graphics

I have lectured about good graphics more than a decade ago – basically introducing Edward Tufte as the “Leonardo da Vinci” of data. With the beginning of 2022  I am now absolutely overwhelmed by the number of excellent tutorials out there. Here is my recommended  list

youth is no guarantee of innovation

I learned only recently about the 2012 James Bond dialogue in the movie Skyfall where he talks to the new and much younger head of Q branch.

Q: Age is no guarantee of efficiency
Bond: And youth is no guarantee of innovation

Nice to see that I recently earned a new Stackoverflow badge while the last SO report says that 90% of all software developers are younger than 45.

The Python nightmare: How to install mask_rcnn and detectron2

Coming from R the most exciting thing with Python is the incompatibility of the different modules…

While I can recommend the Anaconda Navigator, the following commands work only in the terminal.

Thanks to Nouman945 for help with the original mask_rcnn instructions.

conda create --name matterport python=3.6.13 tensorflow==1.15.0 Keras==2.2.4 h5py==2.8.0 pip
conda activate matterport
git clone https://github.com/matterport/Mask_RCNN.git
cd ./Mask_RCNN-master
python -m pip install -r requirements.txt
git clone https://github.com/philferriere/cocoapi.git
python -m pip install pycocotools
python -m pip install git+https://github.com/philferriere/cocoapi.git#subdirectory=PythonAPI
wget https://github.com/matterport/Mask_RCNN/releases/download/v2.1/mask_rcnn_balloon.h5 > Mask_RCNN/mask_rcnn_coco.h5
conda deactivate

For detectron I follow basically detectron2.readthedocs.io

conda create --name detectron2 python=3.6.13 tensorflow==1.15.0 Keras==2.2.4 h5py==2.8.0 pip
conda activate detectron2
conda install pytorch==1.8.0 torchvision==0.9.0 torchaudio==0.8.0 -c pytorch
git clone https://github.com/facebookresearch/detectron2.git
CC=clang CXX=clang++ ARCHFLAGS="-arch x86_64" python -m pip install -e detectron2
conda deactivate

Last but not least the installed apps:

The Apple Keynote Feature we have been waiting for

Apple updated last month Keynote with a feature we have been waiting for years – live video which is super cool to show live internet pages from active polls.

 

insert video only works from the top menu

There is no video source connected at the beginning but can can be added from the right side menu.

Unfortunately the virtual camera of OBS is not recognized but I could easily connect my Blackmagic Atem Mini so I have direct access to any source coming from a second computer running Chrome, Ipad with Sketchbook  and of course  the Z6 HDMI video signal.

 

adding the ATEM Mini from the right menu

 

A comparison of image duplication software

A quick comparison without pretending any objectivity

 Open SourceCommercial / Restricted AccessWebUpper Limit ImagesSpeedSensitivitySpecificityComment
Image Verification AssistantNNY1***
ForensicallyNNY1*****
FotoForensicsNNY1****
ImagedupNNY>500*****my own proof of principle pipeline
ImageTwinNYY10*******
LpixelNYY50????
ProofigNYY50?*****
DropletsYNN1***
ImageJYNN1???
SherloqYNN1NANANAgood toolbox
TinEyeNYY*******full images only per request
figcheckNNY1???out of order 15/10/21, scam?
BioVoxxelYNN1???toolbox
max rating is ***