Stevens Blog

Ich wollte wissen, was mich ein Qwen-Image-2512 Fine-Tune (ai-toolkit, LoKR) zeitlich und finanziell kostet – einmal auf meiner lokalen RTX 3090 und einmal auf einer gemieteten RTX PRO 6000 Blackwell.

Kurzfazit: Ein 8000-Step-Run kostet bei mir in € fast gleich viel, aber die PRO 6000 läuft ~5× schneller.

Setup & Annahmen

Hardware: RTX 3090 (lokal) vs. RTX PRO 6000 Blackwell (gemietet)
Trainingsziel: 8000 Steps, Sampling aktiv (sample_every: 250, 1024×1024, sample_steps: 20)
Strompreis: €0,30/kWh
Leistung (Durchschnitt): 3090 GPU 360W, PRO 6000 GPU 600W
„Rest-System“ unter Last: +80W (CPU/RAM/SSD/Fans etc.)
Miete (VastAI): $0,722/h, umgerechnet mit 1 USD ≈ €0,861 (EZB-Referenzkurs vom 16.01.2026)
Hinweis: kein perfekter Benchmark – die Runs sind nicht 1:1 identisch (u. a. layer_offloading und LR).

Geschwindigkeit (inkl. Sampling)

Gemessen über Zeitabstände pro 250 Steps (inkl. Save + Sampling am Block-Ende), und auf 8000 Steps hochgerechnet:

Ich wollte wissen, wie sich meine lokale RTX 3090 (gebraucht, ~700€) gegen eine oder mehrere RTX PRO 4000 Blackwell (145W, neu ~1400€) schlägt, einmal für LLM-Inference (Single User / Scripts / eigene Agents) und einmal fürs Fine-Tuning von Bildmodellen (AI-toolkit).

Mein Fazit vorweg: bei llama.cpp ist die 3090 oft schneller im Decoding, beim Training ist die RTX PRO 4000 bei mir leicht vorne, und bei den Stromkosten pro Token/Epoch ist die RTX PRO 4000 deutlich besser.

Ich komme viel zu selten dazu, hier zu schreiben. Wahrscheinlich liegt das daran, dass ich lieber an privaten Projekten weiterbastle, als Texte zu verfassen. Vielleicht schaffe ich es, das in Zukunft zu ändern.

Als kleinen Anfang möchte ich hier nach und nach Projekte vorstellen, die ich in meiner Freizeit mache. Damit es etwas greifbarer wird, hier schon mal ein Überblick:

Mein eigenes Mainboard für den 3D-Drucker (Voron 2.4), das ich seit Jahren nutze, habe ich Centipede getauft. Es unterstützt bis zu 10 Stepper, nutzt einen STM32H723 und darauf läuft Duet3D. Ich habe zwei Stück, die über CAN kommunizieren; eines nutze ich aktuell für den ERCF (Enraged Rabbit Carrot Feeder) am Drucker.
Ein Tool zur Kalibrierung meines Beamers (aktuell JVC X5000), mit dem ich die Kalibrierung prüfen und auch die interne LUT + Matrix im Beamer aktualisieren kann.
Ein Tool in Go, das mir eine Plattform bietet, um Bild-Generierungsmodelle zu finetunen, entweder auf meiner Workstation oder über Vast.ai bzw. RunPod. Dafür habe ich mir einen PC gebaut mit einer gebrauchten RTX 3090, 128 GB RAM und einem AMD EPYC 7313P auf einem Supermicro H12SSL Board. Dabei werden Bilder, Prompts und Trainingstools sauber verwaltet.
Temperatursensoren auf ESP32-Basis, in der neuesten Version mit 2,66-Zoll-E-Paper-Display.
Ein Temperatursensor auf nRF52832-Basis mit LiFePO4-Akku und SHT41-Sensor. Er sendet die Daten per BTHome an Home Assistant. Das war auch mein erster Versuch, eine eigene PCB-Antenne zu designen, spannend, weil ich das Pi-Netzwerk nicht selbst messen kann und mir dafür die Tools fehlen. Trotzdem funktioniert es bisher echt gut. Bis jetzt läuft er überall im Haus zuverlässig. Empfangen werden die Daten von ein paar im Haus verteilten Shellys, die als BLE-Proxy für Home Assistant eingestellt sind.
Eine Budgetplanungssoftware für die eigenen Finanzen.
Eine Einkaufs-App für iOS.

Nächstes Projekt: Ein E-Paper-Frame mit einem 13,3-Zoll-Spectra-6-E-Paper-Display.

Meine 3D-Drucker-Odyssee: Von STM32 zu SAME50

Liebe 3D-Druck-Enthusiasten,

heute möchte ich euch von meinem neuesten Abenteuer in der Welt der 3D-Drucker-Elektronik berichten. Es begann alles mit einem selbstgebauten Mainboard für meinen 3D-Drucker, ausgestattet mit einem leistungsstarken STM32H7 Mikrokontroller. Darauf läuft ein STM32-Klon der beliebten RepRapFirmware¹ von Duet3D - ein echtes Kraftpaket!

Dank der Mindestbestellmenge bei JLCPCB hatte ich ein zweites Board übrig, das ich kurzerhand für meinen ERCF einsetzte. Die Verbindung über CAN FD klappte wie am Schnürchen. Doch ihr kennt das ja: Der Basteldrang ist nie ganz gestillt!

In diesem Beispiel zeige ich, wie man mit Hilfe der Python Bibliothek pyroomacoustics ¹ ein Double Bass Array (DBA) simulieren kann. Dazu wird zunächst ein Raum definiert, in dem dann die Lautsprecher und Mikrofone positioniert werden. Anschließend kann der Frequenzgang berechnet werden.

Das Ganze lässt sich gut in einem Jupyter-Notebook durchführen, da man die Frequenzgänge auch grafisch darstellen kann.

Als erstes müssen wir die Bibliothek mit pip install pyroomacoustics installieren.

In Jupyter können wir dann mit einigen Imports beginnen

In diesem Beitrag möchte ich einmal zusammenfassen, was ich bisher zum Thema Autokalibrierung von JVC Projektoren gelernt und herausgefunden habe. Das Wissen basiert auf meinem Modell, dem X5000, sollte aber auch auf andere Modelle übertragbar sein. Auch hier gleich der Disclaimer: Ich übernehme keine Garantie dafür, dass das Wissen hier richtig und vollständig ist. Wenn ihr Hinweise habt, was anders ist oder sonstige Ergänzungen, schreibt mir gerne.

Viele Informationen, Tipps und Tricks gibt es auch im Forum des Heimkinovereins: https://www.heimkinoverein.de/forum/thread/17720-jvc-auto-calibration-autocal-tipps-tricks/

Um AdGuard Home zu testen wollte ich schnell einen Docker Container erstellen. Das hat auch auf Anhieb geklappt, nur leider hat er die IPv6 Adressen der Clients nicht richtig geloggt. Die Lösung war den Container als eigenen Host im Netzwerk einzurichten.

Schritt 1: VLAN auf Unifi UDM-Pro anlegen

Da die Container mit macvlan nicht richtig DHCP können, habe ich mir ein VLAN erstellt mit einem eigenen IP-Bereich. Dazu geht man auf dem Webinterface der UDM-Pro auf “Settings”, “Network” und dann auf “New Virtual Network”. Hier werden ein IP-Bereich und eine VLAN-ID vergeben. Ich habe die ID 2 genommen. DHCP muss auf None gestellt werden. Unter IPv6 wird ebenso ein Subnet vergeben. Beispielsweise fd01::1/64.

In den letzten Jahren habe ich meinen Heimserver immer mit Ubuntu oder Debian betrieben. Da ich aber mal etwas Neues ausprobieren wollte, habe ich Anfang des Jahres Arch Linux¹ darauf installiert.

Lange Zeit dachte ich, das will ich nicht. Ich dachte: Das ist komplizierter, man muss alles von Hand installieren und einrichten, das ist nur etwas für Leute, die wirklich alles von Grund auf einrichten wollen.

Dann habe ich auf reddit einen Beitrag gelesen, dessen Kernaussage war: Arch Linux ist gar nicht so schwer.

Die Subwoofer

In meinem Heimkino stehen aktuell 4 selbstgebaute Subwoofer. Dabei handelt es sich um ScanSpeak 30W/4558T00 Treiber in einen Würfel mit 41,4 cm Kantenlänge.

Subwoofer

Entworfen habe ich diese damals mit SketchUp und das Gehäuse dann von einen befreundeten Schreiner fertigen lassen.

Angetrieben werden diese aktuell durch zwei t.amp E-400, also mit 190W pro Kanal. Hier möchte ich in Zukunft noch eine leistungsfähigere Endstufe kaufen.

Die Aufstellung

Derzeit stehen die vier Prachtstücke vorne fast in der Ecke. Sie sind ein wenig nach innen versetzt, weil in der Ecke Basstraps stehen. Hinten stehen sie in der Ecke. Die Idee war, die Raummoden maximal auszunutzen und dann mit dem EQ abzusenken, um möglichst wenig Auslöschungen zu haben.

Um das Auslesen und Auswerten meines Stromzählers zu vereinfachen, habe ich mir mittels eines ESP32 Board und eines TRCT5000 Infrarot Sensor einen Lesekopf gebaut. Leider habe ich hier noch einen alten, sogenannten “Ferraries Stromzähler”. Dieser besitzt aber eine Drehscheibe mit einer roten Markierung. Diese macht X Umdrehungen pro kWh, in meinen Fall 75. Durch die Dauer einer Umdrehung kann dann der momentane Verbrauch berechnet werden.

Für den Sensor habe ich dann ein Gehäuse im 3D Drucker gedruckt, um diesen auf den Zähler zu montieren und auszurichten. Zum Festkleben habe ich Klebeband benutzt, mit welchen man normalerweise Wände beim Streichen abklebt, um scharfe Kanten zu bekommen. Dieses lässt sich gut wieder entfernen und klebt aber trotzdem ausreichend. Entworfen habe ich das Gehäuse in Autodesk Fusion 360.

Qwen-Image-2512 Fine-Tune: Trainingskosten lokal (RTX 3090) vs. gemietet (RTX PRO 6000 Blackwell)

Setup & Annahmen

Geschwindigkeit (inkl. Sampling)

RTX 3090 vs RTX PRO 4000 (Blackwell): Inference, Training und Stromkosten

Zwischenstand und Freizeitprojekte

ERCF RepRap Duet3D

Meine 3D-Drucker-Odyssee: Von STM32 zu SAME50

Raumakustik simulieren mit pyroomacoustics

JVC Autocal - Was passiert da eigentlich?

Docker in eigenem VLAN inklusive IPv6

Schritt 1: VLAN auf Unifi UDM-Pro anlegen

Arch - Ein kleiner Spickzettel

Vier Subwoofer, der Anfang

Die Subwoofer

Die Aufstellung

Pulse counter