Skip to content

{ Tag Archives } Data Crunching

Gutes Tutorial zu Python-Generatoren

Generatoren sind eine interessante Sache. Man kann damit CoRoutinen implementieren. Und Trampoline (TrampolineStyle) für leichtgewichtiges Threading und Eventhandling. Sie sind verwandt mit Continuations. Und: man kann sehr speichersparend große Datenmengen verarbeiten. Anstatt alles auf einmal in den Speicher zu laden, kann man es mit Generatoren häppchenweise machen. Bei Textdateien beispielsweise zeilenweise. Das flutscht. Kurz: Sie […]

Also tagged , ,

Das Bundesamt für Seitenstatistik informiert – Auswertung Serverlogs 2007

Die alljährliche, aber nicht immer veröffentlichte Auswertung der Serverlogs bot dieses Jahr die Gelegenheit, die GoogleChartsAPI auszuprobieren (die ich bereits erwähnte). Ich verwende für den Großteil der Auswertungen immer noch das kostenfreie Programm Analog – das Ergebnis der Auswertung für 2007 ist online. Zusätzliche und ergänzende Auswertungen mache ich mit einem in Python implementierten MapReduce-Skript […]

Also tagged , , , ,

Machen Sie sich da mal lieber nichts vor – oder warum ein Gigabyte kein Gigabyte ist…

Jeder Informatiker weiss, dass ein Gigabyte 1024 Megabyte sind. Ein Megabyte sind 1024 Kilobyte. Ein Kilobyte sind 1024 Byte. Also: 1 GB = 1024 * 1024 * 1024 Byte = 10243. Pustekuchen! Is nich! Ein Gigabyte das sind 10003 Byte. Die Einheit für 10243 ist Gibibyte (GiB). Wollte ich nur mitteilen – weil das so […]

Also tagged , , ,