Statistiken (zum hoffentlich letzten Mal;-)

Renault

Anbetrachts der Diskussion um die aktuelle Pannenstatistik und ihre Interpretation hab ich mir die aktuelle mal genauer angesehen.

Eines Vorweg: Ich bin Mathematiker, will aber hier nicht mit Theorien anfangen, sondern Beispiel bringen, die auch ein Laie nachvollziehen kann.

Alle Beispiel hab ich genau aus der aktuellen ADAC-Statistik entnommen zum nachvollziehen.

Laut ADAC kommt die Gesamtwertung folgender maßen zustande:
1. Anhand der Pannenhäufigkeit je Zulassungsjahr
werden die Plätze in diesem Jahr vergeben
(Bsp. Renault Twingo aus 2004: 1,8 Besser sind
aus diesem Baujahr nur BMW Mini (1,2), Smart
(1,4) und Audi A2 (1,5). Damit ist der Twingo aus
2004 auf Platz 4.
2. Genauso wird mit dem Auto für jedes weitere Jahr
verfahren. (Bsp. Twingo, Platziereungen:
2003 Platz 10 | 2002 Platz 12 | 2001 Platz 17
2000 Platz 18 | 1999 Platz 15
3. Daraus wird die durchschnittliche Platzierung
berechnet: (4 + 10 + 12 + 17 + 18 + 15)/6 =
12,67
4. Genauso wird mit allen anderen Autos verfahren
5. Anhand dieser Platzierungen wird die Rangliste
erstellt

Soweit, so gut...

Jetzt sind allerdings nicht alle Autos in jedem Jahr vertreten.
Extremes Beispiel: Angenommen, wir hätten ein extrem schlechtes Auto in ein Gruppe mit nur 4 Autos, nennen wir sie A, B, C und D.
Auto A sei furchtbar schlecht und immer letzter.
Wir betrachten nur den Zeitraum 1999, 2000,2001, 2002, 2003 und 2004.
Allerdings gab es nur Auto A in allen 6 Jahren.
Dies Auto B, C und D gab es erst seit 2002.

Wir nehmen folgenden Pannenindex (wie in der ADAC-Statistik:
1999 2000 2001 2002 2003 2004

A 50,4 45,2 40,3 35,2 30,0 25,1

B 8,8 5,4

C 10,7 3,1

D 5,3 1,2

Nun die Platzierungen:
- A hat 4 mal Platz eins und zweimal Platz 4, macht
(1+1+1+1+4+4)/6 = 2
- B hat Platz 2 und Platz 3, ergibt in Schnitt 2,5
- C hat Platz 3 und Platz 2, ergibt auch 2,5
- D hat Paltz 1 und Paltz 1, ergibt Platz 1

Gesamtwertung analog zur ADAC-Statistik

1. Auto D
2. Auto A (das mit den extrem vielen Pannen)
3. Auto B
3. Auto C

Noch Fragen?
Wer jetzt glaub, das hätte in der Praxis keine Bedeutung, der sole sich z.B. den Citroen C3 anschauen: Einmal Platz 19, einmal Platz 15, einmal Platz 12. Aber wo ist er in der Gesamtwertung? Platz 21...

Was will ich damit sagen? Im Prinzip nur eins: Dass man nicht zuviel auf Statistiken geben soll.

Ganz unbrauchbar ist diese Statistik aber dennoch nicht: So lese ich z.B. bei Renault einen eindeuitigen Aufwärtstrend heraus, wohingegen Nissan einen besorgniserregenden Abwärtstrend zeigt.
Lassen wir uns überraschen, was nächstes Jahr kommt....

18 Antworten

Zitat:

Original geschrieben von urchef


Noch sinnvoller wäre es vielleicht, gar nicht erst versuchen zu wollen, unbedingt ein Rangfolge aufzustellen, sondern einfach für jedes Auto Vor-und Nachteile zu beschreiben.

dasselbe könnte man auch bei autotests einführen (c't machts ja schon bei computer-tests), aber irgendwie mögen es leute, wenn etwas in ein (mehr oder weniger) "objektives" schema gepresst wird und am ende ein sieger herauskommt

Zitat:

Original geschrieben von urchef


Wenn ich mal Zeit hab, kann ich mir mal überlegen, wie man hier überhaupt eine Standardabweichung definieren soll und sie dann ausrechnen.

Ich hab mir die Zeit mal genommen...

Betrachtet wird hier ein Verhältnis der Form "Anzahl Pannen zu Anzahl Autos eines Typs", also x Pannen auf y Autos. (Das ganze innerhalb eines festen Zeitraumes, z.B. ein Jahr.)
x ist die Anzahl des Ereignisses, hier "Auto hat Panne".
y ist die Grundgesamtheit, auf die das Ereignis zutreffen kann.
x ist deutlich kleiner als y.
x/y ist dann die Wahrscheinlichkeit, dass ein Auto des entsprechenden Typs im betrachteten Zeitraum eine Panne hat, also der Mittelwert. Bis hierhin ist wohl noch alles klar und mehr wird in der Statistik auch nicht betrachtet - außer diesem unseligen Mitteln der Jahresplatzierungen über längere Zeiträume.

Die x Pannen können sich beliebig auf die y Autos verteilen, ein Auto kann im betrachteten Zeitraum natürlich auch mehrere Pannen haben.
Irgendwie gruppieren sich die Autos um den Mittelwert x/y. Je dichter viele Autos nahe am Mittelwert liegen, desto kleiner ist die Standardabweichung (als Maß der Streuung).

Nehmen wir als Beispiel zwei Autotypen A und B heraus, von denen jeweils y=1000 existieren, und begrenzen die maximale Pannenanzahl je Jahr auf 4 (das vereinfacht die Rechnung und spielt in der Realität keine Rolle).
Innerhalb eines Jahres haben

700 Autos Typ A und 800 Autos Typ B keine,
200 Autos Typ A und 40 Autos Typ B eine,
80 Autos Typ A und 30 Autos Typ B zwei,
20 Autos Typ A und 30 Autos Typ B drei und
0 Autos Typ A und 100 Autos Typ B vier Pannen in diesem Jahr.

Wir multiplizieren die Autoanzahl mit ihrer jeweiligen Pannenanzahl, summieren über alle Autos des Typs, dividieren durch die Anzahl 1000 und stellen fest, dass

ein Auto des Typs A mit einer Wahrscheinlichkeit von 0,42 (= 42%) und
ein Auto des Typs B mit einer Wahrscheinlichkeit von 0,59 (= 59%)

in diesem Jahr "eine Panne hat" (landläufige Bezeichnung). Dabei wird gemittelt (heißt ja auch Mittelwert), der sagt über die Verteilung der Pannen nichts aus !!

Wenn ich wissen will, mit welcher Wahrscheinlichkeit ich den Pannendienst brauche, muss ich die Pannenfahrzeuge im Verhältnis zu allen Fahrzeugen betrachten.

Auto A braucht mit einer Wahrscheinlichkeit von 300/1000 = 0,3 und
Auto B braucht mit einer Wahrscheinlichkeit von 200/1000 = 0,2 den Pannendienst "mindestens einmal im Jahr".

Das aber taucht aber in der Pannenstatistik gar nicht auf! Es gibt mehr pannenfreie Autos des Typs B, obwohl die gemittelte Pannenwahrscheinlichkeit höher ist. (Vielleicht gibt es mehr Montagsautos des Typs B oder mehr ungewartete Wagen, wer weiß? - ist ja auch nur ein Rechenmodell.)

Da kommt die Standardabweichung ins Spiel, siehe auch

http://de.wikipedia.org/wiki/Standardabweichung

Sie beträgt gerundet für Typ A 0,72 und für Typ B 1,30. Über Typ B sagt der Mittelwert also deutlich weniger aus. Wenn wir annehmen, dass jede Pannenanzahl bei jedem Auto eines Typs gleichwahrscheinlich ist, ist die Pannenhäufigkeit normmalverteilt.
Dann kann man die Aussage treffen, das 67% der Autos im Bereich des Mittelwertes +/- der Standardabweichung liegen. Das hinkt hier natürlich, da die Standartabweichung größer ist als die Pannenwahrscheinlichkeit (eine negative Pannenanzahl gibt es ja nicht).

Jetzt kann sich jeder überlegen, ob die Statistik des ADAC aussagekräftig ist. Zu dessen Ehrenrettung sei gesagt, dass Aussagen über große Grundmengen y und geringe Wahrscheinlichkeiten x/y meist sehr präzise sind (weiß den Namen dieses Verteilungsmodells gerade nicht). Wie präzise jedoch, weiß nur der ADAC selbst.
Ich würde jedenfalls eine Darstellung wie oben bevorzugen, wo genau steht, welcher Anteil eines Typs z.B. keine, eine, zwei, drei und mehr als drei Pannen je Jahr hat. Und das für jedes der Jahr einzeln, da ohnehin nur die 4-6 alten Wagen (also drei Jahrgänge) bewertet werden.

Nebenbei: Mein Clio hatte 2 Pannen in knapp 9 Jahren 🙂

Zitat:

Original geschrieben von Buckleew2


wenn etwas in ein (mehr oder weniger) "objektives" schema gepresst wird und am ende ein sieger herauskommt

Ja, ja, "mehr oder weniger?" ist die Frage. Zwei Städte A und B haben eine gleiche Einwohnerzahl.

In A gibt es 100 Wohnungseinbrüche pro Jahr, aufgeklärt werden davon 95.

In B gibt es 10 Wohnungseinbrüche pro Jahr, aufgeklärt werden davon 5.

In A arbeitet die Polizei besser, also ist die Stadt sicherer. Sieger eindeutig ermittelt 😉

Mal abgesehen von den hier genannten Faktoren halt ich sowieso nich viel von dem ADAC Zeug da eh immer in anderen Ländern die Hersteller "komischerweise" wieder völlig anders abschnieden.

Recht interessant finde ich allerdings das Unternehmen J.D. Power, da dieses auf weltweiten direkten Kundenbefragungen basiert und nicht nur die Pannen sondern das Gesamtfahrzeug sowie auch die einzelnen Werke der Hersteller auf Qualität etc. bewertet.
Ist eigentlich wie Stiftung Warentest nur eben mit dem Kunden als "unparteiischen" Bewerter.

Leider ist die Seite auf Englisch, aber trotzdem der Link: http://www.jdpower.com/cc/auto/index.jsp

Ein Jäger schießt auf ein Reh, einmal links und einmal rechts vorbei. Das Reh fällt tot um. Warum? Statistisch gesehen hat er getroffen.

So, ich hoffe ihr habt nich auch wie viele Deutsche 1,4 Kinder!

Ähnliche Themen
Deine Antwort
Ähnliche Themen