US-Fernsehen (inklusive Season- und Pilot-Reviews), britisches Fernsehen etc.
Benutzeravatar
von Theologe
#955488
Shepherds Wert wurde ja nicht gelöscht, er findet als extremer Abweichler aber keine Berücksichtigung im Schnitt, weil er den Schnitt der Serie verfälscht. Wenn es so wenige Stimmen gibt. Das ist in der Statistik ganz normal. Deshalb habe ich Stefan ja geraten anstatt des arithmetischen Mittels den Median zu berechnen, weil der bei wenigen Stimmen repräsentativer ist.
von Stefan
#955497
Plem hat geschrieben:Ich schließe mich Waterboy in allen Punkten an. Ich finds peinlich, dass man sowas überhaupt zur Diskussion stellt :roll:
Aha.. na ja, immer wieder nett, von dir zu lesen. Fakt ist, dass es in der Statistik komplett normal ist, solche extrem abweichenden Werte aus den Berechnungen zu werfen, da sie die Daten verfälschen.

Wie gesagt, ich hät auch einfach bei allen Serien auf die Median-Berechnung umstellen können, dann hät wohl gar niemand gemeckert, weil die meisten wohl nichtmal gecheckt hätten, was das überhaupt bedeutet. Ich hab gestern auch recherchiert, ob Excel (ja ich hab das ganze nur in nem Excel file) sonst noch etwas bietet und fand noch eine Art "Mittelweg" zwischen Medien und normalem Durchschnitt, bei dem einfach die Extremwerte in beiden Richtungen ausgeschlossen werden und vom Rest der Durchschnitt berechnet wird.

Wie gesagt, die Werte wurden ja nicht gelöscht, nur aus der "Durchschnittsberechnung" ausgenommen, die schlussendlich auch "nur" die Platzierung in der Liste bestimmt. Ich find es nicht peinlich, darüber zu diskutieren, aber gut .. einige können wohl nichts hier schreiben, ohne andere Leute anzugreifen :roll:

Und nochmal, ich hab kein Problem damit, die Werte wieder in die Berechnung zu nehmen, ich hatte nur das Gefühl, ein anderer Weg wird gewünscht, daher wollte ich das ansprechen. Aber ja, ich bin furchtbar peinlich :roll:
Benutzeravatar
von Bobby
#955500
Stefan hat geschrieben:Und nochmal, ich hab kein Problem damit, die Werte wieder in die Berechnung zu nehmen, ich hatte nur das Gefühl, ein anderer Weg wird gewünscht, daher wollte ich das ansprechen. Aber ja, ich bin furchtbar peinlich :roll:
Ne, hast du sehr schön gemacht. Wenn man zumindest etwas Statistik gelernt hat, dann weiß man, wie Stefan gut erklärt hat, dass man solche Extrema eben mit Vorsicht behandeln muss, da die Daten eben verfälscht werden.

Ich bitte um Stellungnahme von Dipl.-Statistiker Alpha! 8)
Benutzeravatar
von Theologe
#955503
Ich hatte in meiner Statistik-Klausur eine 3,6 nachdem ich 2x durchgefallen war. Wenn ich keine Ahnung habe, wer dann?
von Plem
#955510
Stefan hat geschrieben:Aha.. na ja, immer wieder nett, von dir zu lesen.
Du hast gesagt wir sollen es ansprechen, wenn jemand ein Problem damit hat. Das hab ich getan. Wenn du in deiner Meinung eh schon festgesetzt warst, dann hättest du nicht fragen sollen :P
Stefan hat geschrieben:Fakt ist, dass es in der Statistik komplett normal ist, solche extrem abweichenden Werte aus den Berechnungen zu werfen, da sie die Daten verfälschen.
Keine Ahnung was normal ist, ich kann nur sagen wie ich persönlich darüber denke und ich finde es nicht gut. Ich bin ja selbst ein Fan von Spartacus, aber wenns ihm nicht gefiel, dann gefiel es ihm halt nicht. Außerdem ist das hier der Pilot-Review-Thread und nicht die Präsidentschaftswahl. Ich denke da können wir mit einem Ausreißer leben.
Stefan hat geschrieben:Wie gesagt, ich hät auch einfach bei allen Serien auf die Median-Berechnung umstellen können, dann hät wohl gar niemand gemeckert, weil die meisten wohl nichtmal gecheckt hätten, was das überhaupt bedeutet.
Nö, hätte ich nicht, da ich wie gesagt keine Ahnung von Statistik habe, aber sogar im Eingangspost steht, dass der Durchschnitt berechnet wird und nicht der Median.
Stefan hat geschrieben:Ich find es nicht peinlich, darüber zu diskutieren, aber gut .. einige können wohl nichts hier schreiben, ohne andere Leute anzugreifen :roll:
Du weißt scheinbar noch immer nicht was es heißt andere Leute anzugreifen :roll: Wenn ich sage, dass ich es peinlich finde eine Diskussion über etwas zu starten, dann beleidige ich damit niemanden persönlich. Aber wenn du dich angegriffen fühlen willst, dann tu das halt.
von Stefan
#955513
Plem hat geschrieben:
Stefan hat geschrieben:Aha.. na ja, immer wieder nett, von dir zu lesen.
Du hast gesagt wir sollen es ansprechen, wenn jemand ein Problem damit hat. Das hab ich getan. Wenn du in deiner Meinung eh schon festgesetzt warst, dann hättest du nicht fragen sollen :P
Ich hab überhaupt kein Problem damit, wenn jemand bzw du anderer Meinung bist - ich hab ja auf Waterboy auch nicht so reagiert :wink:
Plem hat geschrieben:
Stefan hat geschrieben:Ich find es nicht peinlich, darüber zu diskutieren, aber gut .. einige können wohl nichts hier schreiben, ohne andere Leute anzugreifen :roll:
Du weißt scheinbar noch immer nicht was es heißt andere Leute anzugreifen :roll: Wenn ich sage, dass ich es peinlich finde eine Diskussion über etwas zu starten, dann beleidige ich damit niemanden persönlich. Aber wenn du dich angegriffen fühlen willst, dann tu das halt.
Na ja, wir haben anscheinend wirklich verschiedene Definitionen davon, was jemanden beleidigt. Ich find es beleidigend, wenn jemand sagt, ich bin lächerlich.. aber gut.. was solls :)

Edit: Wie gesagt, wir haben 3 Möglichkeiten:

1) Wir lassen die normale Durchschnittsberechnung
2) Wir stellen alle auf den Median um
3) Wir stellen auf die von mir angesprochene "ausnahme der Extremwerte" um

Persönlich ist es mir gleich, ich wollt euch einfach die Möglichkeit geben, das zu besprechen :wink:
Benutzeravatar
von redlock
#955518
Stefan hat geschrieben:, dass es in der Statistik komplett normal ist, solche extrem abweichenden Werte aus den Berechnungen zu werfen, da sie die Daten verfälschen.
Aha, wenn uns die Werte nicht passen, wird die Statistik bzw. die Auswertung also geändert. :roll: :roll:

Dieser Median Unsinn (ja, Unsinn) gehört sofort verworfen. Hier geht es um eine Subjektive Bewertung. Da müssen Aussreißer drin bleiben :!:
(Bei White Collar wirft man mir vor, ich bewerte nur zw. 6/10 und 8/10, was nicht stimmt :lol: )

Also, mach's wie in Punkt 1 von dir vorgeschlagen :!:
Benutzeravatar
von Theologe
#955523
redlock hat geschrieben: Dieser Median Unsinn (ja, Unsinn) gehört sofort verworfen.
Der Median ist kein Unsinn. Es gibt drei Wege den Durchschnitt zu berechnen, arithmetisches Mittel, Median und Modus (OK, den muss man nicht groß berechnen).
Das Durchschnittsalter der Zuschauer wird zB immer mit dem Median berechnet, weil ein 100jähriger da genauso zählt wie 5 20jährige, was ohne Median zu einem Schnitt von 33 führen würde.
Es soll nichts geschönt werden, sondern das Ergebnis soll repräsentativ werden, wenn aber aus einer Spitzenbewertung durch eine Stimme eine mittelmäßige Wertung entsteht, ist das Ergebnis verfälscht. Genauso andersherum, wenn eine Serie nur miese Wertungen bekommt, kann eine Spitzenbewertungen bei zu wenigen Stimmen, dafür sorgen, dass Endwert Mittelmaß suggeriert.
Benutzeravatar
von AlphaOrange
#955524
Stefan hat geschrieben:Ich hab gestern auch recherchiert, ob Excel (ja ich hab das ganze nur in nem Excel file) sonst noch etwas bietet und fand noch eine Art "Mittelweg" zwischen Medien und normalem Durchschnitt, bei dem einfach die Extremwerte in beiden Richtungen ausgeschlossen werden und vom Rest der Durchschnitt berechnet wird.
Naja, das ist so ein Wischiwaschi-Mittelding. Wenn genug Leute abstimmen und zwei davon völlig aus daneben hauen, ist das Problem wieder da. Und in den meisten Fällen löschst du dann Punkte, die ganz normal sind.
Bobby hat geschrieben:Ich bitte um Stellungnahme von Dipl.-Statistiker Alpha! 8)
Okay, wennn das erforderlich ist. Hier sind die seriösen Varianten:

a) Median
Ist extrem robust gegen Ausreißer, da kann selbst ein ganzer Trupp Bekloppter nichts gegen ausrichten. Nachteil: Da nur maximal zwei Stimmen in die Zahl einfließen, könnte das den ein oder anderen frustrieren, der nicht weiß, warum er überhaupt noch Punkte geben soll.

b) Ausreißerbereinigung
Der parametrische Weg: Berechne die Standardabweichung d und streiche alles, was weiter als 1.5*d vom Mittelwert m der Daten entfernt liegt.

Da Normalverteilungsannahme hier schon wegen des festen Punkterahmens von 0 bis 10 ziemlich gefährlich ist, lieber die nichtparametrische Variante:
Berechne den Interquartilsabstand Q (75%-Quantil U minus 25%-Quantil L).
Ziehe von L das 1.5-fache von Q ab (= LO) und nimm alle Werte, die darunter liegen aus der Wertung.
Addiere zu U das 1.5-fache von Q (= UO) und nimm alle Werte, die darüber liegen, aus der Wertung.
Das a%-Quantil ist die Zahl, die größergleich ist als a% der vorliegenden Daten und kleinergleich (100-a)% der Daten.

Spartacus GOTA: 0.5 8.0 8.0 8.0 8.0 8.5

Nicht-parametrisch:
U = 8.0
L = 8.0
Q = 0
LO = 8.0
UO = 8.0
Damit fallen sowohl 0.5 als auch 8.5 aus der Wertung und das ausreißerbereinigte Mittel liegt logischerweise bei 8.0.

Parametrisch:
d = 3.109
m = 6.833
LO = 2.17
UO = 11.50
Damit fällt 0.5 aus der Wertung und das ausreißerbereinigte Mittel liegt bei 8.1.


Oder man lässt es drin und lebt mit seltsamen Einzelmeinungen.
Benutzeravatar
von Bobby
#955537
Ach komm, jetzt hat uns Alpha die Sache so gut und ausführlich geschildert und dann machst du dich darüber lustig. :(

Mich erinnerte das nur an die schrecklichen drei Statistikklausuren. :lol:
von Stefan
#955543
Zur Zeit tendiert hier die Mehrheit wohl dazu, den normalen Durchschnitt so zu berechnen wie bisher .. wenn sich das nicht mehr ändert, werd ich das beim nächsten Update wieder so berücksichtigen :wink:
Benutzeravatar
von AlphaOrange
#955545
Stefan hat geschrieben:Zur Zeit tendiert hier die Mehrheit wohl dazu, den normalen Durchschnitt so zu berechnen wie bisher .. wenn sich das nicht mehr ändert, werd ich das beim nächsten Update wieder so berücksichtigen :wink:
Ich glaube, ich habe jetzt auch von allen Alternativen abgeschreckt :mrgreen:
von Stefan
#955551
AlphaOrange hat geschrieben:
Stefan hat geschrieben:Zur Zeit tendiert hier die Mehrheit wohl dazu, den normalen Durchschnitt so zu berechnen wie bisher .. wenn sich das nicht mehr ändert, werd ich das beim nächsten Update wieder so berücksichtigen :wink:
Ich glaube, ich habe jetzt auch von allen Alternativen abgeschreckt :mrgreen:
fürcht ich auch :lol:
Benutzeravatar
von Shepherd
#955570
AlphaOrange hat geschrieben: Berechne den Interquartilsabstand Q (75%-Quantil U minus 25%-Quantil L).
Ziehe von L das 1.5-fache von Q ab (= LO) und nimm alle Werte, die darunter liegen aus der Wertung.
Addiere zu U das 1.5-fache von Q (= UO) und nimm alle Werte, die darüber liegen, aus der Wertung.
Das a%-Quantil ist die Zahl, die größergleich ist als a% der vorliegenden Daten und kleinergleich (100-a)% der Daten.
Alter Schwede, beim nächsten Mal gebe ich Spartacus einfach 8 Punkte. :lol:
Theologe hat geschrieben: Das Durchschnittsalter der Zuschauer wird zB immer mit dem Median berechnet, weil ein 100jähriger da genauso zählt wie 5 20jährige, was ohne Median zu einem Schnitt von 33 führen würde.
Nach der Medianberechnung läge der Schnitt dann also bei 20 und der 100-Jährige fiele komplett untern Tisch (und käme vermutlich nie mehr hoch)? Das kann doch irgendwie nicht richtig sein. Oder was wäre, wenn 9 Leute Spartacus bewertet hätten und noch 3 andere die Serie so schlecht fänden. Dann hätten wir z.B.
8
8
8
8
8
0,5
0,5
0,5
0,5

Und dann wäre der Median 8 und meine 3 Freunde werden ignoriert? :( Also für mein Empfinden ist das schon ziemlich zweifelhaft, denn ne 8 gibt dann doch nicht die wirkliche Stimmungslage wider. Dann noch eher wie beim Skispringen, der höchste und der niedrigste Wert fallen weg. :lol:
Benutzeravatar
von AlphaOrange
#955636
Shepherd hat geschrieben:Oder was wäre, wenn 9 Leute Spartacus bewertet hätten und noch 3 andere die Serie so schlecht fänden. Dann hätten wir z.B.
8
8
8
8
8
0,5
0,5
0,5
0,5

Und dann wäre der Median 8 und meine 3 Freunde werden ignoriert? :( Also für mein Empfinden ist das schon ziemlich zweifelhaft, denn ne 8 gibt dann doch nicht die wirkliche Stimmungslage wider.
Korrekt, der Median wäre 8.
Das ist der Grund, warum man den Median nur bei unimodalen Daten (eine Spitze in der Verteilung - hier sind es zwei, eine bei 8, eine bei 0.5) verwenden sollte.
Benutzeravatar
von redlock
#955831
Theologe hat geschrieben:
redlock hat geschrieben: Dieser Median Unsinn (ja, Unsinn) gehört sofort verworfen.
Der Median ist kein Unsinn.
Hier im thread schon, aber gut, ist Ansichtssache.

ABER auf die einfachste Lösung ist bisher offenbar keiner gekommen. :lol:

Warum nicht beide Werte angeben :?:

Stefan macht sich eh schon die ganze Arbeit, da kommt es auf die Extrarechnung doch auch nicht mehr an. Oder :?:


Übrigens, wie hält es die LeitOrange mit den Durchschnittswerten bei den Quoten?

z.B. ist die Quote der Hawaii Five-0 Folge, die Sonntags nach dem AFC Finale lief ein echter Ausreißer (nach oben).
Benutzeravatar
von AlphaOrange
#955859
redlock hat geschrieben:ABER auf die einfachste Lösung ist bisher offenbar keiner gekommen. :lol:

Warum nicht beide Werte angeben :?:
Und dann sortiert Stefan die Piloten auf der Startseite zweidimensional oder wie stellst du dir das vor?
Ist ohnehin Unsinn. Man könnte zwei Dutzend Arten von Mittelwerten angeben, aber dadurch werden sie total wertlos.
redlock hat geschrieben:Übrigens, wie hält es die LeitOrange mit den Durchschnittswerten bei den Quoten?

z.B. ist die Quote der Hawaii Five-0 Folge, die Sonntags nach dem AFC Finale lief ein echter Ausreißer (nach oben).
Arithmetisches Mittel, ich rechne da nichts raus, auch wenn's nicht so aufwändig wäre, weil alles automatisch erstellt wird.
Benutzeravatar
von phreeak
#956103
Würd mal sagen, bei der Art der Berechnung kommt es drauf an wieviele Werte vorhanden sind. Bei vielen Daten fallen Ausreißer nicht so ins Gewicht, wie z.B bei 4 Daten (Abstimmungen), wo der Durchschnitt erheblich gedrückt wird, wenn 3 von 4 Leuten mit 8.0 Stimmen und am Ende 6.0 rauskommt, oder nicht?
Benutzeravatar
von redlock
#956269
AlphaOrange hat geschrieben:
redlock hat geschrieben:ABER auf die einfachste Lösung ist bisher offenbar keiner gekommen. :lol:

Warum nicht beide Werte angeben :?:
Und dann sortiert Stefan die Piloten auf der Startseite zweidimensional oder wie stellst du dir das vor?

Na z.B. Alphabetisch :lol: :lol:

Tut mir leid, aber ich sehe da kein Problem zwei Mittelwerte (z.B. Arithmetisch, Median) anzugeben...
Benutzeravatar
von Theologe
#956280
redlock hat geschrieben: Na z.B. Alphabetisch :lol: :lol:

Tut mir leid, aber ich sehe da kein Problem zwei Mittelwerte (z.B. Arithmetisch, Median) anzugeben...
Der Median ist doch Unsinn, hat der große warlock gesagt.
Benutzeravatar
von redlock
#956326
Theologe hat geschrieben:
Der Median ist doch Unsinn, hat der große warlock gesagt.
:lol: :lol:




Tabellenreihenfolge gemäß arithmetischem Durchschnitt
.
.
.
SPARTACUS: GOTA [STARZ]
Arithmetischer Durchschnitt: 6,8
Median: 8 (oder nehmt einen anderen Wunderwert der Statistik)

phreeak: 8,5
Stefan 8,0
Plem: 8,0
Bobby: 8,0
Theologe: 8,0
Sheperd: 0,5

.
.
.


und das geht nicht weil :?:

Jetzt sag mir keiner zwei Durchschnittswerte verwirren den QM-Leser... :lol:
von Stefan
#956333
Na der Durchschnitt ist ja auch "nur" dazu da, um die Listenplatzierung zu berechnen .. den Medien noch dazu auszugeben, ist doch nicht wirklich sinnvoll, da ja sowieso alle Bewertungen auch dort stehen.. ergo sieht sowieso jeder User, wie gevotet wurde.

Wie gesagt, danke für eure rege Beteiligung, ich mach nachher n Update und werde Sheperds lächerliche ( :lol: ) Wertung wieder miteinbeziehen und gut ist :mrgreen:
Benutzeravatar
von Theologe
#956371
Stefan hat geschrieben: Wie gesagt, danke für eure rege Beteiligung, ich mach nachher n Update und werde Sheperds lächerliche ( :lol: ) Wertung wieder miteinbeziehen und gut ist :mrgreen:
Kennzeichne diese aber wenigstens als solche.
  • 1
  • 18
  • 19
  • 20
  • 21
  • 22
  • 33