von Klopfer
#425581
Quotentreter hat geschrieben:Du solltest natürlich auch keine 6 Jahre alte Software nehmen. Mit einer vernünftigen Heuristik geht heute schon enorm viel herauszuholen. Was Email betrifft, kommt da heute bei mir nichtmal mehr 1% durch. Und bei teils über 10 Jahren alten Adressen muss ich wohl nicht sagen wieviel da aufschlägt.
Das hat mit dem Alter der Software überhaupt nichts zu tun. Installiere z.B. mal einen NEUEN Thunderbird, da schlägt der Spamfilter bei keinem Wort an und muss neu trainiert werden (ich hab's letztens notgedrungen gemacht). Bei einem Beleidigungsfilter heißt das, dass jede Beleidigung erst einmal auftreten muss, bevor sie gefiltert werden kann. Da ist man schon zigmal vor dem Kadi gelandet.
Ein ordentlicher Filter würde auch "Pedrüühker" finden.
Wenn der Filter "Pedrüühker" noch nie gesehen hat? Ich hab Informatik studiert. Ich hab Germanistik studiert. Beide Studiengänge sagen mir neben meinem gesunden Menschenverstand deutlich, dass es nicht geht, solange Computer keinen Sinn hinter Wörtern verstehen können. Wenn der Filter das Wort "Betrüger" kennt, was müsste er tun, um "Pedrüühker" auch zu erkennen, ohne extra trainiert worden zu sein? Er müsste die Silben zählen können. Er müsste in der Lage sein, stimmhafte und stimmlose Plosivlaute sowohl im Wort Betrüger als auch in Pedrüühker zu erkennen und gleichzusetzen. Er müsste Lautverlängerungen selbstständig entfernen können, die nicht wichtig sind (er dürfte ja für seine Analyse aus einem "Boot" keinen "Bot" machen, das macht es schwieriger). Noch schöner wird's bei Wörtern in anderen Sprachen, da die Lautanalyse noch komplizierter, ja sogar unmöglich wird. Dein "ordentlicher Filter" braucht ein Gehirn der Größe eines Planeten...
Und alle erdenklichen Schimpfwörter muss er ja auch nicht finden. Eben nur das was rechtlich zu Problemen führen könnte.
So ziemlich jedes Schimpfwort kann zu Problemen führen. Und auch, dass jemand ein krummer Hund ist, kann ich auf Millionen Arten schreiben. Es gibt keinen Filter, der das leisten kann.
von Quotentreter
#425588
Klopfer hat geschrieben:Das hat mit dem Alter der Software überhaupt nichts zu tun. Installiere z.B. mal einen NEUEN Thunderbird, da schlägt der Spamfilter bei keinem Wort an und muss neu trainiert werden (ich hab's letztens notgedrungen gemacht). Bei einem Beleidigungsfilter heißt das, dass jede Beleidigung erst einmal auftreten muss, bevor sie gefiltert werden kann. Da ist man schon zigmal vor dem Kadi gelandet.
Du redest von einem Endkundenprodukt was möglichst nichts kosten soll und ein breites Anwendungsfeld abdecken muss. Die können natürlich nur jungfreuliche Minimallösungen beitragen. Ich rede von einer Serverseitigen Anwendung die auf eine Software zugeschnitten sein soll. Da liegen Welten dazwischen. Und ich sage nicht umsonst alte Software. Damals ging man noch noch unwissend heran, fing raktisch von Null an. Mitlerweile sind wir aber weiter. Ich muss den Filter nicht blank ausliefern und auch nicht ungelernt. Mitlerweile sind Jahre der Erfahrung ins Land gegangen, Filter haben vielseitig dazu gelernt. Wo liegt der Sinn ein Rad neu und jungfreulich ins Rennen zu schicken?
Wenn der Filter "Pedrüühker" noch nie gesehen hat? Ich hab Informatik studiert. Ich hab Germanistik studiert. Beide Studiengänge sagen mir neben meinem gesunden Menschenverstand deutlich, dass es nicht geht, solange Computer keinen Sinn hinter Wörtern verstehen können. Wenn der Filter das Wort "Betrüger" kennt, was müsste er tun, um "Pedrüühker" auch zu erkennen, ohne extra trainiert worden zu sein? Er müsste die Silben zählen können. Er müsste in der Lage sein, stimmhafte und stimmlose Plosivlaute sowohl im Wort Betrüger als auch in Pedrüühker zu erkennen und gleichzusetzen. Er müsste Lautverlängerungen selbstständig entfernen können, die nicht wichtig sind (er dürfte ja für seine Analyse aus einem "Boot" keinen "Bot" machen, das macht es schwieriger). Noch schöner wird's bei Wörtern in anderen Sprachen, da die Lautanalyse noch komplizierter, ja sogar unmöglich wird. Dein "ordentlicher Filter" braucht ein Gehirn der Größe eines Planeten...
Das ist ja der schöne Unterschied zwischen studieren und in der Praxis anwenden. Alles geht nicht zu filtern, richtig. Es entspricht aber nicht den Tatsachen das die Filter noch vollkommen blöd in den Kinderschuhen stecken. Solche und andere Wortkreationen werden bei mir seit einiger Zeit gefiltert, ohne eigenes RZ. Da geht schoneiniges. Man kann natürlich immer vom GAU ausgehen. Nur die Praxis zeigt, die wenigsten machen sich die Mühe und kloppen einen wohl durchdachten Text in's Keyboard, der möglicherweise die Technik umgehen könnte. Minimum 95% der Fälle haut drauf los und lässt sich so einfach filtern. Ist das nichts? Diejenigen die sich wirklich eine Waffel machen sind die Spamversender. Da steckt ja auch die finanzielle Motivation dahinter. Nur hat sich auch da vieles getan. Nicht umsonst ist man zuletzt auf Bilder und z.B. PDF ausgewichen, die Spamfilter werden mit der Zeit nämlich immer schlauer und viel wird abgefischt. Nur ganz so schlau und einfallsreich ist der normale Surfer nicht. Die setzen sich auch keine Stunde dran, um irgendwas zu kreieren, was möglicherweise durchrutscht.
So ziemlich jedes Schimpfwort kann zu Problemen führen. Und auch, dass jemand ein krummer Hund ist, kann ich auf Millionen Arten schreiben. Es gibt keinen Filter, der das leisten kann.
Klar kannst du das auf dutzende arten ausdrücken. Nur wieviele machen sich die Mühe und erfinden irgendwas? Mal davon abgesehen das einige Wortschöpfungen, ausser wenige Insider, kaum einer versteht. meinetwegen wird der Filter mit der Felleule nix anfangen können. Die überwältigende Mehrheit der leser aber auch nur nicht. Die meisten schreiben es so wie es eben weit verbreitet ist. Hat man diese Ausdrucksweisen drinnen, fallen sie weg. Alles andere kann man weiterhin beibringen.

Und hierfür wird sich sicherlich genau wie für Spam und Viren ein Geschäftsfeld auftun. Wird auch nötig sein. Wie möchtest du das Problem sonst anpacken? Beleidigung oder Verleumdung ist offline schon immer strafbar gewesen. Online wird die vermeindliche Anonymität ausgenutzt. Die Handlung ist aber offline wie online nunmal die gleiche und muss auch gleich geahndet werden, es entstünde ja sonst doch sowas wie ein rechtsfreier Raum, wenn man online einfach drüber hinwegsieht. Man könnte den Straftatbestand streichen. Nur ist das keine Lösung. Man könnte darauf hoffen das man den Onliner erfolgreich dahingehend umerzieht, das er sowas nicht tut. Da friert wohl eher die Hölle zu bevor das klappt. Es bleibt also so oder so am Webmaster hängen. Und der hat nur zwei Möglichkeiten. Entweder unterbindet er die Möglichkeit des freien Kommentares ganz, oder er muss dafür sorgen das grenzwertige oder absolut untragbare Inhalte nicht veröffentlich werden. Anbieter mit entsprechenden Mirtarbeitern können ja manuell moderieren. Für die Masse der Angebote ist das aber nicht drin. Für die bleibt neben dem abschalten der Kommentarfunktion eben nur noch irgendein Helferlein. Und das ist im Moment nur die Möglichkeit irgendeines Filters. Das Problem ist da, irgendwie muss man es lösen, man kommt nicht drumherum. Da ist es sinnlos darüber zu streiten was möglicherweise eventuell nicht geht. Fruchtbarer wäre es, darüber nachzudenken, was dieses Problem am besten lösen könnte.