seltene Wörter und Phrasen  XML
  Forum Index » Diskussionsforum
Author Message
Admin
Derzeit gilt die "Regel", nur solche Wörter in OpenThesaurus aufzunehmen, die auch halbwegs häufig sind. Als Faustregel gilt: mindestens 100 Treffer mit Google. Dabei muss man darauf achten, dass man Phrasen in Anführungszeichen einschließt und nur deutschsprachige Seiten durchsucht (das stand auch mal in unserer FAQ, wurde aber beim Aufräumen entfernt).

Im Folgenden liste ich die Vor- und Nachteile auf, die mir dazu spontan einfallen:

Vorteile der "keine-seltenen-Wörter-Regel":

* Kompaktheit: wer schnell ein übliches Synonym sucht, findet es auch schnell
* Eine gewisse Einheitlichkeit: ich habe nicht einmal ein Synonym und ein anders mal hundert. Das ist auch für die Website wichtig, die immer unter bestimmten Annahmen gestaltet ist.
* bessere Möglichkeiten der Qualitätssicherung: bei hundert Synonymen steigt der Aufwand einer Prüfung sowohl wegen der Menge der Wörter, als auch, weil einzelne Wörter wesentlich spezieller sind

Nachteile:

* wer ein sehr seltenes Synonym sucht oder eine kreative Schöpfung und auch bereit ist, Zeit zu investieren (z.B. 50 Einträge durchzuschauen), findet evtl. nichts

Soll die Beschränkung auf nicht-seltene Wörter gelockert werden, brauchen wir meiner Meinung nach eine Idee, auch große Synonymgruppen sinnvoll anzuzeigen. Einfach nur mit dem jetzigen Konzept deutlich mehr Synonyme anzeigen würde die Webseite unübersichtlicher machen für alle Benutzer, die mit den bisherigen Daten schon zufrieden sind.

Alle Ideen dazu sind willkommen.
old Joe
Mir geht's ja vor allem um die seltenen kreativen Wortkombinationen, wo viele sprachsensible Zeitgenossen sagen würden: 'Ah, eine herrliche Formulierung, warum ist mir das bloß noch nicht eingefallen!?' Vielleicht könnte man solche Ausdrücke einfach als 'selten' (oder 'gelegentlich' o.ä.) markieren und die für den Normaluser erst durch Klick auf eine zusätzliche Schaltfläche 'hier ein paar weitere Raritäten und Perlen der Sprachkunst' sichtbar machen? Oder jedenfalls die seltenen irgendwie markieren und typographisch durch Einrückung, kleinere Schrift (nicht so gut), blassere / andere Farbe usw. vom Normalfeld absetzen?
Pichica
Die Frage ist tatsächlich: Was ist die Aufgabe einer spezialisierten Seite für Synonyme?

Eine Analyse und Zahlen zuvor

Auslöser der Diskussion ist, dass ich 400 Synonyme für "Rot" in Operthesaurus eintragen wollte. In der Realität gibt es sicher mehr als 1000 Synonyme dafür. Wieso sperrt sich Openthesaurus?

Das Word Synonymlexikon gibt zum Begriff "Rot" 27 Synonyme an. Im Duden Nr. 8, "Sinn- und sachverwandte Wörter", von 1972 gibt es für "Rot" etwa 84 Synonyme. Dazu werden eigens aufgeführt noch "Rosa" mit 14 Synonymen und "Violett" mit 24 Einträgen. Rot in Word 27 hat Synonyme.
Der Duden hat damit die meisten Einträge. Er ist allerdings noch auf die Buchform fixiert und daher ist eine Beschränkung angesagt. In der ganzen deutschen Literatur gibt es kein grösseres Gesamt-Synonymlexikon.
Auch das Internet hat die Situation nicht entscheidend verändert. Soweit ersichtlich, gibt es vier Synonymlexika im Internet. Drei davon, nämlich Woxikon, wortschatz.uni-leipzig und openthesaurus stehen grossteils noch hinter dem Duden von vor mehr als 40 Jahren zurück. Woxikon scheint mir mehr ein Nebenprodukt und wirtschaftlich orientiert. Die Uni Leipzig bietet Häufigkeitsangaben und offeriert keine Mitarbeit. Openthesaurus hat die Ambition in Openoffice integriert zu werden, was diese Seite aus allen anderen heraushebt. Leider wird sie durch eine unleidige Diskussionen über die Häufigkeit des Gebrauchs von Synonymen gestört.
Es bleibt noch "wie-sagt-man-noch?". Einzig hier gibt es keine Beschränkungen in der Aufnahme von Synonymen. Die Seite ist von einer Privatperson aus Österreich und fällt auf durch die mangelnde Struktur. Die Eingaben sind nicht alphabetisch geordnet, wiederholen sich oft und sind auch wenig inhaltlich strukturiert. Trotz dieser Schwächen findet man hier z.B. für das Wort "Sex" mehr als 218 unterschiedliche Einträge. Wieso bietet Openthesaurus nur 19 Sex- und 18 Koitus-Einträge? Selbst der Duden aus den prüden 1972er Jahren bietet unter dem Begriff "Koitus" mehr als 50 Optionen. Und Ernest Bornemann in seinem Buch "Sex im Volksmund. Der obszöne Wortschatz der Deutschen" bringt es unter den Titeln "25 Masturbation" und "26 Koitus" auf über 10 Seiten mit Synonymen, das sind mehr als 2500 Synonyme, Umschreibungen oder Methaphern.

Was kann man tun?
Es ist also ganz offensichtlich, dass die deutsche Sprache, die über eine Millionen Wörter hat (mit Fremdwörtern, Fachwörtern, u.a. technischen, medizinischen Begriffen usw.), in Openthesaurus nur ungenügend zu Wort kommt. Eine Selbstbeschränkung ist als fehl am Platze. Openthesaurus ist sogar ein Rückschritt hinter den Duden von vor 40 Jahren. Hier muss sich etwas grundlegend ändern!
Wer Angst vor zu viel Synonymen hat, der kann sich die Regelung wie in "Wie sagt man noch?" ansehen. Mit einem Klick kann man ein zusätzliches Fenster öffnen, in dem alle eingetragenen Synonyme aufgeführt werden. Der, dem wenige Synonyme genügen, kann sich mit dem Synonymlexikon in Word abgeben. Aber Openthesaurus muss sich unbedingt öffnen und wirklich die ganze deutsche Sprache aufnehmen. Wenn nötig, kann ja wie in der "Uni-Leipzig" die Häufigkeit angegeben werden. Eine Funktion, die je nach Alphabeth oder nach Häufigkeit sortiert, würde bei der Auswahl helfen.
Die jetzigen Regelungen der Beschränkung sind falsch und entsprechen nicht der deutschen Sprache. Openthesaurus sollte auch wirklich "open" und wirklich ein "Thesaurus" sein!
Bornemmann hat es in seinem Buch "Sex im Volksmund. Der obszöne Wortschatz der Deutschen" geschafft 50 000 Ausdrücke, Synonyme und Begriffe zum Thema "Sex" in einem Buch zu sammeln. Wieso sollte das ein Internet-Programm wie Openthesaurus für die ganze Breite der deutschen Sprache nicht schaffen?
old Joe
Ich kann da jetzt nur grob antworten. Ich versuch's mal.

Wenn ich einen sagen wir mal verbessernden, präziseren oder schmückenderen Ausdruck für das Farbadjektiv Rot suche, dann wird mir ein Liste von 400 Rot nuancierenden Ausdrücken nicht helfen, einfach, weil ich als durchschnittlicher Internetuser nicht die Energie habe, mich durch diesen Berg an bedenkenswerten Nuancierungen hindurchzufressen. Das wird dann einfach weggeklickt und gut ist. Soviel zu der pragmatischen Seite, da helfen auch keine Zahlenvergleiche.

Andererseits ist es so: Du hattest Dir möglicherweise damit viel Arbeit gemacht? Sagen wir mal in Stunden ausgedrückt ein paar Stunden? Dann ist es natürlich schmählich, so eine Arbeit einfach als abgelehnt zu erleben. Außerdem: Hast Du eventuell einfach kopiert? Die Möglichkeit liegt nahe, denn wer denkt sich schon 400 Farbnuancen aus und bringt sie dann auch noch auf Pepier und verbreitert solche Listen im Internet.

Außerdem: Rot ist nicht Rot. Die ganzen Varianten einfach unter Rot einzutragen, geht nicht. Das müsste zumindest weiter aufgefächert werden in: 1 eher oranges, eher rein rotes, eher nach blau tendierendes oder auch rosa-angenähertes Rot.
Admin
Bei Sortierung nach Häufigkeit muss man sich immer bewusst sein: erstens bezieht sich die Häufigkeit auf ein Textkorpus, das nie ganz neutral und aktuell sein kann. Zweitens kann man so die Häufigkeiten von Wörtern angeben, nicht die von Bedeutungen: Die Zahlen von "Schotter" (Splitt) und "Schotter" (ugs. für Geld) würden sich also addieren. Das heißt nicht, dass die Anzeige der Häufigkeit eine schlechte Idee ist, aber das sollte man im Hinterkopf behalten.

Was die angeblich mangelnde Offenheit angeht: das "Open" in OpenThesaurus ist das gleiche wie in "Open Source": die Daten und die Software stehen unter einer freien Lizenz zur Verfügung, d.h. jeder kann damit unter zum Beispiel www.mein-eigener-thesaurus.de seine eigene Website aufsetzen. "Open" heißt aber nicht, und kann nicht heißen, dass ohne Struktur, Konzept und Regeln einfach alles gesammelt wird. Das wäre nicht "open", sondern "Müllhalde".

Ich bin mir nicht schlüssig, ob das Farb-Beispiel jetzt gerade besonders gut oder besonders schlecht ist, um das bekannte "was-gehört-dazu"-Problem zu verstehen.
 
  Forum Index » Diskussionsforum