![]() |
Linguistik online | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Home | Linguistik online 39, 3/2009 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Europäisch eingestellt – Valenzforschung mit ParallelkorporaRolf Duffner/Alain Kamber/Anton Näf (Neuchâtel)
More data is better data 1 EinleitungFür Forschungen im Bereich der empirischen Sprachwissenschaft besteht seit einem knappen Jahrzehnt eine völlig neue Ausgangslage. Durch die Existenz und die zunehmend elaborierteren Abfragemöglichkeiten von großen digitalen Textdatenbanken eröffnen sich für eine adäquate Beschreibung von Grammatik und Lexikon von natürlichen Sprachen ganz neue Perspektiven. Dank der Möglichkeit eines schnellen Zugriffs auf riesige Mengen von Sprachdaten kann die Phase der Belegsammlung extrem verkürzt und dadurch Zeit für die Analyse und Interpretation der Rohdaten gewonnen werden. Korpuslinguistisch fundierte Forschungen sind nicht bloß von hohem theoretischem Interesse, sondern darüber hinaus von großem praktischen Nutzen, insbesondere für die Herstellung und die Bewertung von ein- und zweisprachigen Wörterbüchern. Dank der gegenwärtig verfügbaren Analysewerkzeuge kann man heute mit einem vertretbaren Aufwand überprüfen, ob die in den Wörterbüchern gemachten Angaben ein getreues Abbild von Vorkommen und Gebrauch der Lexeme in der Sprachwirklichkeit vermitteln oder nicht (für Fragen der Methodologie sei auf Kamber (2008) verwiesen). Im vorliegenden Beitrag sollen Möglichkeiten des Einsatzes von korpuslinguistischen Verfahren in der Valenzforschung und in der zweisprachigen Lexikographie demonstriert werden.1 Bei der – für die Produktion von korrekten Äußerungen zentral wichtigen – Verbvalenz handelt es sich um ein sprachliches Phänomen, das an der Schnittstelle zwischen Grammatik und Lexikon anzusiedeln ist. Entsprechend kommt es nicht bloß in den Grammatiken zur Sprache, sondern auch – oft auf mehr oder weniger implizite Weise – in den Wörterbüchern; explizit zum Thema gemacht wird es in den sogenannten Valenzwörterbüchern. 2 UntersuchungUm die Phänomene der Verbvalenz und der Polysemie sowie deren Interdependenz in mehreren Sprachen miteinander vergleichen zu können, sind wir in der vorliegenden exploratorischen Studie in drei Schritten vorgegangen. Anhand des exemplarisch herausgegriffenen polysemen Verbs einstellen soll hier ein korpusbasiertes Verfahren vorgestellt werden, mit dessen Hilfe den in einem Korpus vorkommenden Wortformen von einstellen die im jeweiligen Kontext gemeinte Unterbedeutung zugeordnet werden kann. Sodann werden die im mehrsprachigen Parallelkorpus Europarl2 auftretenden Übersetzungsäquivalente samt deren Kookkurrenzpartnern in den drei von uns ausgewählten Vergleichssprachen Englisch, Französisch und Italienisch ermittelt. Schließlich sollen die Angaben zum Verb einstellen in ausgewählten zweisprachigen Wörterbüchern mit den Korpusdaten konfrontiert werden. Die beiden von uns herangezogenen Korpora sollen dabei nicht punktuell zur Verifizierung von Hypothesen konsultiert, sondern für die gewählte Fragestellung vollständig ausgewertet und analysiert werden. 2.1 Erster Schritt: Wie wird das Verb einstellen im Deutschen gebraucht?Im einsprachigen Korpus DeReKo (Deutsches Referenzkorpus)3 werden alle Belegstellen für drei ausgewählte Verbformen des Lexems einstellen (nämlich einstellen, einzustellen und eingestellt)4 gesammelt und durch Cosmas II einer automatischen Kookkurrenzanalyse unterzogen.5 Die drei von uns ausgewählten Verbformen machen im Gesamtkorpus ca. 75% aller Vorkommen für dieses Verb aus; von den verbleibenden Verbformen entfällt, wie eine Handauszählung bei einer Zufallsauswahl von 400 Belegen ergeben hat, etwa je die Hälfte auf univerbierte Verbformen (z. B. einstellte) bzw. auf solche in Klammerstellung (z. B. stellt ... ein). Die mit Hilfe von Cosmas II gewonnenen Kookkurrenzprofile wurden zu einer – sowohl quantitative als auch qualitative Aspekte berücksichtigenden – Typologie (Unterbedeutungen, Valenzstrukturen, typische Kookkurrenzpartner) verdichtet; dabei beschränkten wir uns auf die 8 häufigsten Unterbedeutungen (vgl. Tab. 1).
Tabelle 1: Bedeutungsangaben und Kookkurrenzpartner zu den 8 häufigsten Unterbedeutungen des Verbs einstellen Bei der Lektüre von Tabelle 1 ist Folgendes zu beachten: Die Unterbedeutungen sind absteigend nach Frequenz und Typizität von 1 bis 8 durchnummeriert. Unterbedeutung 1 (mit etw. aufhören) ist also aufgrund der Korpusanalyse die häufigste und überdies die im Kookkurrenzprofil am stärksten repräsentierte Unterbedeutung. Die Kookkurrenzpartner ihrerseits sind ebenfalls absteigend nach Kohäsionsstärke aufgeführt und nach Satzgliedrolle (z. B. Akkusativobjekt, Adverbial) geordnet. Das Lexem einstellen in Unterbedeutung 1 hat also eine höhere Affinität zu Verfahren als zu Betrieb, Produktion usw. Mehrere Kookkurrenten treten kumulativ in Kookkurrenzclustern auf (z. B. Verfahren wegen Verjährung einstellen). Im Folgenden geben wir einige typische, zum Teil leicht verknappte Korpusbelege zu den einzelnen Unterbedeutungen.
Das Dudenwörterbuch in 10 Bänden registriert insgesamt 10 zum Teil noch weiter unterteilte Unterbedeutungen, die teilweise als regional oder fachsprachlich markiert bezeichnet werden. Als erste Unterbedeutung wird in diesem Wörterbuch einstellen im Sinne von 'an einen bestimmten Platz stellen' genannt, eine Verwendungsweise, für die im Kookkurrenzprofil keine Kookkurrenten zu finden sind. Die in DeReKo mit Abstand am häufigsten belegte Unterbedeutung 'mit etw. aufhören' figuriert im Dudenwörterbuch an vierter Stelle. 2.2 Zweiter Schritt (Teil 1): Welche Entsprechungen gibt es für das Verb einstellen in drei europäischen Sprachen?Die im ersten Schritt aus den sprachlichen Fakten ermittelte Typologie der Unterbedeutungen von einstellen wurde sodann im mehrsprachigen Parallelkorpus Europarl auf den deutschen Text und dessen Übersetzungsäquivalente in den drei Vergleichssprachen Französisch, Englisch und Italienisch projiziert. Durch dieses Verfahren lassen sich erstens Standardübersetzungen in den verschiedenen Vergleichssprachen gewinnen (Gleichungen wie einstellen : engager : to recrute : assumere), zweitens die (Quasi‑)Synonyme innerhalb einer Sprache ermitteln (engager-embaucher-recruter) und drittens die jeweiligen Verben mit Hilfe der präferierten Kookkurrenzpartner gegeneinander abgrenzen (engager: personnes, personnel; recruter: personnel, jeunes).
Tabelle 2: Ausschnitt aus Europarl 3. Die Belege sind bereits nach Unterbedeutung sortiert. Von den 8 Unterbedeutungen aus DeReKo kommen in den deutschen Paralleltexten von Europarl – z. T. sicher auch korpusbedingt – nicht alle gleich häufig vor, wie aus Tabelle 3 hervorgeht:
Tabelle 3: Vorkommen von einstellen in Europarl 3, aufgegliedert nach Unterbedeutungen und Verbformen Man kann hier zunächst einmal feststellen, dass die vier häufigsten Unterbedeutungen in Europarl auch in DeReKo die vier häufigsten Unterbedeutungen bilden. Unterbedeutung 6 (einen Rekord egalisieren) fehlt in Europarl dagegen völlig. Zum weiteren Verfahren: Nachdem alle 1652 Belege für einstellen, eingestellt und einzustellen in Europarl "von Hand"einer der 7 belegten Unterbedeutungen zugeordnet worden sind, können 7 Teilkorpora zusammengestellt werden, in denen das Lexem einstellen ausschließlich in der betreffenden Unterbedeutung vorkommt. In diesen Teilkorpora können dann die in den Vergleichssprachen auftretenden Entsprechungen identifiziert und in eine Rangliste gebracht werden. In den Tabellen 4 bis 7 sind die Ergebnisse dieser Teilprozedur für die vier häufigsten Unterbedeutungen zusammengefasst.
Tabelle 4: Übersetzungsäquivalente von Unterbedeutung 1 mit etw. aufhören, etw. nicht fortsetzen (807 Okkurrenzen)
Tabelle 5: Übersetzungsäquivalente von Unterbedeutung 2 in ein Arbeitsverhältnis aufnehmen (199 Okkurrenzen)
Tabelle 6: Übersetzungsäquivalente von Unterbedeutung 3 sich auf etw. vorbereiten (315 Okkurrenzen)
Tabelle 7: Übersetzungsäquivalente von Unterbedeutung 4 für etw. vorsehen, budgetieren (179 Okkurrenzen) Im Folgenden sollen exemplarisch einige aus den Tabellen 4 bis 7 ableitbare Erkenntnisse zur Sprache kommen. Nicht eingegangen wird auf die unter Diverses subsumierten Belege, in denen das Signifikat von einstellen nicht durch ein Verb, sondern auf andere Weise (insbesondere durch eine Nominalkonstruktion) ausgedrückt wird. Bei Unterbedeutung 3 (sich auf etw. vorbereiten) sind solche nichtverbalen Entsprechungen relativ zahlreich. Unterbedeutung 4 (Geld für etw. vorsehen) stellt insofern einen Spezialfall dar, als der damit bezeichnete Vorgang nicht durch das Verb einstellen allein, sondern durch das Syntagma in den Haushalt, in den Etat usw. einstellen versprachlicht wird (in der Schweiz würde man eher von budgetieren, franz. budgét(is)er sprechen); man kann hier von einer Mehrworteinheit sprechen, die in den Vergleichssprachen ebenfalls meist durch eine solche wiedergegeben ist. Schon bei einer bloß summarischen Betrachtung der obigen Tabellen fällt auf, dass bei einzelnen Übersetzungsäquivalenten ein einzelnes Verb klar dominiert und damit gewissermaßen als Standardübersetzung gelten kann, etwa 1einstellen : to stop, 3einstellen : s'adapter oder 2einstellen : assumere. So findet sich z. B. im englischen Parallelkorpus in fast jedem vierten Beleg to stop als Äquivalent von 1einstellen, während die Verben to cease, to suspend und to end deutlich seltener gebraucht werden. In anderen Fällen gibt es aber keinen so klaren Tabellenleader. So sind etwa bei 2einstellen die englischen Entsprechungen to employ und to recruit praktisch gleich häufig, und Entsprechendes gilt im Französischen für 2einstellen : engager, embaucher und im Italienischen für 1einstellen : sospendere, cessare. Sind nun diese Entsprechungen innerhalb einer Unterbedeutung in allen Fällen gegeneinander austauschbar und somit gleichbedeutend? Oder hängt die Wahl des entsprechenden Verbs vom sprachlichen Kontext in den Vergleichssprachen ab? Um auf solche Fragen Antworten zu finden, wurden die nach Unterbedeutung geordneten Teilkorpora einer Kookkurrenzanalyse unterzogen. Auf diesem Weg können jeder Entsprechung in den Vergleichssprachen ein oder mehrere Kookkurrenzpartner zugeordnet werden. Im nächsten Schritt werden wir uns also nicht mehr nur mit Charakterisierungen rein quantitativer Natur begnügen, sondern die konkreten Kotexte auch qualitativ analysieren. 2.3 Zweiter Schritt (Teil 2): Welches sind die typischen Kookkurrenzpartner der Übersetzungsäquivalente von einstellen?In den nachfolgenden drei Tabellen 8 bis 10 werden Kookkurrenzpartner zu den frequentesten Entsprechungen innerhalb derUnterbedeutungen 1, 2 und 3 aufgeführt. Diese Kookkurrenzpartner wurden in den Teilkorpora mit Hilfe des Programms Wordsmith6 ermittelt und sind hier absteigend nach Kohäsionswert angeordnet. Englisch
Französisch7
Italienisch
Tab. 8: Unterbedeutung 1 (mit etw. aufhören) mit Kookkurrenzpartnern Englisch
Französisch
Italienisch
Tab. 9: Unterbedeutung 2 (in ein Arbeitsverhältnis aufnehmen) mit Kookkurrenzpartnern Englisch
Französisch8
Italienisch
Tab. 10: Unterbedeutung 3 (sich auf etw. vorbereiten) mit Kookkurrenzpartnern Zu diesen Angaben und Beispielen folgende Lesehinweise: Bei den – kursiv gesetzten –Kookkurrenzpartnern handelt es sich meist um Akkusativobjekte, teilweise aber auch um solche mit anderen Funktionen, z. B. Modalverben bei Unterbedeutung 3 (must, should, devons, dobbiamo), welche die Notwendigkeit zur Anpassung zum Ausdruck bringen. Die obigen Resultate der Kookkurrenzanalyse (und die zitierten Beispiele) ermöglichen nun Aussagen über typische Kookkurrenten der einzelnen Übersetzungsentsprechungen. So zeigt etwa das Verb to employ eine Affinität zu people, to recruit dagegen eine solche zu staff. Im Französischen ist offenbar die Kollektivbezeichnung personnel mit allen Verben (engager, embaucher, recruter) kompatibel, während personnes und jeunes diesbezüglich Präferenzen aufweisen. Aber auch interlinguale Beobachtungen können von Interesse sein. Bei Unterbedeutung 3 (sich auf etw. vorbereiten) sind etwa zwischen Englisch, Französisch und Italienisch Übereinstimmungen zu konstatieren, und zwar nicht bloß bezüglich des Etymons der Verben, sondern darüber hinaus auch der Kookkurrenzpartner, z. B. bei den Gleichungen to adapt : s'adapter oder to prepare : se préparer : prepararsi. 2.4 Dritter Schritt: Was für Angaben zum Verb einstellen finden sich in zweisprachigen Wörterbüchern?Die anhand des einsprachigen und des zweisprachigen Korpus ermittelten Ergebnisse sollen nun mit den Kodifizierungen in ausgewählten zweisprachigen Wörterbüchern verglichen werden. Es geht um die Beantwortung der Frage: Sind die darin enthaltenen Angaben richtig, zuverlässig und angemessen? Im Folgenden werden zunächst die Langenscheidt e-Handwörterbücher Deutsch – Englisch, Deutsch – Französisch und Deutsch – Italienisch untersucht, anschliessend das Larousse Wörterbuch Deutsch – Französisch von Grappin et al. (1999). Die drei Langenscheidt-Wörterbücher setzen unterschiedlich viele Unterbedeutungen an (Englisch: 9, Französisch: 7 und Italienisch 18). In allen drei Nachschlagewerken wird übrigens ein transitiver von einem reflexiven Gebrauch unterschieden (im unten reproduzierten Textausschnitt jeweils durch einen Abstand abgetrennt). Der folgende Vergleich beschränkt sich wiederum auf die vier im Parallelkorpus untersuchten Unterbedeutungen, die hier aber in der Originalnummerierung der Wörterbücher zitiert werden. An erster Stelle steht übrigens in allen drei von uns herangezogenen Wörterbüchern (wohl nach dem Vorbild des Duden-Wörterbuchs) die – in unseren beiden Korpora nicht belegte – Unterbedeutung hineinstellen.
Langenscheidt Deutsch – Englisch Von den vier oben untersuchten Unterbedeutungen führt Langenscheidts Handwörterbuch Deutsch – Englisch nur deren drei auf: Die vierthäufigste (für etw. vorsehen, budgetieren) kommt darin nicht vor. Für Unterbedeutung 1 (mit etw. aufhören) werden neben dem prototypischen to stop auch die Übersetzungen to cease, to discontinue und to end mit möglichen Kollokationspartnern aufgeführt. Man fragt sich allerdings, wieso diese in der Ausgangssprache geboten werden (beispielsweise to cease mit Feindseligkeiten) und nicht direkt auf Englisch. Unterbedeutung 2 (in ein Arbeitsverhältnis aufnehmen) wird mit den beiden Übersetzungsvorschlägen to take on und to hire nur knapp behandelt, ohne Angabe von Kookkurrenzpartnern. Die zwei frequentesten Entsprechungen in Europarl (to employ und to recruit) fehlen. Bei Unterbedeutung 3 (sich auf etwas vorbereiten) kommen gleich fünf in Europarl auftretende Entsprechungen vor, unter ihnen die drei Spitzenreiter to adapt, to adjust und to prepare.
Langenscheidt Deutsch – Französisch Auch in Langenscheidts Handwörterbuch Deutsch – Französisch fehlt Unterbedeutung 4 (für etw. vorsehen, budgetieren). Für Unterbedeutung 1 werden vier in Europarl frequente Verben genannt (cesser, arrêter, supprimer und suspendre); die in diesem Korpus prominent vertretenen Funktionsverbgefüge mettre un terme / arriver à son terme und mettre fin / prendre fin kommen dagegen nicht vor. Die Verben cesser, arrêter und supprimer werden zunächst ganz ohne Verwendungskontexte aufgelistet, was das Risiko in sich birgt, dass sie vom Wörterbuchbenutzer als Synonyme verstanden werden könnten. Zum Übersetzungsvorschlag suspendre wird Zahlungen als Kookkurrent aufgeführt, während in Europarl aide und activité als Partner belegt sind. Der juristische Gebrauch von arrêter kann durch die Korpusanalyse nicht bestätigt werden9; in Europarl ist das Substantiv production der wichtigste Kookkurrent von arrêter. Für Unterbedeutung 2 werden die beiden frequentesten Verben engager und embaucher als Übersetzungen aufgeführt. Wie oben beim deutsch-englischen Wörterbuch werden auch hier keine Kookkurrenzpartner in der Zielsprache genannt. Bei Unterbedeutung 3 kommen s'adapter und se préparer vor, die beiden frequentesten Entsprechungen in Europarl, dazu être prêt à qc. Darüber hinaus werden drei weitere Übersetzungsvorschläge aufgeführt, die in Europarl nicht auftreten: s'attendre à qc, être organisé en vue de, se régler sur qn. Im selben Abschnitt treten dann noch Äquivalente für unsere Unterbedeutung 5 (gesinnt sein) auf, welche unseres Erachtens besser getrennt zu behandeln wäre.
Langenscheidt Deutsch – Italienisch Für Unterbedeutung 1 werden drei in Europarl frequente Verben genannt (interrompere, sospendere, und cessare), die prominenten Funktionsverbgefüge porre fine / mettere fine / avere fine werden dagegen nicht aufgeführt. Zum Übersetzungsvorschlag sospendere wird der Kookkurrent attività genannt, was mit der Analyse von Europarl übereinstimmt. Die Kookkurrenzpartner fuoco und lavoro (zu cessare bzw. interrompere) erscheinen in Europarl nicht im Kookkurrenzprofil. Das als juristisch ausgewiesene archiviare un processo scheint im Italienischen bloß eine unter mehreren Ausdrucksweisen zu sein.10 Für Unterbedeutung 2 wird mit assumere die in Europarl mit Abstand häufigste Entsprechung genannt. Wie bei den anderen untersuchten Wörterbüchern werden auch hier keine Kookkurrenzpartner in der Zielsprache genannt. Unsere Unterbedeutung 3 (sich auf etw. vorbereiten) wird in diesem Wörterbuch auf zwei Unterbedeutungen aufgeteilt. Als Entsprechungen werden prepararsi und adattarsi gegeben, das in Europarl frequenteste Übersetzungsäquivalent adeguarsi fehlt hingegen. Kookkurrenten werden im Wörterbuch keine genannt. Als einziges der untersuchten Wörterbücher registriert Langenscheidts Handwörterbuch Deutsch – Italienisch Unterbedeutung 4 (für etw. vorsehen, budgetieren). Allerdings kommt das vorgeschlagene calcolare in den knapp 180 Belegen in Europarl nur gerade einmal vor, computare hingegen überhaupt nicht. Der Eintrag einstellen im Larousse-Wörterbuch präsentiert sich folgendermassen:
Larousse (Grappin) Deutsch – Französisch Grappin bietet insgesamt vier bzw. fünf Unterbedeutungen. An erster Stelle wird die auch in den Duden-Wörterbüchern jeweils an erster Stelle genannte Unterbedeutung 'unterbringen' (Beispiel: den Wagen einstellen: mettre sa voiture au garage) aufgeführt. Es sei hier noch einmal darauf hingewiesen, dass diese Unterbedeutung in den von uns untersuchten Korpora nicht belegt ist. Sie ist auf jeden Fall höchst marginal und in der Bedeutung 'mettre sa voiture au garage' wohl gar nicht sprachüblich. Die bei der zweiten Unterbedeutung gegebene Semantisierung 'dingen' ist heute veraltet und dürfte deshalb für einen Fremdsprachenlerner kaum hilfreich sein; zudem ist das an erster Stelle vorgeschlagene Übersetzungsäquivalent prendre zu allgemein und darüber hinaus umgangssprachlich. Auch sonst sind die Übersetzungsäquivalente zum Teil unglücklich gewählt. So dürfte débrayer bei der dritten Unterbedeutung in den meisten Fällen nicht passen, weil dieses Verb nur im Zusammenhang mit Streikhandlungen und mit technischen Geräten verwendet wird. Die vierte Unterbedeutung mettre au point ist insofern zu spezifisch, als dieses Syntagma nicht allgemein für das Regeln von Geräten gebraucht werden kann. Die in der Infinitivform angesetzte Verbgruppe sich gegen etwas einstellen ist nicht sprachüblich; effektiv gebraucht wird diese Wendung nämlich nur in Form des Partizips II (gegenüber etw./jdm. positiv usw. eingestellt sein). Alles in allem: Der Wörterbucheintrag einstellen im Larousse-Wörterbuch – zweifellos einem der besten gegenwärtig auf dem Markt befindlichen deutsch-französischen Wörterbücher – weist mehrere Ungenauigkeiten, Verzerrungen und Fehler auf und kann damit nicht den Anspruch erheben, ein wirklichkeitsgetreues Abbild der sprachlichen Fakten zu geben. Interessant ist auch ein Blick auf die – heute von vielen Benutzern als erstes konsultierten - Online-Wörterbücher auf dem Internetportal www.leo.org. Deren Angaben sind jedoch nicht nach Unterbedeutungen gegliedert und wirken entsprechend unübersichtlich. Der hier gebotene ungeordnete Wust von Informationen ist eigentlich nur für jemanden von Nutzen, der die Zielsprache, über die er eigentlich etwas wissen will, bereits gut kennt. Für fortgeschrittene Nutzer von einem gewissen Interesse sind hier jedoch die Diskussionsforen, in denen von – mit den Angaben unzufriedenen – "Leonauten" ganz gezielt nach einzelnen Unterbedeutungen oder Verwendungsweisen gefragt wird, z. B. beim Verb einstellennach der Übersetzung von Syntagmen wie Skibindung einstellen, Lieferung einstellen, sich auf einen Schüler einstellen, im Internet einstellen, einen Rekord einstellen usw. 3 Vorschlag für einen Wörterbucheintrag des Verbs einstellenWie anderswo gilt auch hier: Kritisieren ist leicht, selber besser machen schon wesentlich schwieriger. Wenn wir nun im Lichte der empirisch gewonnenen neuen Erkenntnisse zum Verb einstellen einen Eintrag für ein Schülerwörterbuch verfassen wollten, würden wir uns auf Überlegungen verschiedener Natur abstützen.11 Die drei frequentesten Unterbedeutungen sowohl in DeReKo als auch in Europarl ('mit etwas aufhören', 'anstellen', 'sich auf etw. vorbereiten') müssen aber unseres Erachtens ihren festen Platz in einem solchen Nachschlagewerk haben, wobei man das reflexive sich einstellen aus praktischen Erwägungen am Ende aufführen könnte. Auf die Aufnahme der vierthäufigsten Unterbedeutung 'budgetieren' kann in einem solchen Nachschlagewerk verzichtet werden, weil diese von der Domäne her zu spezifisch ist. Hingegen scheint uns die Aufnahme der fünfthäufigsten Unterbedeutung 'regeln, justieren' angesichts der Bedeutung von technischen Geräten in der heutigen Welt sehr sinnvoll. Wir würden uns somit in einem Lernerwörterbuch auf die vier folgenden Unterbedeutungen beschränken, deren Semantisierung in diesem Vorschlag durch einige gezielt ausgewählte typische Kookkurrenten unterstützt wird.
4 SchlussbemerkungZusammenfassend kann man im Anschluss an diese Untersuchung festhalten, dass Parallelkorpora für die zweisprachige Valenzforschung und Lexikographie von hohem Interesse sind. Auf der Grundlage einer Handauszählung der Unterbedeutungen eines Lexems in einer Ausgangssprache lassen sich die Entsprechungen in den Vergleichssprachen quantifizieren. So können wir beispielsweise behaupten, dass für 1einstellen im Französischen ein gutes Dutzend Übersetzungsmöglichkeiten existieren, von denen eine klar dominiert (cesser) und die drei folgenden etwa gleich häufig auftreten (suspendre, mettre un terme, arrêter). Über diese reinen Größenrelationen hinaus können aber auch verlässliche Aussagen über die typischen Verwendungskontexte und Kookkurrenzpartner gemacht werden. Bei cesser beispielsweise sind die Nomina activités, violence und hostilités prominent, bei arrêter dagegen production. Zurzeit ist es allerdings immer noch so, dass die verfügbaren Parallelkorpora zu wenig umfangreich und die entsprechenden Recherchewerkzeuge zu wenig elaboriert und fein sind. Das hat zur Folge, dass die oben beschriebenen drei Teilschritte gegenwärtig noch ziemlich aufwändig sind. Es wäre wünschenswert, wenn die Analysetools – zur Vermeidung von lästigen Zwischenschritten – direkt mit den Korpora verknüpft werden könnten. Eines scheint aber schon heute klar: Die zunehmende Automatisierung von Analyseverfahren wird die Handhabbarkeit auch von sehr großen Textmengen möglich machen und damit einen wichtigen Beitrag zu der – im Zeitalter der Globalisierung dringend notwendigen – Verbesserung der einsprachigen und vor allem der zweisprachigen Wörterbücher leisten. Anmerkungen1 Vgl. auch Duffner/Näf (2006), sowie Scherer (2006). zurück 2 Das Parallelkorpus Europarl 3 ist Teil des Open Source Parallel Corpus OPUS. Europarl besteht aus Sitzungsprotokollen des Europäischen Parlaments und enthält pro Sprache ca. 60 Mio. Textwörter. Für Informationen zu Europarl 3 und OPUS siehe Tiedemann. zurück 3 Vgl. Institut für Deutsche Sprache (1999–2002). zurück 5 Natürlich könnte man mit Cosmas II auch alle Flexionsformen von einstellen suchen; allerdings ist im Parallelkorpus Europarl 3 eine solche "Lemmasuche" nicht möglich, weshalb wir uns entschlossen haben, uns auf die drei genannten Verbformen zu konzentrieren. zurück 5 Vgl. Institut für Deutsche Sprache. zurück 6 Vgl. http://www.lexically.net/wordsmith/. zurück 7 Die Analyse hat keine Kookkurrenzpartner für das frequente Syntagma mettre un terme zutage gefördert. zurück 8 Die Analyse hat keine Kookkurrenzpartner für anticiper zutage gefördert. zurück 9 In Europarl finden sich insgesamt 38 französische Belege für ein Verfahren einstellen. In den französischen Texten kommen folgende verbale Entsprechungen vor: abandonner: 6; classer: 4; annuler: 3; mettre fin: 3; suspendre: 3; interrompre: 2; mettre un terme: 2; abroger: 1; arrêter: 1; cesser: 1; retirer: 1; stopper: 1; Diverses: 10. Mit nur einem Beleg kann arrêter auf dieser Grundlage kaum als bevorzugter Kookkurrenzpartner gelten. zurück 10 In Europarl finden sich insgesamt 35 italienische Belege für ein Verfahren einstellen. In den entsprechenden Textabschnitten kommen folgende Entsprechungen vor: archiviare: 7; sospendere: 7; ritirare: 4; porre fine, interrompere, abbandonare: je 3; sechs weitere Verben zusammen: 8. zurück 11 Der Einsatz von korpuslinguistischen Methoden in der Lexikographie ist auch Gegenstand von Hass (2005). zurück LiteraturChurch, Kenneth W./Mercer, Robert L. (1993): "Introduction to the Special Issue on Computational Linguistics. Using Large Corpora". Computational Linguistics 19/1: 1–24. Duffner, Rolf/Näf, Anton (2006): "Digitale Textdatenbanken im Vergleich". Linguistik online 28: 7– 23. http://www.linguistik-online.org/28_06/duffnerNaef.html. Hass, Ulrike (ed.) (2005): Grundfragen der elektronischen Lexikographie. elexiko – das Online-Informationssystem zum deutschen Wortschatz. Tübingen. Institut für Deutsche Sprache (ed.): COSMAS II. Corpus Search, Management and Analysis System. http://www.ids-mannheim.de/cosmas2/ (Stand: September 2009). Institut für Deutsche Sprache (ed.) (1999–2002): DeReKo I. Deutsches Referenzkorpus. http://www.ids-mannheim.de/kl/projekte/korpora/ (konsultiert: August/September 2008). Kamber, Alain (2008): Funktionsverbgefüge – empirisch. Eine korpusbasierte Untersuchung zu den nominalen Prädikaten des Deutschen. Tübingen. Langenscheidt-Redaktion (ed.) (2006): Langenscheidt e-Handwörterbuch Deutsch – Englisch 5.0. Wörterbuch auf CD-ROM. Berlin/München. Langenscheidt-Redaktion (ed.) (2007): Langenscheidt e-Handwörterbuch Deutsch – Französisch 5.0. Wörterbuch auf CD-ROM. Berlin/München. Langenscheidt-Redaktion (ed.) (2003): Langenscheidt e-Handwörterbuch Deutsch – Italienisch 4.0. Wörterbuch auf CD-ROM. Berlin/München. Lemnitzer, Lothar/Zinsmeister, Heike (2006): Korpuslinguistik. Eine Einführung. Tübingen. Pierre Grappin et al. (eds.) (1999): Larousse Wörterbuch Französisch – Deutsch; Deutsch – Französisch. Paris. Scherer, Carmen (2006): Korpuslinguistik. Heidelberg. Tiedemann, Jörg: OPUS. An Open Source Parallel Corpus. http://urd.let.rug.nl/tiedeman/OPUS/index.php (konsultiert zwischen September 2008 und Februar 2009). |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Home |
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||