Eine Sammlung von Elementen mit Distributionsidiosynkrasien
(Collection of Distributionally Idiosyncratic Items, CoDII)
CoDII wurde großzügig gefördert von der Deutschen
Forschungsgemeinschaft (2002 – 2008)
und der Landesstiftung
Baden-Württemberg (2007 – 2009).
Zweck und Aufbau von CoDII
Die Collection of Distributionally Idiosyncratic Items (CoDII) ist eine freie linguistische Online-Ressource, in der
lexikalische Elemente mit besonderem Distributionsprofil dokumentiert
werden.
CoDII durchlief die folgenden Entwicklungsschritte:
- 2002 – 2004: Im Projekt A5
Distributionsidiosynkrasien: korpuslinguistische Erfassung und
grammatiktheoretische Deutung
wurde die Grundstruktur entwickelt und die
Teilsammlung zu gebundenen Wörtern des Deutschen
(CoDII-BW.de) erstellt.
- 2004 – 2008: In der zweiten Phase des Projekt A5 wurden
die Sammlungen zu Polaritätselementen erstellt
(CoDII-NPI.de, CoDII-PPI.de, CoDII-NPI.ro)
Gleichzeitig entstand an der Universität
Göttingen die Sammlung zu gebundenen Wörtern des
Englischen (CoDII-BW.en)
- ab 2012: CoDII wurde an die Universität Frankfurt
am Main migriert.
Mitarbeiter
Die folgenden Personen haben einen Beitrag zur Konzeption und zum Aufbau von CoDII
geleistet:
Teilsammlungen von CoDII
-
CoDII-BW.de
(Sammlung unikaler Wörter des Deutschen, SuWD)
CoDII-BW.de
umfasst Informationen zu 446 unikalen Wörtern des Deutschen.
-
CoDII-BW.en (Sammlung unikaler Wörter des Englischen)
CoDII-BW.en umfasst Informationen zu 77 unikalen Wörtern des Englischen.
-
CoDII-NPI.de (Sammlung negativer Polaritätselemente des Deutschen)
CoDII-NPI.de umfasst Informationen zu 165 negativer Polaritätselemente des Deutschen.
-
CoDII-NPI.ro (Sammlung negativer Polaritätselemente des Rumänischen)
CoDII-NPI.ro umfasst Informationen zu 58 negativer Polaritätselemente des Rumänischen.
-
CoDII-PPI.de (Sammlung positiver Polaritätselemente des Deutschen)
CoDII-PPI.de umfasst Informationen zu 88 positiver Polaritätselemente des Deutschen.
Publikationen
- Frank Richter, Manfred Sailer and Beata Trawiński
(2010): The Collection of Distributionally
Idiosyncratic Items. An Interface between Data and
Theory. In: Stefaniya Ptashnyk, Erla Hallsteinsdóttir,
Noah Bubenhofer (eds): Corpora, Web and
Databases. Computer-Based Methods in Modern
Phraseology and Lexicography. Schneider,
Hohengehren. pp. 247-261.
- Jan-Philipp Soehn, Mingya Liu, Beata Trawinski and Gianina Iordachioaia (To appear).
Positive und Negative Polaritätselemente als lexikalische Einheiten mit Distributionsidiosynkrasien. In
Proceedings of the Europhras 2008.
- Beata Trawinski, Manfred Sailer, Jan-Philipp Soehn, Lothar Lemnitzer and Frank Richter (2008).
Cranberry Expressions in English and in German. In
Proceedings of the LREC Workshop Towards a Shared Task for Multiword Expressions (MWE 2008),
pp. 35-38. European Language Resources Association (ELRA): Marrakech, Morocco.
- Beata Trawinski and Jan-Philipp Soehn (2008).
A Multilingual Database of Polarity Items. In
Proceedings of the Sixth International Conference on Language Resources and Evaluation (LREC'08).
European Language Resources Association (ELRA): Marrakech, Morocco.
- Beata Trawinski, Jan-Philipp Soehn, Manfred Sailer and Frank Richter (2008).
A Multilingual Electronic Database of Distributionally Idiosyncratic Items.
In Elisenda Bernal and Janet DeCesaris (Eds.),
Proceedings of the XIII Euralex International Congress,
Series: Activitats, Volume 20, pp. 1445-1451. Universitat Pompeu Fabra: Barcelona, Spain.
- Manfred Sailer and Beata Trawinski (2006).
Die Sammlung unikaler Wörter des Deutschen. Aufbauprinzipien und erste Auswertungsergebnisse
[The Collection of German Bound Words. Design Principles and First Evaluation].
In Annelies Häcki Buhofer and Harald Burger (Eds.), Phraseology in Motion I. Methoden und Kritik. Akten der Internationalen Tagung zur Phraseologie (Basel, 2004),
Series: Phraseologie und Parämiologie, Volume 19, pp. 439-450. Hohengehren: Schneider Verlag.
- Manfred Sailer and Beata Trawinski
(2006). The Collection of Distributionally Idiosyncratic
Items: A Multilingual Resource for
Linguistic Research. In
Proceedings of the
5th International Conference on Language Resources and Evaluation, LREC 2006,
pp. 471-474. Genoa, Italy.
Präsentationen
- 18. - 21. September 2012
Frank Richter, Manfred Sailer, Beata
Trawiński: Ein Forschungsportal an der Grammatik-Lexikon-Schnittstelle. Auf der
Jahrestagung der Gesellschaft für Angewandte
Linguistik, Erlangen.
- August 13 - 16, 2008
Jan-Philipp Soehn, Mingya Liu, Beata Trawinski and Gianina Iordachioaia:
Positive und Negative Polaritätselemente als lexikalische Einheiten mit Distributionsidiosynkrasien.
Talk given at Europhras 2008,
Helsinki, Finland.
- Juli 15 - 19, 2008
Beata Trawinski, Jan-Philipp Soehn, Manfred Sailer and Frank Richter:
A Multilingual Electronic Database of Distributionally Idiosyncratic Items.
Poster presented at the XIII Euralex Internacional Congress,
Barcelona, Spain.
- May 1, 2008
Beata Trawinski, Manfred Sailer, Jan-Philipp Soehn, Lothar Lemnitzer and Frank Richter:
Cranberry Expressions in English and in German.
Talk given at the LREC
Workshop Towards a Shared
Task for Multiword Expressions (MWE 2008),
Marrakech, Morocco.
- May 28-30, 2008
Beata Trawinski and Jan-Philipp Soehn:
A Multilingual Database of Polarity Items.
Poster presented at the Sixth International Conference on Language Resources and Evaluation (LREC'08), Marrakech, Morocco.
- December 15, 2007
Mingya Liu, Frank Richter, Jan- Philipp Soehn and Beata Trawinski:
Distributionsidiosynkrasien in der Logischen Form.
Project report presented at the SFB-Tag, Tübingen, German.
- April 11-13, 2007
Beata Trawinski, Jan-Philipp Soehn and Frank Richter:
Modeling Distributionally Idiosyncratic Items in XML.
Poster presented at GLDV Conference 2007 (Biannual Conference of the Society for Computational Linguistics and Language Technology), Tübingen, Germany.
- March 08-10, 2007
Frank Richter, Jan-Philipp Soehn and Beata Trawinski:
Spotting, Collecting and Documenting NPIs.
Talk given at the Workshop on Negation and Polarity, Tübingen, Germany.
- October 5-7, 2006
Manfred Sailer: Modeling the Lexis-Grammar Interface in a Competence-Based Framework: The Case of Bound Words. Presentation at Exploring the
Lexis-Grammar Interface (ELeGI 2006), Hannover, Germany.
- May 22-28, 2006
Manfred Sailer and Beata Trawinski:
The Collection of Distributionally Idiosyncratic Items: A Multilingual Resource for Linguistic Research.
Talk given at the
5th International Conference on Language Resources and Evaluation, LREC 2006, Genoa, Italy.
- December 20, 2004
Beata Trawinski: The Collection of Distributionally Idiosyncratic Items.
Invited talk given at the Institute of Computer Science at the
Polish Academy of Sciences in Warsaw, Poland.
- August 26-29, 2004
Manfred Sailer and Beata Trawinski:
Die Sammlung unikaler Wörter des Deutschen.
Aufbauprinzipien und erste Auswertungsergebnisse [The Collection of German Bound Words.
Design Principles and First Evaluation].
Talk given at EUROPHRAS 2004: Europäische Gesellschaft für Phraseologie
at the University of Basel, Switzerland.