Korpus

Ein Korpus ist eine digitalisierte Sammlung von Textdaten, die zur computergestützten Verarbeitung natürlicher Sprache herangezogen werden. Zum Beispiel in der Maschinellen Übersetzung werden alignierte, zweisprachige Parallelkorpora als Basis für statistische Analysen und für das MT-Engine-Training verwendet.