Das blc Data Toolkit als Software-Küche
Was ist das blc Data Toolkit? Diese Frage lässt sich sehr technisch oder mit einer netten, humorvollen Abstraktion beantworten.
Die nerdige und etwas langweilige Antwort ist, dass das Data Toolkit ein sogenanntes „Framework“, also ein „Programmiergerüst“ ist, in dem Code auf eine strukturierte Weise gesammelt wird (vgl. Duden 2025). Unser Framework ist in der Programmiersprache „Python“ geschrieben und es ermöglicht uns, unsere Leistungen durchzuführen.
Die unterhaltsamere Antwort darauf, was das Data Toolkit eigentlich ist, ist eine Analogie…
Code à la carte – So „kochen“ wir unsere Dienstleistungen
Wenn blc ein Restaurant wäre, dann wären wir – das Computerlinguistik-Team – die Köchinnen, und das Data Toolkit unsere Küche.
Warum? Nun, in einer Restaurantküche befinden sich verschiedene Schubladen und Schränke mit den Utensilien, die benötigt werden, um die Gerichte auf der Speisekarte zuzubereiten. Das ist auch bei unserem Data Toolkit so. Darin gibt es verschiedene Sammlungen von Funktionen und Methoden, sogenannte Module, die wir verwenden, um Daten auf unterschiedliche Weise zu verarbeiten. Manche Methoden brauchen wir fast jeden Tag, so wie man ein Messer oder eine Schüssel praktisch immer zum Kochen oder Backen braucht. Andere sind Spezialanfertigungen, die wir extra für unsere Kunden anfertigen. Diese kann man sich dann vorstellen wie einen Apfelentkerner oder einen Spargeltopf. Man nutzt sie zwar selten, aber sie sparen einem viel Arbeit, wenn man sie mal braucht.
Wenn ein Kunde mit seinen Daten zu uns kommt, ist das so, als ob er uns die Zutaten bringt. Wir entscheiden dann zusammen, was wir daraus „kochen“ und sammeln die nötigen Utensilien in unserer Küche zusammen.
Das „blc-Menü“
Jetzt wo klar ist, dass das Data Toolkit nichts anderes ist als eine Menge Küchenhelfer, können wir mal einen Blick darauf werfen, was Sophia und ich mit diesen Utensilien alles zaubern können. Grundsätzlich lassen sich unsere Leistungen in drei große Blöcke aufteilen: Terminologie-, TM– und KI-bezogene Leistungen.
Unsere „Starter“
Terminologie– und Translation-Memory-Daten können wir im Rahmen einer Analyse mit unserem Toolkit unter die Lupe nehmen und Probleme, aber auch Potenziale aufzeigen. Dabei achten wir vor allem auf die Datenqualität, z. B. ob viele Duplikate enthalten sind. Eine Analyse ist ein guter Einstieg, um einen ersten Überblick zu bekommen und den Appetit anzuregen – also der perfekte „Starter“!
In herzhaft und in süß erhältlich
Sind die Probleme einmal aufgedeckt, können wir natürlich bei ihrer Behebung helfen. Dafür bedienen wir uns an den Werkzeugen in der Schublade „Term Modifikation“ bzw. „TM-Modifikation“ und verändern damit die Daten so, wie es sich der Kunde wünscht. Dabei gilt „Pick-N-Mix“: Der Kunde kann sich sein Gericht selbst zusammenstellen und jegliche Art von struktureller oder inhaltlicher Änderung an den Daten vornehmen lassen. Je nachdem, ob wir den passenden Küchenhelfer schon besitzen, um die Modifikation durchzuführen, oder nicht, kann das einfach und schnell gehen oder eben etwas länger und aufwendiger sein. Aber: Wenn das Ergebnis am Ende passt, lohnt sich der Aufwand, denn ohne Küche kommt man nur schwer an sein Traumgericht!
Lust auf was Frisches?
Ein Kunde hat noch keine oder nur sehr wenige (Terminologie-) Daten? Auch kein Problem! Wir können in den „Termextraktionsschrank“ greifen und aus domänenspezifischen Fließtexten neue Terminologie sammeln und so aufbereiten, dass dem Kunden das Wasser im Mund zusammenläuft. Auf Wunsch auch mit Auslieferung direkt ins Zielsystem.
Lecker Kuchen
Ein Kunde möchte von einem System zu einem anderen wechseln? Ob als Dessert oder einzelner Snack: Wir können die Daten mit so wenig Informationsverlust wie möglich – also ganz krümelfrei – ins neue System migrieren.
Und was darf’s zu trinken sein?
Im Bereich KI beraten und unterstützen wir gerne. Das gilt für alle Etappen vor und nach dem Trainieren des Modells. Wir können beispielsweise Trainings- und Testdatensätze aufbereiten und bei der Planung und Durchführung der Modell-Evaluation helfen. Dabei spielen Art der KI und Use Case für uns keine Rolle. Ob klassische MT, QRE, LLM oder was ganz anderes: Sprechen Sie uns an und bereiten Ihr Getränk ganz nach Wunsch zu! Sie wissen selbst nicht so recht? Im Rahmen von „Tastings“ können wir auch verschiedene KI-Modelle kosten und vergleichen.
Küchenzuruf
Ob Stern-würdiges Gericht oder gemütliche Hausmannskost – mit dem blc Data Toolkit haben wir für jeden Datenhunger das richtige Rezept. Unsere Küchenhelfer erleichtern uns den Alltag, egal ob wir feine Terminologie-Tartes zaubern, Translation-Memory-Delikatessen verfeinern oder mit KI-Cocktails experimentieren.
Und wenn mal eine ganz neue Spezialität gefragt ist? Dann tüfteln wir eben an einer neuen Kreation! Denn in unserer Küche gibt es keine Fertiggerichte – nur maßgeschneiderte, datenverarbeitende Köstlichkeiten. Bon Appétit!