AutoUniConv erkennt die Zeichenkodierung von Textdaten und konvertiert sie automatisch zu Unicode. Im Gegensatz zu anderen Zeichensätzen erlaubt es Unicode, Zeichen verschiedenster Sprachen einheitlich zu kodieren. Durch die Wahl eines einheitlichen Zeichensatzes können übliche Probleme mit der Darstellung und Verarbeitung vermieden werden. Die Software unterstützt eine Vielzahl von Zeichensätzen, beispielsweise der Unicode-, ISO-, Mac-, Windows- und Code-Page-Familien. Nach der Erkennung der Kodierung wird der Text zu UTF-16 konvertiert.
Alphawandler dient zur Umschrift zwischen verschiedenen Alphabeten, vor allem vom Kyrillischen und Griechischen ins Lateinische. Die Transliteration basiert auf festgelegten Standards, beispielsweise DIN 843 oder ISO 9, und ermöglicht so eine einheitliche Umschrift.
Der Spracherkenner Sprachinspektor bestimmt neben der Sprache eines Textes zusätzlich die Zeichenkodierung. Es werden nahezu alle europäischen Sprachen, Russisch, Ukrainisch, Arabisch und Chinesisch erkannt. Die Informationen über Sprache und Zeichenkodierung gewinnen immer mehr an Bedeutung, vor allem im Umfeld der Internettechnologien, weil sie zum Beispiel eine sprachspezifische Verarbeitung und Sortierung von Daten ermöglichen.
Für Entwickler stehen neben den kostenlosen Free'n'Easy Versionen auch Software Development Kits (SDK) zur Verfügung, um die Tools in andere Programme einzubinden. Diese sind neben Windows auch für Linux, FreeBSD und NetBSD verfügbar. Jedes SDK ist eine C-Bibliothek, für die es zusätzliche Schnittstellen für Perl, PHP und Java gibt.
Die Lingua-Systems Software GmbH ist ein Softwarehaus aus dem Ruhrgebiet. Das Unternehmen entwickelt Software-Komponenten im Bereich Sprachtechnologie. Software-Hersteller verschiedenster Branchen greifen auf die Komponenten zurück, um die Verarbeitung natürlicher Sprache in Ihren Lösungen zu optimieren.