Wissenschaftler am europäischen Forschungszentrum der Xerox Corporation haben das erste System entwickelt, mit dem sich generische Bilder erkennen und kategorisieren lassen. Das könnte in Zukunft die Suche nach und die Verwaltung von digitalen Bildern online wie offline deutlich vereinfachen.
Wie die Xerox Corporation in einer Meldung vom 16.11.2004 mitteilt, haben Wissenschaftler am europäischen Xerox-Forschungszentrum ein neuartiges System entwickelt, mit dem sich generische, alltägliche Objekt, wie etwa ein Auto, in digitalen Bildern erkennen lassen und kategorisieren lassen.
Während Suche und Kategorisierung bislang einzig textbasiert erfolgen, kann das neue System das auf Bilder ausweiten und das wiederum ermöglicht eine effizientere Speicherung und Verwaltung digitaler Aufnahmen. Webbasierte Suchanfragen etwa, die bislang allein textbasiert erfolgen, könnten signifikant ausgeweitet werden.
Die Wissenschaftler bei Xerox entwickelten dazu eine Technik zur Bilderkennung, mit der es möglich wird, alltägliche Bildinhalte wie Gebäude, Tiere, Flugzeuge, Bücher und Gesichter zu kategorisieren. Nach ihren Aussagen ist es die erste Technologie zur Bilderkennung, die stabil, schnell und einfach anzuwenden ist.
Dem Prinzip nach funktioniert die Bilderkennung wie eine Textkategorisierung. Während letztere nach Schlüsselworten sucht, sucht die Xerox-Technologie nach den Schlüsselelementen eines Bildes; patch (Flicken) genannt. Ein Computer wird nun so vom System trainiert, dass er lernt, diese Bildstückchen zu erfassen und zu klassifizieren. Durch die Klassifizierung kann das Bild dann einer oder mehreren Kategorien zugeordnet werden.
Dabei mussten die Wissenschaftler ein paar knifflige Probleme lösen. So konnten frühe Versionen des Systems ein Bild mit Autoreifen nicht von dem Bild eines Autos unterscheiden, da sie gleichartige Bildelemente enthalten. Nun ermittelt das Programm die Schlüsselelemente im Kontext mit anderen Bildbereichen. So wird der Reifenstapel jetzt nicht mehr mit dem Auto verwechselt, da jetzt auch andere Schlüsselelemente wie Scheinwerfer und Autofenster in die Bilderkennung einfließen.
Xerox will die neue Technologie in Zukunft in das hauseigenen Dokumentmanagementsystem einbauen, will die Technik aber auch weiter verbessern, etwa, um auch solche Objekte sicher identifizieren zu können, die nur einen kleinen Teil des Bildes ausmachen.
Siehe dazu auch www.xerox.com/innovation. (thoMas)