hotnews

Ex Arte werft aan!

Klaar voor een nieuwe uitdaging in een jong dynamisch en snel groeiend bedrijf?!

Wenst u kennis te maken met onze oplossingen?

Volgende afspraak op dinsdag 5 april te Antwerpen.

Convergence 2010 Europe, 14-21 oktober

Kom kennis maken met onze oplossingen!

infocus

Onze klanten aan het woord!

Ontdek wat klanten over onze oplossing te vertellen hebben.

solutions

Document Recognition

PPM document herkenning bestaat uit twee opeenvolgende fases.
Tijdens de eerste fase worden zowel papieren als electronische documenten ‘verzameld’ en ‘voorbereid’ voor verdere verwerking (in fase 2). Dit vereist dat de document formaten herkenbaar zijn en de verschillende document media (scanner, fileserver, internet...) toegangkelijk zijn. In een tweede fase wordt de problematiek inzake lezen, identificeren en sorteren van documenten voor verdere verwerking behandeld. Het identificeren en sorteren van documenten is cruciaal voor het bepalen van het verdere document afhandelingsproces. Aan de hand hiervan kan bepaald worden of een bepaald document onmiddellijk kan gearchiveerd worden (early archiving), of het moet aangeboden worden aan een medewerker (distributie) conform een voorafbepaald proces (compliance) en/of een ‘target application’ zoals Microsoft Dynamics behoefte heeft aan bijkomende extractie van informatie voor het verwerken van het bewuste document.


Volgende mogelijkheden worden geboden inzake document formaten en media:

  • Papier: scannen en verwerken (batch handling) van stapels papier inclusief identificatie (document types) en beeldoptimalisatie (deskew, despeckle, line removal enz...)
  • Microsoft Office documenten: Word, Excel, Powerpoint
  • E-mail: e-mails en/of attachments afzonderlijk of gecombineerd
  • PDF: een de facto industriestandaard voor opmaak en universele opslag/uitwisseling van documenten
  • Remote scanning: decentraal scannen en centraal verwerken over interne bedrijsnetwerk of internet
  • Fax: verzamelen van faxen (fax server)
  • Image files: verzamelen van meest courante beeldformaten zoals TIFF, BMP, JPG, PNG enz...
  • XML: ‘parsen’ en ‘mappen’ van XML bestanden
  • Meer dan 50 courante documentformaten worden ondersteund



De belangrijkste kenmerken tijdens fase 2 zijn:

  • Geavanceerde informatie extractie voor alle document layouts
  • Gestructureerde documenten (forms). Complete informatie extractie mogelijkheden op basis van OCR (machine print), OMR (herkenning van tick boxes, handtekening, kruisjes, matrixes, enz.) en barcodes
  • Semi-gestructureerde documenten (facturen, verzendnota’s,CMR’s, enz.). Herkennen van de afzender in combinatie met zelflerende extractie waarbij het systeem memoriseert hoe het een semi- gestructureerd document dient te interpreteren en deze kennis toepast wanneer hetzelfde type document van eenzelfde afzender toekomt
  • Ongestructureerde documenten (brieven, contracten, e-mails, enz.). Extractie van de volledige inhoud van een document met optimalisatie voor full text searches en het genereren van metadata op basis van Microsoft Dynamics en/of gecapteerde gegevens.
  • Automatische validatie van gecapteerde informatie d.m.v. berekeningen en syntaxvalidatie (bv: BTW nummers, datums, PO nummers) en matching met Microsoft Dynamics ledger informatie (bv: inkoopfacturen met geboekte ontvangsten, klantenorders met verzendingen, enz..)