Ged (Gestione Elettronica dei Documenti) Schema ged ascent->siaweb



Scaricare 445 b.
02.06.2018
Dimensione del file445 b.


Università degli studi “Roma TRE” Dipartimento di Informatica e Automazione Corso di Laurea in Ingegneria Informatica Tesi di Laurea Prototipo per l’acquisizione e la manipolazione avanzata delle immagini


GED (Gestione Elettronica dei Documenti)

  • Schema GED

  • ASCENT->SIAWEB

  • Prototipo di Scansione

  • Interfacciamento allo scanner

  • Acquisizione Ottica

  • Velocità operativa

  • Operazioni On-The-Fly

  • Operazioni Automatizzate

  • Esempio della struttura di parametri: formato PNG

  • Dimostrazione

  • Conclusioni



Da ASCENT a SIAWEB

  • Sistema GED gestito da un prodotto preesistente: ASCENT della Kofax, ma:

    • alti costi di licenza per l'update del prodotto che in caso contrario non garantisce più il supporto;
    • molti moduli di questo sistema sono obsoleti;
    • compatibile solamente con sistemi di matrice Microsoft
    • non c'è una gestione centralizzata del sistema UOT che è gestito di caso in caso da ogni sede territoriale:
      • quando vi è una richiesta di un documento specifico da parte del cliente questo deve per forza passare per la sede centrale che ha i contatti con tutti i clienti
  • La scelta manageriale:

    • investire nello sviluppo di un prodotto software proprio, SIAWEB®, che aggiunga le funzionalità mancanti e soprattutto gestisca il sistema UOT su web.
    • In termini semplici: il cliente può ottenere tutte le copie di tutti i documenti richiesti direttamente collegandosi ai server SIA


Modulo di scansione

  • Svantaggi del modulo offerto da ASCENT:

    • Non portabile su sistemi UNIX
    • Gestisce pochi formati di immagine
  • Esigenza di testing:

  • Formati:

    • JPEG, GIF, PNG, PNM, BMP, ma soprattutto TIFF
  • Altri Requisiti:

    • Scrittura su file system di circa 100 pp/min
    • Visualizzazione simultanea
    • Controllo della scansione via software
    • Compatibilità con sistemi UNIX


Interfacciamento allo scanner

  • Standard TWAIN:

    • Standard di riferimento per Win32
    • Totale astrazione di periferiche sorgenti (Source): (Scanner, foto-camere, webcam, database di immagini)
    • Facile integrazione in tutti tipi di applicativi (Word Processor, Web, foto – video editing)
    • Standard per i driver
    • Sempre supportato dai produttori – interfaccia integrata.
  • Standard SANE:

    • Standard pensato per la compatibilità con sistemi UNIX (Linux, freeBSD, Solaris, HPUX, Mac OS)
    • Basato su 6566/TCP
    • Funzionamento ben diffente dal TWAIN basato su librerie dinamiche non sempre implementabili chiamate backend
    • Periferiche sorgenti compatibili in numero limitato
    • Interfacce unificate (frontend)


Astrazione del processo di acquisizione

  • Librerie

    • JTwain – JSane
    • Morena
  • g.p.s. gestore delle periferiche sorgenti

  • Interfaccia GUI

    • TWAIN univoca per ogni p.s.
    • SANE un backend
  • Possibilità di ADF: Automatic Document Feeding

  • Gestione dei Thread thread di scansione separato



Velocità operativa: Tempo di acquisizione

  • Scrittura delle immagini - JAI (Java Advanced Imaging)

    • Scrittura più lenta di 100 pp/min
  • Devo scendere di livello e quindi distinguere i vari tipi di scrittura a basso livello

  • Definisco una serie operazioni On-The-Fly:

    • Bufferizzazione
    • Scalamento rapido (senza interpolazione) per la visualizzazione
    • … ma anche inversione dei colori
  • Divido il processo a tempo di acquisizione:

    • Immagini bilivello (0,1) – TIFF con algoritmi CCITT (GROUP3_1D, GROUP3_2D, GROUP4)
    • Immagini non bilivello – PNG, PNM, BMP, JPEG, GIF
    • Perché: non si può codificare con algoritmi bilivello una immagine non bilivello
  • Problema: le immagini generate dagli scanner rotativi sono solamente non bilivello



Operazioni On-The-Fly (nel ciclo ADF)

  • Bufferizzazione: immagine messa in memoria come un buffer di dati

    • Diversi tipi di bufferizzazione:
      • Binario a Byte
      • Scala di Grigi a Byte
      • Colore a Byte
      • Colore Pieno a Int
    • Possibilità di avere facilmente i rasters di una immagine
  • Per la codifica di immagini bilivello bisogna prima binarizzare l’immagine. Ci sono diversi metodi:

    • Trasformata lineare che combina le 4 bande di colore di una immagine bilivello.
      • Operazione lenta
      • troppo dipendente dalla risoluzione dell’immagine acquisita
    • Sfrutto la struttura del file TIFF
      • IFD (Image File Directory) chiedo al codificatore di scrivere determinati TAG nell’intestazione di ogni file
  • Una volta ottenuta una immagine bilivello, questa ha i colori invertiti!

    • Modificare il tag IFD dell’interpretazione fotometrica (Black-Is-Zero White-Is-Zero) ? È un tag per di lettura per la sola decodifica
    • La mia immagine in buffer è di tipo binario a Byte:
      • Eseguo su ogni Byte l’operazione di complemento a uno (in Java “~”)


Operazioni automatizzate

  • Seleziono un set di immagini qualsiasi con formato: TIFF, JPEG, PNM, PNG, GIF, BMP (immagine sorgente)

  • Applico il DataFlow per ogni immagine

  • Altre operazioni su set di file: Cropping, Scale, Rotate (con adeguate interpolazioni)



Esempio di Struttura: formato PNG



Dimostrazione



Conclusioni

  • Sviluppi futuri:

    • Scrittura diretta PDF
    • Barcode
    • Cropping intelligente software
    • Disegno automatizzato
  • Ulteriori informazioni:

    • http://converter.altervista.org






©astratto.info 2017
invia messaggio

    Pagina principale