Fine anni ‘90 lessi un articolo su Gartner che riportava un sondaggio fatto agli IT manager negli USA che dichiaravano che circa il 70% degli investimenti nella loro area riguardava le integrazioni tra software ovvero attività di ETL (extraction transformation and loading), mi fece molta impressione e sul momento neanche mi venne da crederci molto.

 

Quasi un quarto di secolo e decine di progetti CRM/ERP e simili dopo sono più orientato al credere pedissequamente a questo numero. L’approccio best of breed ha spinto le aziende a cercare di dotarsi del miglior software verticale in ogni specifico settore lasciando poi le integrazioni tra i nuovi arrivati e l’ERP e gli altri legacy al reparto IT. 

 

Su queste cose hanno fatto fortuna TIBCO, IBM ed altri che hanno spinto soluzioni di message bus e code spesso fuori budget per le piccole aziende ma come sempre le novità arrivano prima su chi ha più budget e solo dopo i prezzi iniziano a scendere oppure l’open source a salire e la distribuzione diventa ampia.

 

Integrare è difficile per molti motivi, non ultimo stabilire chi è il padrone di un certo dato, condividere le tassonomie e mantenere il tutto funzionante perché flussi stabili per anni possono improvvisamente dare errori quando qualcosa nell’ecosistema cambia.

——————————————————————————————————————-

Nella nostra piattaforma Nemesys l’ETL è stato da sempre basato su descrittori XML di flussi basati su scambi file FTP, condivisioni DB o endpoint di web services. Gli xml hanno luci ed ombre: dopo che li lavori per un pò riconosci a naso dove si possono verificare i problemi e quali tag andare a toccare ma siccome obbediscono ad uno schema prefissato se ti trovi su processi complessi le cose si complicano.