Juan Huguet García és cofundador i CEO d’anyformat. Doctor en Física Experimental per la Universitat Pierre i Marie Curie de París, ha combinat una sòlida formació científica amb una extensa trajectòria en intel·ligència artificial i ciència de dades. Ha treballat com a científic de dades a empreses com IBM, Clarity AI i Latency, on ha liderat projectes complexos d’IA en àrees com el processament de llenguatge natural, l’aprenentatge automàtic i l’extracció d’informació no estructurada.
Ha estat professor a la Universitat de les Illes Balears, on va impartir ciència de dades i infraestructura a estudiants de màster. Durant la seva carrera investigadora, va rebre el Graduate Student Award de l’E-MRS (European Materials Research Society) pel seu treball en nanomaterials.
Ara, com a emprenedor a anyformat, canalitza tota aquesta experiència per crear una infraestructura d’IA que escala sense esforç i s’adapta a casos d’ús reals. La seva missió és convertir documents en informació accionable, permetent a les empreses desbloquejar tot el potencial de les seves dades amb la intel·ligència d’un humà, la velocitat d’una màquina i la seguretat que exigeix la regulació actual
1. Com va sorgir la idea de crear una eina per estructurar dades procedents de qualsevol format d’arxiu?
La idea va néixer de la meva experiència durant la carrera com a enginyer d’IA, on vaig viure de primera mà la frustració que suposa per a les empreses tenir muntanyes d’informació valuosa atrapada dins documents que no poden processar de manera eficient.
Durant la meva etapa com a científic de dades, vaig veure com equips altament qualificats perdien hores i hores fent feina manual d’extracció de dades de PDF, contractes, factures… Era absurd. Teníem la tecnologia per enviar coets a l’espai, però les empreses encara depenien de persones copiant i enganxant dades d’un document a un Excel.
Amb l’explosió de la IA generativa, vaig veure que finalment teníem les eines per resoldre aquest problema de manera elegant. Juntament amb el meu cofundador Diego Pérez-Sastre, que compartia aquesta visió, vam decidir crear anyformat amb un objectiu clar: que qualsevol organització pugui entendre els seus documents amb la intel·ligència d’un humà, la velocitat d’una màquina i la seguretat que exigeix la regulació actual.
2. A les FAQ de la vostra web s’explica que podeu treballar amb més de cent formats, entre ells PDF, Word, Excel, PowerPoint, HTML, Markdown, XML i JSON. També amb imatges, vídeos, àudios, dibuixos i plànols?
Efectivament, la nostra plataforma pot processar una àmplia varietat de formats perquè entenem que la realitat de les empreses és diversa. Els documents no vénen en un sol format: un mateix projecte pot incloure contractes en PDF, pressupostos en Excel, correus electrònics, imatges de productes…
Els formats més habituals amb els quals treballem són els documents ofimàtics (PDF, Word, Excel, PowerPoint), però també processem imatges per extreure text i dades visuals, arxius de dades estructurades com JSON, XML o CSV, i formats especialitzats segons el sector del client.
El més important no és tant la quantitat de formats, sinó la qualitat de l’extracció. La nostra tecnologia d’OCR agèntic permet entendre el context i l’estructura dels documents, no només llegir caràcters. Això significa que podem extreure informació d’un fitxer escanejat amb la mateixa precisió que d’un PDF natiu digital.
3. La idea és que una persona que no sàpiga programar pugui estructurar dades, automatitzar processos i analitzar patrons? Quina estructura mental ha de tenir aquesta persona per crear una base o esquema d’estructura de dades correcte i útil?
Exactament. Un dels principis fundacionals d’anyformat és fer fàcil l’automatització amb IA. No té sentit que només els enginyers puguin treballar amb aquestes tecnologies quan els que millor coneixen el negoci són els equips operatius.
Pel que fa a l’estructura mental necessària, no es tracta de pensar com un programador, sinó de tenir claredat sobre dues coses. Primera: què necessito saber? Quines són les preguntes que vull respondre amb aquestes dades? Per exemple, vull saber quins clients tenen contractes que vencen els propers tres mesos, o necessito comparar els preus de tots els proveïdors per a un mateix producte. Segona: on es troba aquesta informació? En quins documents, en quina part del document (capçalera, taules, cos del text…).
El concepte que fem servir és el d’esquema de dades o plantilla d’extracció. L’usuari defineix quins camps vol extreure (nom del client, data, import) i la nostra IA s’encarrega de trobar i extreure aquesta informació de cada document. És com ensenyar a un assistent molt intel·ligent què ha de buscar, sense haver d’explicar-li com fer-ho tècnicament.
La clau és començar simple i iterar. Recomanem als nostres clients que comencin amb un cas d’ús concret, validin els resultats i després expandeixin.
4. En un article on us mencionaven es parlava de l’efecte del Diògenes Digital, referint-se a l’excés d’informació que tenim en els nostres dispositius i que guarden les empreses per si de cas. S’ha de guardar tota la informació? Té algun consell per ordenar la informació que generem, tenint en compte que dins una empresa hi treballa gent diversa on cadascú té un esquema mental propi de classificació? I sobre les versions dels arxius, quina opinió té?
El Diògenes Digital és una analogia molt encertada. Les empreses acumulen terabytes d’informació per si de cas, però la paradoxa és que com més dades guardes sense estructura, menys útils són. És com tenir un magatzem ple de caixes sense etiquetar: tècnicament ho tens tot, però pràcticament no trobes res.
El meu consell és aplicar el principi de valor per accés: no guardis informació, guarda coneixement accessible. Això implica, en primer lloc, definir una taxonomia compartida. Abans de parlar d’eines, l’empresa necessita acordar com classifica la informació. No cal que sigui perfecta, però sí consistent. Un contracte ha de dir-se contracte per a tothom, no acord per a uns i conveni per a altres.
En segon lloc, automatitzar l’etiquetatge. Aquí és on entra tecnologia com la nostra. En lloc de dependre que cada persona classifiqui manualment (cosa que no farà o farà malament), deixem que la IA identifiqui i etiqueti automàticament.
Sobre les versions, és crític tenir un sistema de control de versions, especialment per a documents que evolucionen com contractes, polítiques o procediments. El meu consell és adoptar eines que gestionin això automàticament i mai confiar en el clàssic document_v2_final_DEFINITIU_v3.docx.
Finalment, cal una política de retenció. No tot s’ha de guardar per sempre. Cal definir quant temps es conserva cada tipus de document segons requisits legals i valor de negoci, i automatitzar l’arxivat i l’eliminació.
5. Quan una empresa es planteja incorporar intel·ligència artificial amb automatitzacions en els seus processos (més enllà de fer-la servir per generar redaccions per xarxes socials, preparar textos per respondre correus electrònics, incorporar un xatbot a la seva pàgina web, tenir un assistent per acompanyar en la programació o traduir textos), quins passos ha de tenir en compte? I què pot ser crític perquè l’adopció de la intel·ligència artificial es faci de manera metòdica i ordenada, ensenyant a les persones de cada departament com utilitzar-la en cada cas i a compartir dades amb una governança comuna?
Aquesta és una pregunta clau. La majoria d’empreses comencen amb el que jo anomeno la IA fàcil: generació de textos, xatbots genèrics, assistents de traducció… Està bé com a primer pas, però el veritable valor transformador apareix quan apliques la intel·ligència artificial als processos core del negoci, allà on realment es juga la partida.
El primer que recomano és identificar processos d’alt impacte i alta fricció. Busca aquelles tasques que consumeixen molt de temps, que són repetitives i que tenen valor estratègic. El processament documental sol ser un candidat perfecte perquè toca transversalment moltes àrees (finances, legal, operacions, compliance…) i és on la IA pot generar un retorn immediat i visible.
Un cop identificat el procés, el segon consell és començar amb un pilot acotat. No intentis transformar tota l’empresa de cop. Tria un departament, un tipus de document, un flux concret. Demostra valor amb resultats tangibles, aprèn del que funciona i del que no, i després escala. Les transformacions massa ambicioses des del principi solen morir d’inanició abans de donar fruits.
I aquí ve un punt que molts obliden: involucra els usuaris finals des del primer dia. La tecnologia més avançada del món fracassa si les persones que l’han d’utilitzar no hi confien o no entenen com funciona. Fes-los partícips del disseny, escolta les seves preocupacions, incorpora el seu feedback. Són ells qui faran que el projecte visqui o mori en el dia a dia.
Pel que fa a l’adopció metòdica i la governança, hi ha elements que considero crítics. El primer és l’esponsorització executiva. Sense el suport clar de la direcció, els projectes d’IA acaben morint de política interna o de falta de recursos. Cal algú amb autoritat que empari el projecte i li doni prioritat.
També és fonamental definir clarament els rols: qui pot accedir a quines dades, qui valida els resultats que genera la IA, qui s’encarrega de mantenir i millorar els models. Sense aquesta claredat, apareixen buits de responsabilitat que acaben generant problemes.
La formació és un altre pilar. No n’hi ha prou amb un curs inicial de dues hores. Cal un acompanyament continuat i una actualització constant, perquè aquesta tecnologia evoluciona molt ràpidament. El que avui és punta de llansa, demà pot ser obsolet.
I finalment, la governança de dades. Això és absolutament fonamental. Cal establir polítiques clares sobre qualitat de dades, privacitat, seguretat i compliment normatiu (pensem en el GDPR o el nou AI Act europeu). A anyformat posem molt d’èmfasi en la sobirania de les dades precisament per això: les empreses necessiten saber que mantenen el control sobre la seva informació en tot moment.
6. Per incorporar la vostra tecnologia dins una empresa, quins són els perfils professionals que l’alimenten de dades?
La gràcia del nostre enfocament és que no requerim perfils tècnics especialitzats per alimentar el sistema. Els perfils que típicament treballen amb anyformat són equips d’operacions que gestionen factures, albarans i comandes; equips financers que treballen amb informes, extractes bancaris i pressupostos; i equips de recursos humans que gestionen CV, contractes laborals i avaluacions.
En definitiva, qualsevol professional que treballi amb documents com a part de la seva feina diària pot alimentar i beneficiar-se del sistema. No necessiten saber programar ni tenir formació tècnica especialitzada.
El que sí recomanem és tenir un champion intern, algú que entengui bé el procés de negoci i pugui definir correctament els esquemes d’extracció i validar que els resultats tenen sentit. Aquesta persona sol ser algú amb experiència en el procés, no necessàriament un tècnic.
7. I qui s’ha d’encarregar d’auditar les dades, mantenir-les netes, ordenades, actualitzades, i d’afegir noves estructures?
Aquesta responsabilitat hauria de recaure en el que anomeno el propietari de les dades o data owner de cada àrea, que no és necessàriament un tècnic sinó el responsable de negoci que millor coneix aquestes dades.
La nostra recomanació és una estructura de tres nivells. Primer, els usuaris operatius, que utilitzen el sistema diàriament, detecten i reporten anomalies, i proposen millores basades en la seva experiència. Segon, els propietaris de dades per àrea, responsables de la qualitat i coherència de les dades del seu àmbit, que validen els esquemes d’extracció, revisen mostres periòdicament i aproven canvis en les estructures. Tercer, l’equip central de dades o IT, que coordina la governança global, gestiona la infraestructura i assegura el compliment de polítiques de seguretat i privacitat.
La clau és no centralitzar tot en IT (que no coneix el negoci) ni deixar-ho tot als usuaris (que no tenen visió global). Cal un equilibri.
Pel que fa al manteniment i actualització, la nostra plataforma facilita molt aquesta tasca perquè permet iterar sobre els esquemes d’extracció sense necessitat de programar. Si apareix un nou tipus de document o canvia el format de les dades a extraure, el propietari de dades pot ajustar l’esquema directament.
8. Quan ja tenen les dades estructurades, quina és la següent passa per treure’n profit? Com ho feien abans?
Un cop les dades estan estructurades, s’obren múltiples possibilitats. Des de l’anàlisi i visualització (connectar les dades amb eines de Business Intelligence com Power BI, Tableau o Looker per crear dashboards i informes que permetin entendre patrons, tendències i anomalies) fins a l’automatització de decisions, configurant regles automàtiques basades en les dades extretes. Per exemple: si una factura supera X import i el proveïdor és nou, requereix aprovació addicional.
Com ho feien abans? Bàsicament, amb molta feina manual i amb molta informació que simplement no s’explotava. El procés típic era: una persona obre un document, llegeix, interpreta, copia les dades rellevants a un Excel o sistema, i repeteix. Això era lent, propens a errors, i feia inviable processar grans volums.
El canvi de paradigma és passar de processar documents a explotar informació. Abans, l’objectiu era tramitar el document; ara, l’objectiu és extreure coneixement que generi valor.
9. Quantes persones treballadores té l’empresa més petita que ha incorporat la seva tecnologia?
Hem treballat amb empreses de mides molt diverses. El que hem après és que la mida de l’empresa no és el factor determinant. El que importa és el volum i la complexitat dels documents que gestionen, i el valor que té per a ells automatitzar aquest procés. Una empresa petita amb un alt volum documental pot beneficiar-se tant o més que una gran corporació.
Dit això, és cert que el nostre focus comercial principal són les grans corporacions i empreses mid-market, perquè és on l’escala del problema justifica més clarament la inversió i on podem generar un impacte transformador més gran. Clients com el Grup L’Oréal Espanya o el Grup IAG són exemples d’organitzacions amb necessitats documentals complexes i d’alta demanda on la nostra tecnologia brilla especialment.
10. Ens pot dir una pel·lícula que ensenyi tecnologia amb la qual treballa i que pugui servir d’inspiració?
Recomanaria Her (2013) de Spike Jonze. Tot i que és una pel·lícula sobre relacions humanes més que sobre tecnologia empresarial, il·lustra molt bé el concepte d’intel·ligència artificial que entén el context, el llenguatge natural i les necessitats de l’usuari.
El que m’agrada d’aquesta pel·lícula és que mostra una IA que no és freda ni robòtica, sinó que s’adapta a la persona i l’ajuda a ser més productiva i a gestionar millor la seva informació (el protagonista, de fet, treballa dictant cartes que la IA transcriu i millora). És una visió humanista de la tecnologia, que és la que tenim nosaltres com a empresa.
11. Ens pot recomanar un llibre per aprendre més sobre dades i intel·ligència artificial aplicades al món dels negocis?
Per aprendre sobre intel·ligència artificial aplicada al món dels negocis, recomanaria Prediction Machines: The Simple Economics of Artificial Intelligence d’Ajay Agrawal, Joshua Gans i Avi Goldfarb. El que m’agrada d’aquest llibre és que els autors, que són economistes, expliquen la IA d’una manera molt pragmàtica: com una tecnologia que abarateix les prediccions. Aquest framework et permet pensar clarament sobre on té sentit invertir en IA i quin serà el retorn, sense perdre’t en la tecnologia.
Per a qui vulgui entendre millor la IA generativa moderna, recomanaria complementar amb el curs Generative AI for Everyone d’Andrew Ng. És accessible, sense codi, i molt enfocat a aplicacions pràctiques de negoci. Andrew Ng té un do especial per fer comprensibles fins i tot els conceptes més complexos.
I per als més curiosos que vulguin estar al dia de les últimes tendències en agents i LLM, el blog d’Anthropic és excel·lent. Publica papers i articles sobre Constitutional AI, tool use i arquitectures modernes de manera accessible. També recomanaria seguir Andrej Karpathy, perquè en aquest camp la tecnologia evoluciona tan ràpid que els llibres queden obsolets en mesos. La combinació de principis fonamentals dels llibres amb la comunitat online és el millor enfocament.
