El uso de la Inteligencia Artificial no es un almuerzo gratis
En estos tiempos en que los titulares de los medios citan con frecuencia la Inteligencia Artificial, sus usos, potencialidades y peligros, en más de un foro nos preguntamos y nos respondemos sobre el uso que la administración tributaria puede dar a esas tecnologías para cumplir mejor su misión, tanto para facilitar el cumplimiento como para ejercer con eficacia el control. No nos referimos aquí a la Inteligencia Artificial generativa, aquella de la que, como diría Sabina, hoy hablan los papeles, sino a la más «normalita», la que busca resolver problemas de clasificación y regresión, basada en cosas como aprendizaje de máquinas y redes neuronales. Esto es, para ilustrar, como la que en una librería de fotos puede encontrar aquellas fotos en las que aparecen gatos y descartar aquellas en que no aparecen aunque de vez en cuando falle y nos presente una liebre. En la administración hay un universo muy grande de situaciones que pueden ser clasificadas como «de interés»; contribuyentes olvidadizos, aquellos que se olvidan de declarar algunas cosas; contribuyentes actores, aquellos que simulan operaciones o hacen uso de documentos sobre operaciones simuladas; contribuyentes erráticos, aquellos que reportan cosas que en realidad son errores involuntarios (y de los otros); o en la mayoría de los casos, contribuyentes confiables, aquellos que quieren cumplir con sus obligaciones y a los que tenemos que ayudarles para que sus acciones de cumplir no sean muy costosas o sus tiempo de espera no sean grandes cuando requieren una devolución o un servicio. Claro que en estos casos, el fallar en la clasificación no es tan inocuo como identificar en una foto a un gato cuando en realidad, no era otro que un perro disfrazado. En el caso de la administración un error en la clasificación puede realmente resultar, como dice el dicho, que nos pasen un gato por liebre. Hay consecuencias para la administración y para los contribuyentes.
Muchas de las aplicaciones de analítica avanzada e Inteligencia Artificial se soportan en herramientas abiertas (Python, Scikit-Learn o TensorFlow); en entornos de colaboración abiertos en GitHub donde se pueden consultar, descargar o clonar proyectos; y en el libre acceso de fuentes abiertas de datos para entrenamiento de algoritmos, como los conjuntos de imágenes catalogadas como Digi-Face M1; a las plataformas para gestionar el trabajo de individuos que colaboran etiquetando los conjuntos de entrenamiento de datos, como Label Studio; a los propios algoritmos, que permiten, que una canción nueva se escuché en la voz de alguien distinto, y quede bien, como la música de Breezer en la voz de Gallagher. El Detector de Anomalías de Factura Electrónica es una herramienta abierta construida en el marco del Centro de Analítica Avanzada del CIAT con el apoyo de varios de nuestros países miembros, en cuyo proceso trabajamos estos dos servidores, y donde Microsoft puso el esfuerzo de ingeniería.
Pero, dice otro viejo dicho, que al que quiera celeste, que le cueste. A diferencia de lo que sucede con los algoritmos para clasificar gatos, los algoritmos para los procesos específicos de la administración tributaria no están todos disponibles para bajar de alguna nube. Se requieren inversiones y no solo hablamos de los costos involucrados en la dotación de la capacidad de cómputo en centros de datos propios o en la nube. Se requiere recursos humanos para su desarrollo, entrenamiento, prueba, validación y para su constante evolución y ajuste. Todo ello debe hacerse sin comprometer la satisfacción de la cada vez más exigente demanda de las aplicaciones tradicionales. Incluso las administraciones más grandes tienen dificultades para desarrollar todo internamente y si pudieran no deberían hacerlo: se necesitarán además de los especialistas en Inteligencia Artificial, científicos de datos, auditores, economistas o abogados y compartir inteligencia. Las administraciones más pequeñas lo tendrán más difícil todavía. Sin duda se requiere el apoyo externo y la contratación de servicios para estos desarrollos puede ser inevitable. Y entonces nos surge una duda, ¿cómo se contrata? ¿cómo se ejecuta? y ¿cómo se paga? ¿Es el problema igual al de la informática tradicional o es otro diferente?
Imaginemos que se trata de desarrollar un algoritmo que clasifique una situación como un incumplimiento o no. Podríamos pensar que quien distingue gatos u operaciones de tarjeta de crédito verdaderas de las falsas podría hacerlo. Por supuesto, que como administración tributaria no queremos compartir los datos con terceros (a diferencia de las fotos de gatos) y nos gustaría que quien desarrolle lo haga sin acceder a ninguno de los datos de la administración. El problema del investigador es hacerlo mejor que lanzando una moneda al aire o consultando a nuestros expertos. Si trabaja con datos sintéticos, inventados y totalmente distantes de la realidad, puede suceder que los algoritmos, por efectivos que sean con los datos sintéticos, podrían ser totalmente inútiles al aplicarse a situaciones reales y no de aquellas reservadas para la Isla de la Fantasía. Si anonimízanos los datos nos surge inmediatamente la duda sobre si los datos anonimizados son realmente anónimos o si un tercero podría, a partir de ellos identificar actores, o algunos de ellos.
Luego, viene el tema de la calidad, como en el de las pruebas del cáncer. ¿Debemos pedir para que nos sirva un 60% de aciertos o debemos exigir más? ¿A qué le llamamos acierto? Es lo mismo un algoritmo que tenga un 1% de falsos negativos (un operador fraudulento que solicita una devolución sea clasificado como confiable) que 1% de falsos positivos (un operador confiable que solicita una devolución sea clasificado como fraudulento). ¿Qué es más grave que le diagnostiquen a alguien cáncer con el precio de un susto o una operación innecesaria o que no lo detecten y se le deje ir sin tratamiento?¿Cuánto cuesta en recursos humanos y de máquina hacer cada prueba?
Pero incluso si se asegura la privacidad y si los algoritmos parecen buenos con los casos de prueba (pocos y de años pasados) siempre tenemos la duda de qué pasará en realidad porque puede suceder que la realidad haya cambiado. Los sistemas de Inteligencia Artificial hoy aprenden “jugando contra sí mismos”, por ejemplo, al ajedrez o al Go, pero las Inteligencias Artificiales tributarias aprenden de las inspecciones a los contribuyentes, a los que la Inspección les cuesta recursos e intranquilidad.
Un contribuyente tiene derecho a decidir si quien le contesta es una Inteligencia Artificial o una persona. Tiene derecho a saber el sistema que le asiste, por ejemplo, debe saber si la Inteligencia Artificial que le médica es especializada o si por ahorrar se está aplicando una de uso veterinario y debe tener el derecho saber si se le inspecciona porque existen motivos fundados bastantes o si lo es porque la Administración tiene a su Inteligencia Artificial en el “colegio de las Inteligencias Artificiales” aprendiendo y que le clasifican como a los gatos.
Las Inteligencias Artificiales que seleccionen contribuyentes no deben tener sesgos. Es bien conocido el caso de Países Bajos, donde su uso fue reprochado por el uso, no intencionado, de ciertas variables en la selección de contribuyentes, que condujo a que fueran, en proporción, seleccionados más de ciertos barrios y con ello de ciertas comunidades que de otras. ¿Cómo vamos a entrenar a nuestras Inteligencias Artificiales? ¿Con datos y criterios del pasado y que caiga quien caiga (estrategia que género el problema mencionado en Países Bajos) o con nuevos criterios? Si son nuevos los criterios ¿Quién paga el experimento? ¿Los contribuyentes que la máquina selecciona jugando contra si misma?
Resolver esto es difícil ¿Tienen recursos las administraciones tributarias para hacer en esta materia Investigación y Desarrollo, o es mejor esperar a que maduren?
De nuestra parte, conversando entre nosotros, pensamos que lo mejor que se puede hacer por ahora, es involucrar a los expertos de fuera de la administración como parte de equipos de desarrollo comandados por alguien la administración. Los recursos externos puedan ser sustituidos por otros cuando no «den la talla». Hay que asegurar que el conocimiento se quede en casa y que el uso de recursos humanos, financieros y de procesamiento sean razonables y significativamente menores que los beneficios que se obtengan de su aplicación.
Dicho en otras palabras, puestos a domar a la fiera de la Inteligencia Artificial para su uso tributario, lo mejor que se puede hacer es que las fieras sean de fuera (hay muchas y baratas) y el domador de dentro. Y que la fiera sea de nuestro tamaño.
Saludos y suerte.
10,718 total views, 6 views today
8 comentarios
Excelente articulo, hay que mitigar el riesgo de abusos sobre costos para el contribuyente y sobretodo de perder legitimidad como AT
Los avances en la intelegencia artificial cada vez son mejores y cambian igual con el tiempo. Talvez, para este caso, la competencia ayude a desarrollar cada vez mejores herramientas como es el caso de Chat GPT y Google Bard. En relación a la administración tributaria, creo que las pruebas se deben hacer en países donde hay personas que evaden impuestos o en paraisos fiscales, para que la IA lo entienda en base a esas prácticas y exista un control en los paises que no se evade impuestos o al menos se trata de no evadir…
Muy buen artículo para analizar, gracias por copartirlo Raúl, saludos.
Excelente articulo, sería interesante aplicar IA para detectar planificaciones fiscales agresivas, así como se observa con la factura electrónica identificar los esquemas del fraude carrusel.
Hola Raúl … interesante y aterrizado artículo.
Pienso que debemos evitar que la IA deshumanice y desnaturalice las AT. En mi opinión la “fiera” es la IA y el reto de domarla debe ser siempre el mismo, centrado en el método y la estrategia de fortalecimiento y modernización de las AT y que tenga al contribuyente como eje central y objetivo primario de sus formas de control, identificado como “gato” y no como conejillo de Indias.
Y los equipos que trabajen en los desarrollos de aplicativos y nuevos sistemas deben estar conformados como de costumbre …. Equipos interdisciplinarios, con “expertos” externos, técnicos en sistemas y líderes conocedores de la tributación (Administradores Tributarios), para que tanto el qué como el « cómo », el Know how , la experiencia y el conocimiento “se queden en casa”.
Se me quedan muchas dudas e inquietudes en el tintero y voy a sacar un tiempo para escribir algunas ideas.
Un abrazo
Muy interesante artículo, que pone en un contexto práctico las perspectivas del uso de técnicas de IA en AATT, considerando variables que en ocasiones son ignoradas.
Organizaciones como el Centro de Analítica Avanzada del CIAT pueden concentrar esfuerzos en la elaboración de estudios y evaluaciones, para luego difundirlos entre las AATT.
OCDE, BID, etc. pueden financiar y difundir experiencias propias o realizadas por países con mayor disponibilidad de recursos.
La estrategia actual, propuesta al final del artículo, es bastante sensata, considerando la situación del momento. Tenemos que estar atentos a la evolución de tema, ya que pueden surgir alternativas interesantes para las AATT.
Pude leer el trabajo. Me pareció excelente su contenido donde presentas con mucha claridad y sencilles
la realidad del tema de referencia. Siempre aparece tu sesgo literario que te caracteriza y distingue, lo cual
permite que hasta los menos entendidos puedan visualizar el tema. Creo que en estos términos es que debe
encararse el mismo.
Ciertamente que el gran problema de la tributación (Política Tributaria y Administración) siempre ha tenido como común
denominador la «realidad económica» de los hechos, dado que es sobre esa realidad es que se diseñan y aplican los impuestos y por consiguiente se debe interpretar y en consecuencia la Administración cumplir sus diferentes cometidos utilizando los adelantos tecnológicos adecuados.
El problema es que esa realidad comprendida en la descripción legislativa de los hechos gravados, generalmente no siempre coincide con el ropaje jurídico (forma jurídica) con el cual se viste la operación económica, ya sea porque (entre otros) se pretende simular la operativa o por errores voluntarios o involuntarios.
Felicitaciones.
Excelente tematica, poniendo un tema de actualidad que se puede aplicar a las AT, perfilar, inferir, detectar , ese el uso de las IA y serviria mucho en el control tributario, y tambien en el fomento de la cultura tributaria, para contribuyentes que inician sus actividades, seria como tener un asesor virtual permanente
Excelente artículo. Muchas gracias, Raúl e Ignacio.
Saludos.