La Inteligencia Artificial y TaxCore | DATA TECH INTERNATIONAL

El fraude fiscal afecta a las condiciones de mercado de las empresas de forma negativa y directa a través de la creación de una competencia desleal. En comparación con los competidores que no pagan impuestos, las empresas que funcionan de acuerdo con lo que marca la ley tienen costes más elevados, lo que conlleva precios más elevados para productos y servicios. Además, el fraude fiscal, desde la perspectiva ciudadana, repercute en la reducción de derechos humanos fundamentales (infraestructuras locales, cuidados sanitarios, pensiones…). Al mismo tiempo, el fraude en este ámbito merma la mejora del nivel y calidad de los servicios públicos, lo que repercute directamente en la insatisfacción de los ciudadanos.

La detección del fraude de los contribuyentes representa la etapa más difícil del control fiscal. Uno de los objetivos principales del control fiscal supone la vigilancia y el control de las operaciones financieras de grandes empresas o sociedades en cuanto a que estas suponen los mayores riesgos en ámbito del fraude fiscal. En comparación, el fraude fiscal de pequeñas empresas y de microempresas se realiza principalmente mediante las transacciones en efectivo sobre los ingresos y gastos. Al utilizar distintas fuentes independientes, o al comparar los datos y verificarlos con otras fuentes, la administración fiscal puede determinar las acciones malintencionadas de los contribuyentes. Asimismo, la determinación de las acciones delictivas de los contribuyentes requiere de una auditoría fiscal de campo (al azar o bajo previa solicitud), lo que resta mucho tiempo y recursos económicos a la administración fiscal (en relación con el número de inspectores y de medios materiales adicionales). El hecho de que la administración fiscal se apoye en exclusiva en la auditoría fiscal para la verificación de la conformidad fiscal representa una tarea muy complicada, y, finalmente, imposible de realizar. En este sentido, la labor de auditoría se vería facilitada por el uso de determinadas herramientas de software que permitirían determinar eventuales malversaciones, sin menoscabar por ello la relación de confianza entre la administración y los contribuyentes.

TaxCore®, como sistema de vigilancia de los contribuyentes, registra todos los elementos importantes de cada transacción financiera, lo que permite a las autoridades fiscales controlar efectivamente la recaudación de impuestos y el registro de transacciones. En esta plataforma, tanto la identidad de los contribuyentes como la protección de datos son muy intuitivas y permiten a los agentes fiscales investigar a los contribuyentes en base a diversos parámetros. Todo ello permite a los agentes del fisco localizar y utilizar información importante, hacer un seguimiento de las tendencias en la actividad del contribuyente, etc. Esta solución de software proporciona notificaciones a la administración fiscal sobre cada transacción comercial de una forma que permite el análisis de riesgos y la auditoría a distancia.

Una de las ventajas de TaxCore® es la unificación de todos los datos fiscales de todos los contribuyentes del sistema fiscal de un país. De esta manera, se forma una gran base de datos importantes a partir de la cual no solamente se generan resultados o informes significativos, sino que también se generan previsiones sobre el fraude fiscal potencial. La unificación de datos de todas las transacciones llevadas a cabo por todos los contribuyentes no se efectúa al nivel de la centralización, en el sentido del almacenamiento de datos en “un” lugar, sino que se realiza en función de la exhaustividad de las informaciones. Los datos acumulados permiten la exhaustividad, ya que al agregar la información en sí misma, junto con su importancia, se dispone de un mayor y mejor uso en los distintos análisis que se pueden llevar a cabo para determinadas previsiones a futuro.

La eficacia de la auditoría fiscal podría mejorarse aplicando un nuevo enfoque en el cual la primera etapa consistiría en la definición de parámetros de base con la ayuda del proceso de minado de datos o DATA MINING. El objetivo es desarrollar algoritmos de detección de infracciones fiscales utilizando métodos avanzados de análisis de grandes conjuntos de datos (big data) y de inteligencia artificial a través del aprendizaje automático. Los grandes conjuntos de datos son considerados como un nuevo tipo de recurso, en términos de medios comerciales, y que se utilizan para mejorar los procesos comerciales y aumentar la productividad para el siguiente período. De acuerdo con los últimos estudios publicados, se estima que, junto con el sector financiero, el sector que verá aumentar más su productividad, gracias al uso de grandes conjuntos de datos, sea el sector público, es decir, la administración del Estado1. La aplicación de métodos de aprendizaje automáticos en grandes bases de datos de la administración tributaria aportaría información de gran valor sobre el comportamiento histórico de los contribuyentes, en función de los cuales se obtendrían recomendaciones para efectuar auditorías de campo. Dejando de lado el hecho de que este efecto mejoraría la eficacia del control de campo, este enfoque también permitiría, además, constituir categorías de contribuyentes en función del riesgo que conllevan. La idea sería crear formularios basados en indicadores históricos de determinados atributos del contribuyente, según los cuales, en función del grado de correspondencia con los formularios, al contribuyente se le atribuiría un cierto nivel de riesgo.

Extracción de patrones y modelos

La extracción de patrones para modelos de escenarios posibles referentes al fraude fiscal se basaría en el comportamiento histórico de los contribuyentes que se catalogaría según ciertos atributos (definidos de antemano) y estos se apoyarían en determinados modelos de literatura (redes neuronales artificiales, redes bayesianas, regresión logarítmica…). Es necesario categorizar el nivel de riesgo del contribuyente, en, por ejemplo, débil/moderado/elevado. En función del nivel de coincidencia (probabilidad) con los escenarios de fraude fiscal definidos, el contribuyente recibiría una determinada categorización de importancia en cuanto a los niveles de riesgo. Una de las ventajas en el desarrollo de indicadores de riesgo para los contribuyentes individuales es la posibilidad de utilizar estos indicadores para clasificar a todos los contribuyentes según un nivel de riesgo definido. El aprendizaje automático se emplearía para descubrir modelos y relaciones entre los atributos útiles para identificar el comportamiento “problemático” del contribuyente. Este sería usado para seleccionar los contribuyentes sospechosos y, como tal, se haría llegar esta información a los inspectores para realizar más auditorías. El propósito de este enfoque es el aumento de la productividad de los inspectores fiscales sobre el terreno, así como la recuperación de la pérdida de recibos fiscales. En relación con el método de búsqueda manual, esta técnica de exploración de datos significa una aproximación (científica) más moderna que permitiría ahorrar recursos y evitaría juicios personales en la selección de contribuyentes “sospechosos”.

El punto de partida fundamental para determinar el fraude fiscal futuro es como saber distinguir el fraude internacional de un error accidental cometido por el contribuyente. Generalmente, el término “fraude” se refiere a cualquier incumplimiento o violación de las normas tributarias. Es por ello por lo que el fraude fiscal a menudo se equipara a las irregularidades fiscales. Sin embargo, las irregularidades fiscales incluyen todos los casos en los que el contribuyente no ha satisfecho sus obligaciones fiscales. Por otro lado, el fraude fiscal significa la intención del contribuyente de evadir la ley con el fin de evitar pagar impuestos. De esta manera, el fraude fiscal constituye un subconjunto de todas las irregularidades fiscales. El punto de partida principal para identificar el fraude fiscal consiste en distinguir las irregularidades intencionadas (fraude) de las irregularidades accidentales (error). Esta delimitación se basaría en todos los escenarios realistas de infracciones fiscales basados en datos históricos reales, siendo el indicador fundamental de estos la distinción entre la intención y la coincidencia – este indicador sería la frecuencia en los casos de infracción.

Se espera un gran número de anomalías en la exploración de datos. Se deben distinguir las anomalías de alto riesgo de las anomalías de bajo riesgo. Las anomalías previsibles no deben tenerse más en cuenta. El conocimiento del sistema fiscal, precisamente mediante TaxCore®, permitirá separar las anomalías normales y esperadas de aquellas que podrían ser calificadas como fraude fiscal en potencia.

La primera instancia es la clasificación de datos que tenemos en función de la exactitud de los datos en sí mismos (importes negativos, campos vacíos, formatos, valores duplicados, valores desiguales…). La precisión del modelo depende de la exactitud de los datos de entrada. La exactitud de los datos de entrada depende, en gran medida, de la precisión de su entrada. Lo que nos lleva de vuelta al principio, a saber, que la exactitud de las informaciones de entrada es responsabilidad del contribuyente, que es quien utiliza componentes para emitir facturas conforme a las especificaciones técnicas. Al elegir un modelo, es necesario considerar si el algoritmo implementado puede ser ejecutado a tiempo real.

El desafío radica en la definición de las condiciones iniciales y en los atributos, sobre la base de los cuales se formarían los escenarios de comportamiento del riesgo de los contribuyentes. Es conveniente definir modelos de comportamiento malicioso, es decir, definir normas conforme a ciertos fraudes conocidos o hipotéticos. Si no disponemos de opiniones de expertos, debemos construir datos sintéticos nosotros mismos, lo que a su vez constituyen transacciones legales e ilegales. Al interpretar los datos existentes, sus interrelaciones, su intersección y la aplicación de un modelo a esos datos, se debería llegar al objetivo final: si la transacción de este contribuyente se puede interpretar con cierta precisión como fraude. Asimismo, resulta algo positivo aplicar diferentes métodos de aprendizaje automáticos (K-Nearest Neighbors, Decision Tree Classifier, Artificial Neural Networks, Logistic Regression…) para determinar cómo ese método gestiona los datos de entrada y la precisión de los resultados obtenidos. Si los resultados obtenidos fueran transmitidos a la administración tributaria, que sería quien determinaría la exactitud del cálculo realizando una visita de campo, ese hecho proporcionaría la confirmación de la corrección o incorrección del método, lo que podría considerarse como la única confirmación válida del mismo. En este sentido, la elección del método determinaría los resultados más precisos.

Si existen datos históricos reales comprobados sobre el fraude fiscal, la detección de eventuales futuros contribuyentes que cometerían fraude fiscal se determinaría empleando métodos supervisados. La aplicación del modelo iría en la dirección de una búsqueda en la base de datos de transacciones de todos los contribuyentes, lo que permitiría identificar a los contribuyentes que presenten características (comportamientos) similares a aquellos contribuyentes en los que su fraude fiscal está probado. Si no se dispusiera de conocimientos o de información referente al fraude fiscal existente, la búsqueda de datos se efectuaría mediante métodos de aprendizaje automáticos sin supervisión, aunque estos tuviesen un nivel de precisión y de interpretación inferiores a aquellos de los métodos supervisados. Con el método sin supervisión, de forma contraria al método supervisado, no solamente los casos de fraude fiscal serían identificados, sino que también serían identificadas las entidades económicas que actúan de forma irregular en el pago de sus obligaciones tributarias, además de ello, sería también posible señalar los comportamientos sospechosos de los contribuyentes. Estos métodos de trabajo se pueden utilizar en el trabajo de auditoría de las administraciones tributarias con el fin de determinar la criminalidad fiscal. Estos métodos también se pueden considerar adaptados a la ayuda en la gestión de los riesgos del fraude fiscal, y se utilizarían para optimizar las auditorías fiscales, asegurando así, una recaudación tributaria más eficaz.

Ejemplos prácticos

Lo siguiente representa un breve resumen de las posibilidades de aplicación de la solución TaxCore® en lo referente a las tendencias actuales del aprendizaje automático para la predicción de futuros contribuyentes potenciales que cometerían fraude fiscal. Una categoría especial de cuentas a las que prestar atención son los reembolsos. Las informaciones a nivel mundial muestran que, al nivel de los establecimientos de venta minorista, no menos de un 28% de todos los fraudes son cometidos por empleados mediante reembolsos2. En este sentido, el foco, en caso de posible fraude fiscal, debe estar puesto precisamente sobre los reembolsos. Se debe prestar especial atención a los empleados que dispongan de informaciones de identificación adicionales (por ejemplo, los managers3) ya que tienen privilegios para llevar a cabo descuentos adicionales, disponen de cupones para compras posteriores, etc. He aquí algunas de las formas posibles de realizar un seguimiento de los reembolsos:

- Escenario 1:
  Realice un seguimiento del número total de reembolsos, entre los cuales, el número total de facturas emitidas por cada vendedor, comparándolas con todos los empleados. Determine cuál es la frecuencia de los acontecimientos, haga una vigilancia diaria, semanal… Si hay un gran número de reembolsos en las ventas totales del vendedor, y si se repiten a menudo, es señal de alarma.
- Escenario 2:
  Realice un seguimiento del número de artículos anulados a través de un recibo por cada vendedor y compárelos con cada empleado. Un gran número de cancelaciones por vendedor en relación con las ventas, si se repiten a menudo, es señal de alarma.
- Escenario 3:
  Vigile la oscilación de precios de un artículo individual donde el precio aumenta o disminuye con respecto al promedio, lo que puede indicar una manipulación en el precio declarado a su venta, así como un aumento ilegal (precios abusivos).
- Escenario 4:
  Haga un seguimiento de los informes de los clientes sobre transacciones sospechosas relacionadas con este punto de venta.

La esencia, en estos escenarios, es la repetición, es decir, la frecuencia de los hechos. No puede calificarse como fraude fiscal en potencia un evento que nunca se ha producido o que ha ocurrido una sola vez o un número insignificante de veces a lo largo del período observado. De igual forma, conviene definir varias categorías de riesgo independientes las unas de las otras y vinculadas a conceptos diferentes (factores de ponderación en las condiciones iniciales, frecuencia, categorías de riesgo para los contribuyentes…). La evaluación de los riesgos es un proceso muy subjetivo, sin embargo, si se aplican ciertas metodologías y principios, se puede reducir la subjetividad al nivel más bajo posible. En las bases de datos disponibles en la base de datos TaxCore®, se pueden identificar y definir, de forma experta, algunas normas y tipos de riesgo, así como los niveles de aceptabilidad de los riesgos. La evaluación de los riesgos implicaría tomar decisiones basadas en datos reales y en la experiencia de los expertos. Cada evento de riesgo viene acompañado de su frecuencia. En este sentido, es necesario definir, basándose en los conocimientos de los expertos, los intervalos de frecuencia, según los cuales se delimitaría el comportamiento de los contribuyentes. La esencia del problema reside en la definición de umbrales, tanto para los niveles de riesgo observados como para los intervalos de frecuencia.

TaxCore® posibilita rastrear y separar el tiempo de emisión de las facturas y el tiempo en el que se reciben las mismas en la base de datos. Esta se trata de una información muy importante, ya que, al controlar el tiempo de recepción de las facturas, se puede determinar si existe una acumulación de facturas en una parte determinada de la jornada (por ejemplo, hacia el final de las horas de trabajo), si se producen fluctuaciones durante las horas de trabajo, cuántas veces se repiten, etc.

Las tasas impositivas también se pueden verificar mediante el uso del sistema TaxCore®, para conocer si los contribuyentes realmente aplican las tasas impositivas que han declarado. Además, es posible determinar si se calculan varias tasas impositivas para el mismo artículo a nivel del contribuyente, así como si se mezclan las tasas impositivas en el momento de la emisión a un contribuyente que dispone de varias categorías de tasa.

Además de todo esto, las tendencias de los elementos siguientes pueden ser monitoreadas a nivel del contribuyente por intervalos de tiempo arbitrarios (diario, semanal, mensual, trimestral, anual, por calendario tributario, inicio y fin del año fiscal o cualquier período de presentación de declaraciones de impuestos, ya que el período que viene justo antes es muy interesante para sacar dinero y reducir así la facturación):

-número de facturas emitidas

-flujo de tesorería

-importe de la tasa

-número máximo y mínimo de facturas emitidas

-ratio entre los tipos de pago en efectivo/con tarjeta

los tipos de operaciones y sus porcentajes en número y en importe en cuanto al número o importe total de las operaciones (doble control a nivel del contribuyente y comparación de los contribuyentes con la evolución media de los movimientos a nivel de actividad), entre otros.

Estos datos pueden ser importantes para controlar el grado en el que la tendencia, a nivel del contribuyente, se desvía del cambio a nivel de actividad, según el parámetro escogido.

Ejemplo 1:
Uno de los ejemplos de seguir una tendencia de acuerdo con un parámetro sería determinar la desviación en la tendencia del número de facturas del contribuyente respecto a la tendencia del número medio de facturas emitidas a nivel del conjunto de la actividad. Los intervalos de desvío deben quedar igualmente definidos: (1) qué porcentaje de desvío es tolerable, (2) qué umbrales requerirían mayor investigación sin declarar al contribuyente como autor posible del fraude, y (3) qué porcentaje de desvío, y cualquier cantidad mayor que esta, señalaría al contribuyente como autor potencial del fraude y alertaría a que la inspección de impuestos realizase una auditoría de campo a este. Junto con el porcentaje de desviación, resulta necesario monitorear su frecuencia; debe diferir en peso (importancia) teniendo en cuenta desde frecuencia de las desviaciones semanales hasta la frecuencia de las desviaciones mensuales. Por ejemplo, dos desviaciones semanales no tienen el mismo peso que dos desviaciones mensuales.

Ejemplo 2:
En base a varios ejemplos prácticos y a su facturación registrada en TaxCore®, se observa que, de un mes a otro, existe tanto una tendencia a la baja en el número de facturas emitidas como el hecho de que, en determinados días laborables, no haya habido ni una sola factura emitida (no existen facturas registradas en el sistema). Cabe señalar que se trata de la industria hotelera y, en este sentido, es común que determinadas industrias no dispongan de ventas diarias. De acuerdo con estos ejemplos prácticos, es posible definir un escenario según el cual si existe una tendencia a que el número de facturas disminuya y a que en ciertos días no haya ventas registradas, y solamente debido a que se cumplan estas dos condiciones, el contribuyente entre en zona roja, lo que significa que este caso es transferido a los inspectores para controles adicionales.

Cada tipo de fraude deja ciertas “huellas” en los datos. TaxCore® registra eventos en tiempo real, sin dejar ninguna posibilidad a que se produzcan modificaciones ulteriores o retroactivas en los datos que “sustituirían” los datos antiguos. Ello además implica que absolutamente cada cambio que se produzca a nivel de cada elemento de información sea almacenado en la base de datos. De esta forma, se forma un gran conjunto de datos cuya investigación y análisis pueden determinar modelos de potenciales actos delictivos a futuro. Los humanos no son capaces de recorrer bases de datos extensas, y de definir y extraer determinados modelos y escenarios basados en dichos datos. Los métodos avanzados de aprendizaje automático son ideales para la extracción de grandes bases de datos y para la identificación de escenarios. Los esquemas según los cuales los métodos de aprendizaje automático investigarían los datos pueden ser definidos de acuerdo con indicadores históricos de contribuyentes reales que hayan cometido fraude fiscal o, también, se podrían crear escenarios de fraude fiscal ficticios. Los métodos de inteligencia artificial pueden ser utilizados en ambos sentidos. El primero consiste en definir y en distinguir los contribuyentes que hayan cometido determinadas infracciones fiscales, y el segundo consistiría en utilizarlos como herramientas para cometer un fraude. Es decir, se pueden formar conjuntos de datos falsos, en función de categorías fiscales, que serían, a su vez, formadas por algoritmos de IA con el fin de lograr el nivel de precisión deseado con datos reales. Tal conjunto de datos, idénticos a los datos reales, se pueden utilizar con fines fiscales para engañar a la inspección fiscal. En este sentido, existe la necesidad de incluir tecnologías punta en las auditorías realizadas a los contribuyentes con el objetivo de prevenir y de, si es posible, controlar la sobrerrepresentación de la IA en el fraude fiscal.

Considerando que en las condiciones actuales de globalización y desarrollo de la tecnología informática el número de riesgos aumenta considerablemente, resulta necesario, para la estabilidad financiera del país, definir medidas y enfoques para determinar fraudes fiscales en potencia. En este sentido, hay que adaptarse a la tormenta financiera mundial y considerar un enfoque moderno para la identificación del fraude fiscal. TaxCore®, debido a su compleja utilización, enfoque innovador, y de su tecnología y teoría, permitiría a las autoridades fiscales gestionar los riesgos de fraudes fiscales futuros, lo que repercutiría en un mayor progreso y crecimiento económico para el país.

Autor del texto: Jelena Lukić, analista de negocios en Data Tech International d.o.o.

English Srpski Français