Un millón …
Reflexiones sobre la visualización
Son varias las razones que motivaron este post. Sin que el orden sea determinante:
- El 26 de septiembre pasado, en Quito, presenté una ponencia sobre la visión de futuro sobre el uso de las tecnologías de información, dentro de la Administración Tributaria. Al final de mi charla, insistí sobre la necesidad de las administraciones, y en particular, de los servicios de información, de trabajar en la visualización de la información. Algo que, en mi opinión, cobra cada vez más importancia, en escenarios donde cada vez hay más información. Nos decía en Enrique Sánchez Blanco, de la Agencia Tributaria española, en su ponencia en Nairobi, que tanta información puede, si no está estructurada y uno no se prepara para su volumen, resultar tan en demasía que se torna indigesta. Podemos de no saber como enfrentarla terminar, como le ocurrió a mi amigo Darío, con un problema de conejos.
- En ese mismo seminario, que trató sobre «Modelos Integrados de Gestión e Innovación para la Administración Tributaria», Mauro Andino del SRI terminaba su charla hablando de desarrollos y servicios tecnológicos nuevos, en los que estaban pensando para el futuro dentro de su administración tributaria. La lámina en que apoyó su presentación incluía dos conceptos: redes sociales y big data.
- Al ver caminar las agujas del reloj, me pregunté más de una ocasión, que va a sentir uno cuando algo ya no funcione como antes. Pues uno siente que se va poniendo viejo, y sí. resulta que ahora para visualizar mejor algunas cosas, necesito ayuda: lentes de lectura.
- CIATalk, este Blog alcanzará pronto, probablemente en la semana de publicación de este post, el millón de impresiones. Al percatarme de ese número casi icónico, me preguntaba: si debía escribirlo en letras, como lo hice; o con guarismos, 1000000; o usar otras formas de representación 106; o 1M; o, tal vez, un palo(1). Distintas formas de representar, tal vez incluso visualizar, el mismo número. Dependiendo del lector una puede tener más sentido que otra.
- El millón de accesos a CIATalk me recordó la canción de Roberto Carlos. Me pregunté como se visualiza un millón de amigos. Pensé en los míos, los que tengo en Facebook son muchos menos de la milésima parte, y sin embargo, como verán su visualización es compleja.
La figura a continuación ayuda a visualizar mis amigos en Facebook. Cada nodo es una persona, cada segmento representa una amistad entre los nodos de sus extremos:
Yo no estoy en el grafo. Si estuviera, tendría una línea conectándome con todos los nodos: mis amigos. Cada nodo en el grafo tendría al menos una línea. Es, digámoslo así, un grafo de mis amigos, sin mí.
Hay unos pocos nodos, personas que existen y por supuesto tienen sus amigos, solo que no tienen amistad con ninguno otro de los míos. Son generalmente amigos que viven en un país exótico, o alguna vieja amiga que tal vez prefiera hoy no recordar mi nombre.
Hacia el centro vemos el componente gigante, que une a todos los demás nodos. Algunos hacia la periferia, con uno o a lo más un par de enlaces, es decir amigos en común. Hacia el centro una maraña de nodos y líneas. El tamaño de cada nodo representa el grado de ese nodo, es decir la cantidad de amigos dentro de esta red, mientras más grande es el nodo, mayor la cantidad de amigos en común.
Amistades comunes que se agrupan, recordando racimos de uvas, en grupos muy densos. El diagrama a continuación ilustra la separación. El grupo C representa fundamentalmente mis amigos del colegio; el U, los de la Universidad; el F, los relacionados con mi familia y las personas que conozco a través de mi familia; los P1 a P4 son amigos hechos durante mi vida en un país. El P3, más antiguo que los otros, tiene dos racimos. El mayor, se ligó a amistades hechas en el trabajo, o por el trabajo. El otro, el más pequeño, de amistades relacionadas con otras actividades culturales, deportivas y mmm personales.
Algunos nodos grandes en tamaño, se encuentran en el medio de dos o más racimos de amigos. No se trata de que son un punto que conectad dos grupos. Significa más bien que forman parte de dos o más grupos.
Me preguntaba si todos los nodos son igual de importantes en el ámbito de Facebook. Ciertamente, en la red, no todos los usuarios son igual de activos. El diagrama de abajo, identifica los nodos de las personas muy activas en la red. Algunos nodos coinciden con los puntos más grandes. Son muy activos, postean mucho, y tienen muchos amigos en común. Pero no son todos, igual están varios pequeños. Si yo quisiera pasar un mensaje que le llegue a mis amigos más rápidamente, claramente podemos identificar a quien debería contactar.
Ahora, me pregunto y les pregunto. Si esto no se vería parecido a la red de, por ejemplo, grandes contribuyentes, y los segmentos que los unen representan las operaciones de compra o venta entre ellos, o la existencia de un director, un contador o un socio en común; o los que realizan operaciones sujetas a precios de transferencia. Y si en lugar, de filtrar el grafo por la actividad en Facebook, se filtra por el volumen o el valor de las operaciones. ¿Qué representan los nodos grandes? ¿los nodos en el medio de los racimos? ¿los grupo se forman, como en mi caso dirigidos por el lugar o el tiempo, o responden a otros criterios: económicos, productivos o, quién sabe, tributarios?
Saludos y suerte.
1,288 total views, 3 views today
3 comentarios
Hola Raúl… muito pertinente suas observações, face a enorme quantidade de dados que hoje é coletada em sistemas de informação. Já o tratamento eficaz desses dados para produção de informação útil, é outro problema.
Na área tributária, em especial, dados oriundos das obrigações acessórias dos contribuintes e também recolhidos de muitos segmentos da sociedade – sejam eles de ordem econômica ou social, fornecem uma base sem precedentes para a condução / afinamento de políticas assim como para melhoria da gestão.
O maior problema é agrupá-los de forma coerente, possibilitando um tratamento que possa gerar informações úteis.
Adicionalmente, vem o problema da visualização desta complexidade de dados em formas inteligíveis para executivos, tomadores de decisão.
Como você mostra no exemplo, grafos são formas importantes de visualização, em especial para avaliar concentração e medir «distâncias» entre seus nodos. Aliás, nesse último caso poderia ser aplicada a teoria dos seis graus de separação (http://pt.wikipedia.org/wiki/Teoria_dos_seis_graus_de_separa%C3%A7%C3%A3o).
Nesse universo de dados, a decisão crucial é como mostrá-los aos interessados para que possam usufruir do seu potencial.
Saludo desde Venezuela amigo Raúl. El tema de la información es vital para cualquier Administración Tributaria desarrollada o en proceso de desarrollo. El dominio de la información de los contribuyentes y responsables garantiza el éxito en la gestión encomendada constitucionalmente a los entes recaudadores. Con ello, quiero significar que la inversión en este tema es vital para estos entes controladores, tal vez al inicio representa una gran erogación pero posteriormente, se llenarán de satisfacciones por los logros alcanzados. Si no existe el manejo de la información, muy difícil se torna la labor de control y ello influye en la desigualdad en el trato de los sujetos pasivos.
Agradecido por los temas que abordas en cada intervención, éxito y te esperamos pronto por aquí.
Un abrazo
Es interesante. Pero estos mapas provienen de LinkedIn donde hoy solo pueden registrase las personas. Y en consecuencia, los nodos se forman por relaciones entre ellas en funcion de su trabajo o universidad.
Para entender la relacion entre las empresas debemos acudir al data mining y la la inteligencia en sus distintas formas. Nada de lo que hagan en el mundo de los negocios sera de tan facil acceso como en este ejemplo.