Más

HTML personalizado dentro del mapa de folletos

HTML personalizado dentro del mapa de folletos


Estamos actualizando nuestros mapas de folletos para que sean más grandes en la pantalla y, en parte, lo hacemos colocando paneles de información, etc. sobre el mapa con diferentes transparencias. Obviamente, esto es fácil de hacer colocando HTML de forma absoluta junto al elemento #map (donde se coloca el mapa del folleto). Se puede hacer que se coloque bien sobre él, sin embargo, tenemos un control Maximizar para la visualización de mapas en pantalla completa y me gustaría que nuestro HTML personalizado también sea visible en esa vista.

No he visto una manera de hacer esto a través de la API de Leaflet. Por lo tanto, a través de la experimentación, puse nuestro HTML personalizado dentro de la preinicialización del elemento #map. Para mi sorpresa, esto funcionó (Leaflet agrega sus elementos dentro del elemento #map, conservando lo que ya está allí). El problema con esto es que nuestro evento de clic en el mapa se activa incluso cuando se hace clic en nuestros elementos HTML personalizados. Del mismo modo, dibujar en el mapa también funciona a través de nuestro HTML personalizado. Este no es el caso con otros controles agregados al folleto y no sé cómo hacer que nuestro HTML personalizado también esté exento de las interacciones del mapa.

¿Cómo obtenemos nuestro HTML personalizado dentro del alcance de la funcionalidad Maximizar pero fuera del alcance de las interacciones del mapa?

Planeamos utilizar esta convención en gran medida, por lo que es importante para nosotros precisarlo.


Tus eventos se están propagando al mapa. Leaflet proporciona métodos DomEvent para evitar esto, por ejemplo (usando jQuery):

$ ('div'). each (function () {L.DomEvent.on (this, 'mousedown', L.DomEvent.stop); L.DomEvent.on (this, 'click', L.DomEvent.stop) ; L.DomEvent.on (esto, 'touchstart', L.DomEvent.stop);});

UDPATE

Según los comentarios a continuación, lo siguiente también debería funcionar en lugar del código anterior:

L.DomEvent.disableClickPropagation ();

Referencia: http://leafletjs.com/reference.html#domevent-disableclickpropagation


Aquí hay una versión simple de JavaScript de lo que sugirió Toms.

let divs = document.getElementById ("map-id"). getElementsByTagName ("div"); for (sea i = 0; i 

Mapa interactivo de elevación de Florida

Muestra las tendencias de elevación en todo el estado. Mapas de elevación y elevación de ciudades, pueblos y aldeas de Florida.

Estados Unidos Elevación Y Mapas De Elevación De Ciudades Mapa Topográfico Contorno

Encuentra la elevación de tu ubicación actual o de cualquier punto de la tierra.

Mapa interactivo de elevación de florida. El mapa de inundaciones muestra el mapa del área que podría inundarse si el nivel del agua sube a una elevación particular. A continuación, podrá encontrar la elevación de las principales ciudades, pueblos y aldeas de Florida, junto con sus mapas de elevación. Aprenda información detallada del mapa del estado de Florida para viajar rápidamente mapas de carreteras del estado de Florida, mapas de carreteras y mapas de carreteras interestatales.

La elevación se muestra en los mapas de diversas formas, incluidas las líneas de contorno, las elevaciones puntuales, el relieve sombreado, el relieve sombreado y las áreas de color. Utilice la información de elevación para. Vea nuestro mapa de los puntos más altos del estado para aprender sobre britton hill a 345 pies, el punto más alto de florida.

Esta página muestra la información de altitud de florida usa incluyendo mapa de elevación mapa topográfico presión narométrica longitud y latitud. Ubique el capitolio del estado de florida o la ciudad más grande en el mapa interactivo del estado de florida para que sea más fácil navegar por la mejor ruta de viaje. Evalúe si las inundaciones o las marejadas ciclónicas afectarán su propiedad.

Estos mapas también proporcionan una idea topográfica y de contorno en Floridaus. Este es un mapa topográfico generalizado de Florida. Todos los mapas del estado de florida se pueden imprimir en topos a todo color.

Encuentre la elevación y las coordenadas de cualquier ubicación en el mapa topográfico. Los mapas de elevación de las ubicaciones en floridaus se generan utilizando datos de nasas srtm. Mapas de mayor resolución como estos y muchos otros mapas digitales mapas de pared mapas de radio personalizados mapas de viaje guías de viaje software de mapas y globos y juegos para negocios y el aula están disponibles para comprar en amazoncom.

Los datos de origen de ned para este mapa consisten en una combinación de dem. De resolución de 30 metros y 10 metros. Puede ayudar a la evaluación del riesgo de inundaciones o la gestión de inundaciones. Mapa de elevación con la altura de cualquier ubicación.

Mapa de subida del nivel del mar. Los dos mapas que se muestran aquí son mapas de elevación y base digitales de Florida. La elevación es la altura de la tierra sobre el nivel del mar.

Encuentre mapas topográficos de Florida y datos de mapas topográficos haciendo clic en el mapa interactivo o buscando mapas por nombre de lugar y tipo de característica. Esta herramienta le permite buscar datos de elevación buscando una dirección o haciendo clic en un mapa de Google en vivo. El conjunto de datos de elevación nacional estándar de usgs ned 1 segundo de arco nominalmente 30 metros modelo de elevación digital dem Los datos son la base para el mapa que está diseñado para ser utilizado a gran escala y solo con fines informativos.

Mapas de base y elevación de Florida. Si conoce el condado de Florida donde se encuentra la característica topográfica, haga clic en el condado en la lista de arriba. Obtenga altitudes por latitud y longitud.

Mapa físico de Wisconsin y mapa topográfico de Wisconsin

Sistemas de información geográfica Junta de condado del condado de Citrus

Base de datos interactiva para mapas topográficos de los Estados Unidos

Contornos de elevaciones y depresión Departamento de Florida de

Mapas topográficos y mapas satelitales de Topoquest en línea

Mapas estatales de Florida Mapas interactivos de carreteras estatales de Florida Mapas estatales

Portal de mapas de inundaciones de Louisiana

Mapa de elevación de Florida Florida

Mapa interactivo súper detallado del fondo marino en 3 D con cable

Mapa disponible en línea Servicio geológico Biblioteca del Congreso de EE. UU.

Explorador de mapas topográficos históricos de Usgs

Mapas topográficos de los Estados Unidos 1 250 000 Mapa de Perry Castaneda

Elevación de Fort Myers Us Contorno de topografía del mapa de elevación

Florida Topo Map Mapa topográfico

Mapa de Investigaciones Científicas de Usgs 3047 Estado de Florida 1 24 000

Hacer un mapa de contorno National Geographic Society

Archivo Mapa Topográfico De Florida En Svg Wikipedia

Datos y mapas de Gis Lter de los Everglades costeros de Florida

Mapa de zonas de inundación del condado de St Johns

Mapas interactivos Gis Condado de Hernando Fl

Mapa de elevación de EE. UU. Mapas interactivos del mundo

Mapa de elevación de EE. UU. Interactivo válido con capitales y estados 50 juego

Mapa Elevación Alto Contraste Estados Unidos Mapa Happy Us Geografía Física

Mapas topográficos en la App Store



La vista de Apple de Colchester (izquierda) está envuelta en la nube, mientras que Google (derecha) tiene una vista clara. Las dos empresas están listas para enfrentarse cara a cara en el iPhone si Apple aprueba los planes de Google para una aplicación de mapas.


Albert Bridge en el mapa 3D de Apple (izquierda) está distorsionado, mientras que Google (derecha) muestra una versión más realista

Sí, debería ser fácil para Apple (AAPL) igualar algún día la destreza de Google (GOOG) para crear una aplicación de mapas de primer nivel: todo lo que tiene que hacer es contratar a otras 7.000 personas. Business Insider informa que Google tiene aproximadamente 7,100 personas que están trabajando en su aplicación de mapas, incluidos 1,100 empleados a tiempo completo y 6,000 contratistas que se combinan para trabajar como "conductores de Street View, personas que vuelan aviones, personas que dibujan mapas, personas que corrigen listados y personas construyendo nuevos productos ". Como señala BI, Apple tiene solo 13.000 empleados no minoristas en total, por lo que realmente no es justo comparar su aplicación de mapas con una aplicación diseñada y mantenida por un pequeño ejército.


El puente colgante de Clifton en Bristol tal como aparece en los mapas de Apple. La firma ha sido criticada por algunas de sus fotografías en 3D que han distorsionado edificios, y está lista para enfrentar una nueva competencia de la aplicación de mapas de Google.

[tamaño = 13 puntos]Cómo Google crea sus mapas y qué significa para el futuro de todo[/Talla]

Una mirada exclusiva a Ground Truth, el programa secreto para construir los mapas más precisos del mundo.

Detrás de cada mapa de Google, hay un mapa mucho más complejo que es la clave para sus consultas, pero está oculto a su vista. El mapa profundo contiene la lógica de los lugares: sus rampas de acceso a la autopista y sin giros a la izquierda, los límites de velocidad y las condiciones del tráfico. Estos son los datos que extrae cuando le pide a Google que lo lleve del punto A al punto B, y la semana pasada, Google me mostró el mapa interno y demostró cómo se construyó. Es la primera vez que la compañía permite que alguien vea cómo funciona realmente el proyecto que llama GT, o & quotGround Truth & quot.

Google se abrió en un momento clave de su evolución. La empresa comenzó como una empresa de búsqueda en línea que ganaba dinero casi exclusivamente vendiendo anuncios basados ​​en lo que estaba buscando. Pero luego el mundo móvil explotó. El lugar desde donde está buscando se ha vuelto casi tan importante como lo que está buscando. Google respondió creando un sistema operativo, una marca y un ecosistema en Android que se ha convertido en el único rival importante del iOS de Apple.

Y por una buena razón. Si la misión de Google es organizar toda la información del mundo, el desafío más importante, mucho más grande que indexar la web, es tomar la información física del mundo y hacerla accesible y útil.

"Si miras el mundo fuera de línea, el mundo real en el que vivimos, esa información no está completamente en línea", me dijo Manik Gupta, gerente de producto senior de Google Maps. "Cada vez más, a medida que avanzamos en nuestras vidas, intentamos cerrar la brecha entre lo que vemos en el mundo real y [el mundo en línea], y Maps realmente desempeña ese papel".

Esta no es solo una preocupación teórica. Los sistemas de mapeo son importantes en los teléfonos precisamente porque son la interfaz entre los mundos en línea y fuera de línea. Si eres como yo, utilizas el mapeo más que cualquier otra aplicación, excepto el paquete de comunicaciones (teléfono, correo electrónico, redes sociales y mensajería de texto).

Google está enfrascado en una batalla con la compañía más grande del mundo, Apple, sobre quién controlará el futuro de los teléfonos móviles. Mientras que los puntos fuertes de Apple se encuentran en el diseño de productos, la gestión de la cadena de suministro y el marketing minorista, el ámbito más obvio de ventaja competitiva de Google es la información. Los datos geográficos, y las aplicaciones creadas para usarlos, son donde Google puede ganar simplemente siendo Google. Eso no importaba en las generaciones anteriores de iPhones porque usaban Google Maps, pero ahora Apple creó su propio servicio. La forma en que los dos sistemas operativos incorporan datos geográficos y los presentan a los usuarios podría convertirse en un campo de batalla clave en las guerras telefónicas.

La oficina donde Google ha estado construyendo la mejor representación del mundo no es un lugar extraordinario. Tiene toda la comida gratis, el ping pong y los dibujos animados de Christoph Niemann inspirados en Google Maps que cabría esperar, pero sigue siendo un edificio de oficinas de poca altura justo al lado de la 101 en Mountain View en los suburbios.

Estaba programado para reunirme con Gupta y el líder de ingeniería de su equipo, el ex ingeniero de la NASA Michael Weiss-Malik, que había pasado el 20 por ciento de su tiempo trabajando en Google Mars, y Nick Volmar, un & quotoperator & quot que en realidad masajea datos de mapas.

"Así que quieres hacer un mapa", me dice Weiss-Malik mientras nos sentamos frente a un monitor enorme. & quot; Hay un par de pasos. Adquieres datos a través de socios. Haces un montón de ingeniería en esos datos para ponerlos en el formato correcto y combinarlos con otras fuentes de datos, y luego haces un montón de operaciones, que es de lo que se trata esta herramienta, para masajear manualmente los datos. Y por el otro extremo aparece algo de mayor calidad que la suma de sus partes.

Esto es con lo que comenzaron, los datos TIGER de la Oficina del Censo de EE. UU. (Aunque la capa base podría provenir y proviene de una variedad de fuentes en diferentes países).

En la primera inspección, estos datos se ven muy bien. Las carreteras parecen estar todas ahí y tienes las autopistas diferenciadas. Este es un buen mapa para el ojo inexperto. Pero miremos más de cerca. Hay problemas en los que los datos digitales no coinciden con el mundo físico. He marcado con un círculo algunas obvias a continuación.

Y eso es solo por comparar el mapa con las imágenes de satélite. Pero también hay una variedad de otras herramientas a disposición de Google. Uno está trayendo datos de otras fuentes, dice el Servicio Geológico de EE. UU. Pero Ground Truthers de Google también puede aportar otro recurso exclusivo para resolver el problema de los mapas: las huellas y las imágenes de los coches de Street View. De acuerdo con el mantra de Google más-datos-son-mejores-datos, el equipo de mapas, impulsado en gran medida por Street View, está publicando más datos de imágenes cada dos semanas de lo que Google poseía en total en 2006. *

Retrocedamos un poco para recordar con asombro la idea de que una sola empresa decidió conducir automóviles con cámaras personalizadas en todas las carreteras a las que podían acceder. Google tiene ahora hasta cinco millones de millas conducidas. Cada unidad genera dos tipos de datos realmente útiles para el mapeo. Una es que las pistas reales que han tomado los autos son una prueba positiva de que se pueden tomar ciertas rutas. Las otras son todas las fotos. Y lo importante de las fotografías en Street View es que Google puede ejecutar algoritmos que extraen las señales de tráfico e incluso puede pegarlas en el mapa profundo dentro de su herramienta Atlas. Entonces, para una intersección particularmente complicada como esta en el centro de San Francisco, podría verse así:

Google Street View no se creó para crear mapas como este, pero el equipo de geo rápidamente se dio cuenta de que la visión por computadora podía proporcionarles datos increíbles para verificar sus mapas. No quiero desviarme demasiado, pero lo que ves arriba es solo el comienzo de cómo Google usará las imágenes de Street View. Piense en ellos como los primeros rastreadores web (¿los recuerda?) Que salían al mundo en busca de las palabras en las páginas. Eso es lo que está haciendo Street View. Uno de sus primeros usos es encontrar letreros (y direcciones) en las calles para que los mapas de Google puedan comprender mejor la lógica de los sistemas de transporte humano. Pero a medida que mejoran la visión por computadora y el OCR, cualquier palabra que sea visible desde una carretera se convertirá en parte del índice del mundo físico de Google.

Más tarde ese mismo día, el vicepresidente de Google Maps, Brian McClendon, lo expresó así: "De hecho, podemos organizar la información física escrita del mundo si podemos OCR y colocarla", dijo McClendon. "Usamos eso para crear nuestros mapas ahora mismo extrayendo nombres de calles y direcciones, pero hay mucho más allí".

¿Más como qué? "Ya tenemos lo que llamamos 'códigos de vista' para 6 millones de empresas y 20 millones de direcciones, donde sabemos exactamente lo que estamos viendo", continuó McClendon. & quot; Podemos utilizar la coincidencia de logotipos y averiguar dónde están los letreros de Kentucky Fried Chicken. Podemos identificar y hacer una comprensión semántica de todos los píxeles que hemos adquirido. Eso es fundamental para lo que hacemos. & Quot

Por ahora, sin embargo, la visión por computadora que transforma las imágenes de Street View directamente en geocomprensión permanece en el futuro. La mejor manera de averiguar si puede girar a la izquierda en una intersección en particular es hacer que una persona mire una señal, ya sea un ser humano que conduce o un ser humano que mira una imagen generada por un automóvil de Street View.

Hay una analogía con uno de los otros proyectos impresionantes de Google: Google Translate. Lo que parece inteligencia artificial es en realidad solo una recombinación de la inteligencia humana. Translate se basa en grandes volúmenes de texto que han sido traducidos a diferentes idiomas por humanos y luego puede extraer palabras y frases que coinciden. Los algoritmos no son realmente tan complejos, pero funcionan debido a la gran cantidad de datos (es decir, inteligencia humana) que se incluyen en la tarea en la parte frontal.

Google Maps ha ejecutado una operación similar. Los seres humanos están codificando cada parte de la lógica del camino en una representación del mundo para que las computadoras puedan simplemente duplicar (infinitamente, instantáneamente) los juicios que una persona ya hizo.

Esta realidad se encarna en Nick Volmar, el operador que ha estado luciendo Atlas mientras Weiss-Malik y Gupta lo explican. Probablemente usa veinticinco atajos de teclado para cambiar entre tipos de datos en el mapa y muestra el tipo de velocidad nerviosa que asocio con diseñadores de mucho tiempo que trabajan con productos de Adobe o reproductores profesionales de Starcraft. Claramente, Volmar ha pasado miles de horas trabajando con estos datos. Weiss-Malik me dijo que se necesitan cientos de operadores para mapear un país. (Se rumorea que muchas de estas personas trabajan en la oficina de Bangalore, de la cual Gupta fue ascendido).

La gran cantidad de esfuerzo humano que se dedica a los mapas de Google es simplemente alucinante. Cada camino que ves ligeramente torcido en la imagen superior ha sido masajeado a mano por un humano. El momento más revelador para mí fue cuando miramos algunos de los varios miles de informes de usuarios sobre problemas con Google Maps que llegan todos los días. El equipo de Geo intenta abordar la mayoría de los problemas solucionables en cuestión de minutos. Una denuncia informó que Google no mostró una nueva rotonda que se había construido en una zona rural del país. Las imágenes de satélite no mostraron el cambio, pero un automóvil de Street View había conducido recientemente por la calle y sus huellas mostraban la nueva carretera perfectamente.

Volmar comenzó a arreglar el mapa, dibujando rápidamente la nueva carretera y conectándola a la infraestructura existente. En su prisa (y quizás con la presión adicional de tres personas observando cada uno de sus movimientos), no trazó un círculo perfecto de puntos. Weiss-Malik y yo nos desviamos hacia otra conversación durante un par de minutos. Para cuando volví a mirar la pantalla, Volmar había vuelto a dibujar el círculo con perfecta precisión y había mejorado algunas otras cosas mientras estaba en ello. Las acciones fueron impresionantemente automáticas. Esta es una operación que promueve el perfeccionismo.

Y así es como consigues que tus mapas se vean así:

Vale la pena señalar algunos detalles. En la parte superior del centro, los senderos se han trazado y codificado como lugares para caminar. Todos los estacionamientos han sido mapeados. Todos los pequeños caminos, digamos, a la izquierda del pequeño parche de tierra a la derecha, también han sido codificados. Se han delineado varios de los edificios reales. Abajo, en la parte inferior izquierda, se ha marcado una carretera como prohibida. En todas y cada una de las intersecciones, hay flechas que delimitan con precisión dónde pueden girar los automóviles y dónde no.

Ahora imagine hacer esto para cada mosaico en el mapa de Google en los Estados Unidos y otros 30 países durante los últimos cuatro años. Cada rotonda perfectamente circular, cada intersección con la lógica correcta. Cada nuevo desarrollo. Cada calle de un solo sentido. Esta es una tarea de una escala casi inimaginable. Esto no es algo que se pueda juntar con unas pocas docenas de ingenieros inteligentes.

Salí convencido de que los datos geográficos que Google ha reunido probablemente no serán comparados por ninguna otra empresa.El secreto de este éxito no es, como era de esperar, la facilidad de Google con los datos, sino su voluntad de comprometer a los humanos para combinar y limpiar datos sobre el mundo físico. Las ofertas de mapas de Google se basan en la inteligencia humana en la interfaz, y eso es lo que permite que sus computadoras le indiquen la mejor ruta de San Francisco a Boston.

Probablemente sea mejor no pensar en Google Maps como algo parecido a un mapa de papel. Los sistemas de información geográfica representan un salto de los mapas de papel como el ábaco a la computadora. "Honestamente, creo que estamos viendo un cambio más profundo, para la creación de mapas, que el cambio del manuscrito a la impresión en el Renacimiento", dijo el historiador cartográfico de la Universidad de Londres Jerry Brotton al Sydney Morning Herald. --Eso fue enorme. Pero esto es más grande.

Los mapas que solíamos mantener doblados en nuestra guantera eran una colección de líneas y formas que superponíamos con la inteligencia humana. Ahora, como hemos visto, un mapa es una colección de líneas y formas con la inteligencia de Nick Volmar (y cientos de otros) codificada en su interior.

Cuando hablamos del futuro de los mapas, es común hacer referencia al sueño borgesiano de un mapa 1: 1 del mundo entero. Parece una noción ridícula que necesitemos una representación completa del mundo cuando ya tenemos el mundo mismo. Pero para tomar en serio la concepción de la realidad aumentada del erudito Nathan Jurgenson, tendríamos que creer que cada espacio físico está, en sus palabras, "interpenetrado" con información. Todos los espacios físicos ya son también espacios informativos. Todos los humanos tenemos un mapa borgesiano en la cabeza de los lugares que conocemos y lo usamos para navegar y calcular el espacio físico. La estrategia de Google es reunir todos nuestros mapas mentales y procesarlos en formas accesibles y útiles.

Su producto MapMaker deja clara esa ambición. Proyecto gestionado por Gupta durante su estadía en India, es la versión & quot de abajo hacia arriba & quot de Ground Truth. Es una forma de acceso público para editar Google Maps agregando puntos de referencia y datos sobre tu parte del mundo. Es una forma de extraer datos del cerebro humano y enviarlos a Internet. Y es muy parecido al competidor abierto de Google, Open Street Map, que ha demostrado que también puede aprovechar la inteligencia de la multitud.

A medida que nos deslizamos y nos deslizamos hacia un mundo donde nuestra realidad aumentada es cada vez más visible para nosotros fuera y en línea, los datos geográficos de Google pueden convertirse en su activo más valioso. No solo por estos datos, sino porque los datos de ubicación hacen que todo lo demás que hace y conoce Google sea más valioso.

O, como me dijo mi amigo y novelista de ciencia ficción Robin Sloan, "sostengo que este es el activo principal de Google. En 50 años, Google será la empresa de vehículos autónomos (impulsada por este mapa profundo del mundo) y, oh, PD. todavía tienen un motor de búsqueda en alguna parte. & quot
Por supuesto, siempre necesitarán un dato más de información geográfica para que todo este esfuerzo valga la pena: usted. Dónde estás, claro está. Tu ubicación es la corriente que hace que funcione la máquina de geodatos gigante de Google. Han construido todo este patio de recreo como un señuelo elaborado para ti. Tan bueno, inteligente y útil como es, buena suerte para resistirse a morder el anzuelo.

¿Te molestaste en leer el artículo?
Si lo hubiera hecho, ¡no habría escrito lo que escribió arriba!
¡No puede comparar todos los que mencionó con los mapas de Google en precisión, especialmente en lo que respecta a las calles de todo el mundo!

El problema con los nigerianos es que el tipo de mapas que tenemos aquí sigue siendo rudimentario en el mejor de los casos, pero en otras partes del mundo, sus vidas dependen de ello, después de las llamadas telefónicas, los sms y las redes sociales, ¡la siguiente aplicación más utilizada es MAPS!
¡Y es por eso que hubo una gran protesta cuando Apple eliminó los mapas de Google de ios6!

¿Te molestaste en leer el artículo?
Si lo hubiera hecho, ¡no habría escrito lo que escribió arriba!
¡No puede comparar todos los que mencionó con los mapas de Google en precisión, especialmente en lo que respecta a las calles de todo el mundo!

El problema con los nigerianos es que el tipo de mapas que tenemos aquí sigue siendo rudimentario en el mejor de los casos, pero en otras partes del mundo, sus vidas dependen de ello, después de las llamadas telefónicas, los sms y las redes sociales, ¡la siguiente aplicación más utilizada es MAPS!
¡Y es por eso que hubo una gran protesta cuando Apple eliminó los mapas de Google de ios6!

Por supuesto que leí todo. Navteq, Tele Atlas, etc. suministran mapas al mismo google. Según los mapas de Nigeria, obviamente no has estado siguiendo la tendencia. Las mismas empresas (Tele Atlas, Navteq, Google, etc.) obtienen mapas de Nigeria de mi empresa 3D Technologies. Hemos mapeado Nigeria y lo hemos instalado en los sistemas de navegación Garmin incluso mucho antes de que Google entrara en el mercado. Todos los mapas de los teléfonos Nokia para Nigeria provienen de nuestra empresa, así que, ¿qué tienen de rudimentario los mapas de Nigeria?

Vaya en línea y visite http://www.ceaser-web.com y muchos más.

Como dije, no es gran cosa con los mapas de Google.

El crowdsourcing, en el que Google confía principalmente, es, en el mejor de los casos, muy preciso para otros países, como Nigeria. El creador de mapas de Google está abierto al público para ingresar características del mapa, pero estas no se publican hasta que algunos moderadores aprueban las entradas, y estos moderadores no son nigerianos y están lejos de Nigeria. La mayoría de las veces que realiza entradas, el moderador las descarta como incorrectas, entonces, ¿cómo maneja eso? Vaya a los mapas de Google y vea algunas áreas solo en Abuja y se sorprenderá de lo precisos que son los mapas.

Hablamos por experiencia y no tiene sentido tirar agua mala cuando hablamos de la experiencia de primera mano.

Pereza mental en el trabajo. No se molestó en ver los artículos b4 presionando el teclado. Haba. Aprende 2 aprecia lo que es realmente excelente.

aze: Pereza mental en el trabajo. No se molestó en ver los artículos b4 presionando el teclado. Haba. Aprende 2 aprecia lo que es realmente excelente.

Explícame qué hay en mi comentario que te haga pensar que no leí el artículo. Mtchewwww

Si quieres saber de qué estoy hablando, lee sobre nosotros en http://www.ceaser-web.com o http://www.3dtechnologies.org

Por favor, haga su propio comentario, tal como yo hice el mío, no arroje ningún insulto injustificado solo porque quiere hacer un comentario, si no está de acuerdo con mi opinión, guárdese el insulto para usted. De hecho, la pereza mental en el trabajo.

Por supuesto que leí todo. Navteq, Tele Atlas, etc. suministran mapas al mismo google. Según los mapas de Nigeria, obviamente no has estado siguiendo la tendencia. Las mismas empresas (Tele Atlas, Navteq, Google, etc.) obtienen mapas de Nigeria de mi empresa 3D Technologies. Hemos mapeado Nigeria y lo hemos instalado en los sistemas de navegación Garmin incluso mucho antes de que Google entrara en el mercado. Todos los mapas de los teléfonos Nokia para Nigeria provienen de nuestra empresa, así que, ¿qué tienen de rudimentario los mapas de Nigeria?

Vaya en línea y visite http://www.ceaser-web.com y muchos más.

Como dije, no es gran cosa con los mapas de Google.

El crowdsourcing, en el que Google confía principalmente, es, en el mejor de los casos, muy preciso para otros países, como Nigeria. El creador de mapas de Google está abierto al público para ingresar características del mapa, pero estas no se publican hasta que algunos moderadores aprueban las entradas, y estos moderadores no son nigerianos y están lejos de Nigeria. La mayoría de las veces que hace entradas, el moderador las descarta como incorrectas, entonces, ¿cómo maneja eso? Vaya a los mapas de Google y vea algunas áreas solo en Abuja y se sorprenderá de lo precisos que son los mapas.

Hablamos por experiencia y no tiene sentido tirar agua mala cuando hablamos de la experiencia de primera mano.

No es algo que pueda explicar fácilmente a alguien que tiene poco conocimiento de cómo funcionan estas cosas.

Imaginar que es gratis. Cuando se trata de esto, dudo que Apple compita siquiera & quot; Head-On & quot.

Lo hacemos todos los días señor. Ni siquiera dos semanas. ¿Has visto mapas de Abuja en Google? Ve y comprueba.


Las herramientas en línea pueden ayudar a las personas en desastres, pero ¿representan a todos? (artículo en The Conversation)

Este artículo apareció originalmente en The Conversation.
Billy Tusker Haworth, Universidad de Manchester , Christine Eriksen, Universidad de Wollongong , Scott McKinnon, Universidad de Wollongong

30 de mayo de 2019 5.45 a.m. AEST
______________________________________________________________________________

Con el aumento de las amenazas naturales y los desastres relacionados con el clima, las herramientas en línea, como el mapeo colaborativo y las redes sociales, pueden ayudar a las personas a comprender y responder a una crisis. Permiten a las personas compartir su ubicación y aportar información.

Pero, ¿son estas herramientas útiles para todos o algunas personas están marginadas? Es vital que estas herramientas incluyan información proporcionada por todas las secciones de una comunidad en riesgo.

La evidencia actual sugiere que no siempre es así.


Usar geodatos para visualización

Muchos conjuntos de datos basados ​​en la ubicación geográfica se pueden visualizar como un mapa. Los Sistemas de Información Geográfica (SIG) nos proporcionan una variedad de funciones, ideas y algoritmos para hacerlo posible.

_Nota: para obtener más información sobre el ecosistema GIS, consulte la página de Open Source Geospatial Foundation (OSGeo).

Para hacer más interesantes nuestros datos (podríamos decir: más perspicaz y esclarecedor) y más atractivo (hermosa) para un usuario, visualizaremos el conjunto de datos como un mapa. Además, lo mostraremos como un globo interactivo para que los usuarios puedan girar el globo para observar diferentes regiones y acercar un punto de interés.

Para que esto suceda, tenemos que usar una proyección de Proyección D3 y geoPath desde el Módulo D3-geo.

Al principio, tenemos que definir qué tipo de datos tenemos: local, nacional o mundial. Esto es importante porque tenemos que determinar qué proyección geográfica usar. A escala local, debemos recordar que cada país tiene sus propios sistemas de coordenadas nacionales mediante los cuales se visualizan todos los mapas. Por lo tanto, el uso de diferentes sistemas de coordenadas para visualizar datos puede resultar en diferentes formas y rotaciones para los países.

Web Mercator

A escala mundial, tenemos sistemas de coordenadas globales. En este caso, la proyección más popular es Web Mercator también conocido como Google Web Mercator. Es una variante de la proyección de Mercator y se basa en fórmulas esféricas. Se ha convertido en un estándar para un mapeo web en las visualizaciones a escala global.

Una proyección ortográfica

Otra proyección interesante es una proyección ortográfica. El objetivo es visualizar objetos 3D en dos dimensiones (por ejemplo, en un navegador web). D3 nos proporciona una proyección geo-ortográfica lo que nos permite visualizar la Tierra como un globo (o en este caso como un círculo plano). La desventaja de esta proyección es que no podremos encajar todos los continentes en nuestro lienzo como lo haríamos en una proyección de Mercator. Sin embargo, podemos cambiar la rotación de la proyección cuando el usuario interactúa con nuestro mapa, lo que le permite enfocarse en sus puntos de interés.


Últimas patentes de Telogis, Inc.:

Esta solicitud es una continuación de la Solicitud de Patente Internacional No. PCT / US2010 / 45630, presentada el 16 de agosto de 2010 y titulada “Representación de mapas en tiempo real con agrupación y expansión de datos y superposición”, que reivindica la prioridad de la Solicitud de patente provisional de EE. UU. No. 61 / 274,221, presentada el 14 de agosto de 2009 y titulada “Representación de mapas en tiempo real con agrupación de datos y expansión y superposición”, cuyas aplicaciones se incorporan aquí como referencia en la medida en que no sean incompatibles con la divulgación aquí.

Esta invención se refiere en general a sistemas y métodos para organizar, gestionar y mostrar gráficamente múltiples entidades relacionadas lógicamente y, más específicamente, en una realización, a sistemas y métodos para la organización y visualización en tiempo real de grupos de vehículos rastreados en relación con un entorno geográfico. mapa.

2. Descripción de la técnica relacionada

A medida que el uso de mapas electrónicos para mostrar información ha aumentado en popularidad, también lo ha hecho el volumen y la complejidad de la información que se muestra. En consecuencia, se ha vuelto cada vez más difícil asimilar la amplia gama de datos que pueden superponerse y visualizarse en mapas sin que el espectador se confunda o abrume con la pantalla.

Este problema se expresa agudamente en el campo de los servicios y herramientas basados ​​en mapas o en la ubicación, donde la naturaleza cada vez más detallada de la información que se muestra, junto con el número potencialmente ilimitado de fuentes de las que se recopilan los datos, se combinan para hacer Es extremadamente difícil mostrar dicha información en un mapa de una manera lógica que sea accesible y útil para los espectadores. Por ejemplo, la gestión de un gran número de personas y equipos implica obtener información oportuna sobre la ubicación, el estado y las posibles condiciones de alarma. Preferiblemente, la gerencia quiere poder observar cuándo y dónde se han producido los eventos programados y cómo han cambiado los horarios y el estado desde las observaciones anteriores, pero hacerlo en sistemas anteriores era difícil, si no imposible, con tantos datos disponibles. Por ejemplo, en el campo de la gestión de flotas, es deseable conocer el estado de los vehículos de una flota, dónde se encuentran actualmente, si los vehículos están funcionando correctamente, etc. Para flotas con cientos o miles de vehículos, dicha información rápidamente se volvió abrumador cuando se accede a través de una interfaz basada en mapas.

Los desarrolladores han intentado facilitar la facilidad de uso de tales pantallas basadas en mapas permitiendo a los espectadores acercar y alejar los mapas en cuestión, sin embargo, esta es a menudo una solución ineficaz ya que el problema de ver una cantidad abrumadora de datos solo se amplifica como el espectador se aleja para obtener una imagen más general de los datos. Como resultado, para dar sentido a los datos mostrados, la única opción del espectador es acercar tanto el mapa que la información importante ya no se muestre en la pantalla. Otros sistemas simplemente funcionan con demasiada lentitud para satisfacer las demandas de la gestión de activos a tiempo completo.

Las presentes realizaciones superan estas y otras deficiencias de la técnica anterior proporcionando sistemas y métodos de zoom inteligente que agrupan información relacionada geográfica o espacialmente para crear superposiciones útiles de datos para facilitar la gestión de dicha información. En algunas realizaciones, la información se refiere a vehículos que se están rastreando. En algunas realizaciones, los sistemas y métodos proporcionan la visualización en tiempo real de información de estado y ubicación para una flota de vehículos rastreados. En algunas realizaciones, los sistemas y métodos permiten la agrupación automática de activos en función de la vista del usuario de un mapa subyacente, que cambia dinámicamente a medida que un usuario acerca o aleja un mapa. En algunas realizaciones, los activos son vehículos que forman parte de una flota gestionada. En algunas realizaciones, los activos están dispuestos lógicamente en grupos de activos similares. En algunas realizaciones, los grupos proporcionan indicaciones gráficas del estado o información de clase de sus activos subyacentes.

En algunas realizaciones, se proporciona un método para visualizar información perteneciente a una pluralidad de activos relacionados geográficamente. El método incluye recibir información perteneciente a una pluralidad de activos seleccionando los activos de la pluralidad de activos que están relacionados geográficamente formando un grupo que comprende los activos seleccionados y proporcionando una interfaz gráfica de usuario que comprende un mapa geográfico y el grupo. En algunas realizaciones, los activos están relacionados geográficamente si la ubicación física de los activos está dentro de un área geográfica definida por un área delimitada virtual. En algunas realizaciones, el grupo se superpone sobre el mapa geográfico en el área geográfica definida por el área delimitante. En algunas realizaciones, el grupo muestra en la interfaz gráfica de usuario al menos un elemento de información perteneciente a los activos seleccionados. En algunas realizaciones, los activos son vehículos. La información perteneciente a la pluralidad de activos se actualiza, en algunas realizaciones, en tiempo real. En algunas realizaciones, al menos un elemento de información es un gráfico que muestra información sobre el estado de los activos seleccionados. En algunas realizaciones, al menos un elemento de información es un gráfico que muestra la información de clase para los activos seleccionados. En algunas realizaciones, al menos un elemento de información es una indicación numérica del número de activos seleccionados. En algunas realizaciones, la interfaz gráfica de usuario muestra el área de delimitación virtual. En algunas realizaciones, el método también incluye agregar el grupo a un nuevo grupo si un usuario de la interfaz gráfica de usuario se aleja del mapa geográfico. En algunas realizaciones, el método también incluye dividir el grupo en una pluralidad de grupos si un usuario de la interfaz gráfica de usuario amplía el mapa geográfico.

En algunas realizaciones, se proporciona un método para dividir un grupo de activos, donde cada activo tiene coordenadas de píxeles basadas en su ubicación geoespacial y en referencia a un área virtual que representa la pantalla de un usuario final. El método, en algunas realizaciones, comprende identificar las coordenadas de cada activo dividiendo el área virtual en ranuras agrupando los activos en las ranuras en función de las coordenadas de píxeles de cada activo y generando nuevos clústeres, donde cada nuevo clúster comprende al menos un activo y comprende cada activo que estaba agrupado en el mismo espacio.

En algunas realizaciones, se proporciona un método para agrupar activos. El método, en algunas realizaciones, incluye generar coordenadas de píxeles para cada activo en función de la ubicación geoespacial del activo y en referencia a un área virtual que representa la pantalla de un usuario final que determina una forma de icono con dimensiones de píxeles específicas para usar en relación con cada activo que consulta datos. estructura con la forma del icono para cada activo agregar un activo como un nuevo clúster en la estructura de datos si el área definida por las dimensiones en píxeles de la forma del icono del activo, cuando se centra sobre las coordenadas de píxeles del activo, no se superpone con el área cubierta por otro clúster en la estructura de datos y agregar un activo a un clúster existente en la estructura de datos si el área definida por las dimensiones en píxeles de la forma del icono del activo, cuando se centra sobre las coordenadas de píxeles del activo, se superpone con el área cubierta por el clúster existente.

BREVE DESCRIPCIÓN DE LOS DIBUJOS

Para una comprensión más completa de las presentes realizaciones, los objetos y las ventajas de las mismas, se hace ahora referencia a las siguientes descripciones tomadas en relación con los dibujos adjuntos en los que:

HIGO. 1 representa un grupo de activos, según una realización.

HIGO. 2 representa un mapa geográfico que comprende una pluralidad de agrupaciones, según una realización.

HIGO. 3 representa características de información adicionales disponibles para el usuario del sistema, según una realización.

HIGO. 4 representa características de información disponibles para el usuario del sistema cuando un grupo contiene una gran cantidad de activos, según una realización.

HIGO. 5 ilustra una lista desplazable de los activos de un grupo, según una realización.

HIGO.6 ilustra la función de los clústeres con referencia a una ubicación geográfica específica, según una realización.

HIGO. 7 ilustra un diagrama de flujo que describe la creación de un grupo, según una realización.

HIGO. 8 representa un ejemplo gráfico de los pasos llevados a cabo en la FIG. 7, según una forma de realización.

HIGO. 9 representa un proceso para dividir un grupo, según una realización.

HIGO. 10 ilustra elementos que se mueven de ranuras impares a ranuras pares durante el proceso de división, según una realización.

HIGO. 11 representa un grupo de muestras con referencia a una pantalla de visualización que se va a dividir, según una realización.

HIGO. 12 representa la ubicación de los elementos de un grupo con referencia a una pantalla de visualización, según una realización.

HIGO. 13 ilustra un grupo que se divide, según una realización.

HIGO. 14 muestra la creación de nuevos clústeres a partir de un único clúster anterior, según una realización.

HIGO. 15 ilustra tres nuevos grupos después de la finalización del proceso de división, según una realización.

HIGO. 16 representa un diagrama de sistema general de componentes y dispositivos utilizados en relación con las realizaciones.

Los caracteres de referencia correspondientes indican los componentes correspondientes en las diversas vistas de los dibujos. Los artesanos expertos apreciarán que los elementos de las figuras están ilustrados por motivos de simplicidad y claridad y no necesariamente han sido dibujados a escala. Por ejemplo, las dimensiones, el tamaño y / o la ubicación relativa de algunos de los elementos de las figuras pueden exagerarse con respecto a otros elementos para ayudar a mejorar la comprensión de diversas realizaciones de la presente invención. Además, los elementos comunes pero bien entendidos que son útiles o necesarios en una realización comercialmente factible a menudo no se representan para facilitar una vista menos obstruida de estas diversas realizaciones de la presente invención. También se entenderá que los términos y expresiones usados ​​en este documento tienen el significado ordinario que los expertos en las áreas respectivas de investigación y estudio les otorgan habitualmente a dichos términos y expresiones, excepto cuando se hayan establecido otros significados específicos en el presente documento.

DESCRIPCIÓN DETALLADA DE LOS DIBUJOS

Otras características y ventajas de las presentes realizaciones, así como la estructura y el funcionamiento de las diversas realizaciones, se describen en detalle a continuación con referencia a las Figs. 1-16. Las realizaciones se describen en el contexto de un sistema para mostrar grupos de vehículos rastreados en un mapa. No obstante, un experto en la materia reconoce fácilmente que estas realizaciones son aplicables en numerosos campos y contextos que requieren la visualización de múltiples piezas dispares de información de una manera útil, y en particular con respecto a la información con componentes geográficos o especiales, como real. información del patrimonio, información de paquete o entrega, información de comunicaciones, etc.

Refiriéndonos ahora a la FIG. 1, se muestra un grupo 100. El racimo 100 proporciona información sobre los activos subyacentes en una ubicación geográfica o espacial específica, definida por un área delimitante 102. El racimo 100, en algunas realizaciones, comprende un valor numérico 104 y un gráfico interior 106. En algunas realizaciones, el grupo 100 comprende un gráfico exterior 108, o cuadros adicionales o información gráfica (no representada). Por ejemplo, si los activos son vehículos, entonces el valor numérico 104 muestra la cantidad de vehículos dentro del grupo 100y los gráficos 106 y 108 proporcionar información detallada sobre la clase y el estado de esos vehículos. Gráfico interior 106, por ejemplo, contiene información de clase codificada por colores para cada activo en el clúster 100. Por ejemplo, en el contexto de los vehículos, los vehículos pueden clasificarse como semirremolques, camionetas, grúas móviles, automóviles u otro tipo de vehículo, cada uno con un color único. Gráfico interior 106 Por lo tanto, mostrará un gráfico circular codificado por colores que representa el porcentaje de vehículos en el grupo. 100 que componen cada clase, Cuadro externo 108, por ejemplo, muestra información de estado codificada por colores para cada activo en el clúster 100. Por ejemplo, en el contexto de los vehículos, los vehículos pueden estar en movimiento, detenidos, inactivos, fuera de contacto o tener otro estado dependiendo de la aplicación específica. Gráfico exterior 108 Por lo tanto, mostrará un gráfico circular codificado por colores que representa el porcentaje de vehículos en el grupo. 100 con cada estado dado. La clase específica y la información de estado que se representará en los gráficos. 106 y 108, así como los colores asignados a dicha información, son configurables por el usuario del sistema utilizando métodos conocidos. Además, el tamaño, la forma y la configuración del grupo 100 también es modificable. Por ejemplo, en algunas realizaciones, los grupos reciben diferentes formas para indicar que los grupos pertenecen a diferentes tipos de activos o diferentes tipos de información. Por ejemplo, un primer grupo puede ser redondo, lo que indica que pertenece a vehículos, y un segundo grupo puede ser cuadrado, lo que indica que se refiere a trabajos que se realizarán durante un día. A medida que se completan los trabajos, la información de estado en color del grupo cambia, lo que refleja el progreso realizado en el trabajo. En algunas realizaciones, las esquinas de un cuadrado u otro grupo angular cambian de color. Solo para facilitar la comprensión, la presente solicitud generalmente describe los grupos de este documento como círculos o cuadrados, con gráficos circulares internos y externos.

La información en el clúster 100 se actualiza, en algunas formas de realización, en tiempo real. Por ejemplo, cuando un vehículo sale o entra en el área delimitada 102, el valor numérico 104 y gráficos 106 y 108 se actualizan en consecuencia. Si cambia el estado de un activo, el gráfico exterior 108 asimismo se actualiza. Estas actualizaciones en tiempo real son configurables por el usuario del sistema y pueden depender de los sistemas de comunicación de los activos. Por ejemplo, es posible que un usuario del sistema solo desee actualizaciones una vez cada cinco minutos. Alternativamente, un activo puede programarse para que solo proporcione su ubicación y otra información de estado una vez cada treinta segundos, o solo cuando cambie su estado o ubicación. Los expertos en la técnica reconocerán, por tanto, la información mostrada por el grupo 100 puede, en algunas realizaciones, retrasarse basándose en estas contingencias o preferencias. Alternativamente, la actualización de la información se puede realizar, por ejemplo, cuando se cambia el tamaño del mapa.

En algunas formas de realización, no todos los activos en un área límite específica 102 están incluidos en el clúster 100. Por ejemplo, el clúster 100 solo puede incluir activos de un cierto tipo, como solo vehículos. En otras realizaciones, el grupo 100 sólo puede incluir activos propiedad de una entidad específica, como una única empresa de alquiler de coches. Los activos específicos que se incluyen en un clúster 100 puede seleccionarse en función de numerosos atributos, como el estado del activo, la clase, los atributos físicos, el tipo, la información de propiedad, etc. En algunas realizaciones (no mostradas), el área delimitante 102 comprende más de un grupo. Cada uno de los conglomerados puede comprender activos que, de no ser por las preferencias del usuario especificadas al sistema, estarían incluidos en el mismo conglomerado, o activos que, por diferentes atributos, pertenecen a diferentes conglomerados. En aras de la claridad, la siguiente discusión solo analiza un solo grupo 100 estar dentro de una sola área delimitante 102. El área limítrofe 102, como se muestra, es un cuadrado o un rectángulo, pero en otras realizaciones se utilizan otras formas, tales como polígonos, círculos, triángulos u otras formas regulares o irregulares o cualquier combinación de las mismas. Además, en algunas realizaciones, el área delimitante 102 puede tener diferentes colores o niveles de opacidad. Alterando el valor del canal alfa (la opacidad) y / o el color del área delimitante 102, se puede mostrar información adicional perteneciente a cada área delimitada 102 se muestra en un mapa, como qué área delimitada 102 contiene más activos.

Refiriéndonos ahora a la FIG. 2, representado es un mapa geográfico 200 que comprende una pluralidad de grupos 100a-norte, según una realización. Como se muestra, el mapa 200 muestra la totalidad de los Estados Unidos continentales. Debido al alto nivel del mapa 200, cada racimo 100 y su área de delimitación correspondiente 102a-norte cubre una gran área de los Estados Unidos y, por lo tanto, incluye una cantidad relativamente grande de activos. Por ejemplo, cluster 100a, cuyo cuadro delimitador 102a abarca Los Ángeles, contiene más de cuatro mil quinientos activos. En otras realizaciones, sin embargo, un área grande puede abarcar solo un pequeño número de activos.

Refiriéndonos ahora a la FIG. 3, se muestran características informativas adicionales disponibles para el usuario del sistema, de acuerdo con una realización. Como se muestra, cuando un usuario selecciona un clúster 100, como cuando un usuario apunta su mouse sobre el clúster 100, hace clic en el clúster 100, utiliza una pantalla táctil para seleccionar el grupo 100 o de otra manera selecciona o interactúa con el clúster 100, el sistema proporciona al usuario cierta información relativa a los activos en el clúster 100. Por ejemplo, se muestra un cuadro emergente 300 con información de activos detallada para cada activo en el clúster 100. El cuadro emergente 300 muestra, por ejemplo, el nombre, el estado y la clase de cada activo en el clúster 100y ofrece la opción para que el usuario vea el historial de cada activo haciendo clic en los enlaces "Hoy" o "Ayer". En algunas realizaciones, los iconos escalados representativos de los activos se representan en el mapa para proporcionar al usuario una identificación visual de dónde se encuentran los activos. En algunas realizaciones, el usuario también puede hacer clic en cada activo en el cuadro emergente. 300 para ser dirigido a la ubicación específica del activo en el mapa. La realización discutida con referencia a la FIG. 3 es útil para clústeres 100 con pocos activos, como, por ejemplo, cuatro o menos activos, pero puede proporcionar demasiada información detallada cuando un clúster tiene muchos activos.

Refiriéndonos ahora a la FIG. 4, se muestran características informativas adicionales disponibles para el usuario del sistema cuando un clúster 100 contiene una gran cantidad de activos, según una realización. Como se muestra, cuando un usuario selecciona un clúster 100, el sistema proporciona al usuario un cuadro emergente 400 Mostrar cierta información de alto nivel relacionada con los activos del clúster. 100, como el estado general y la información de categoría sobre los activos. En algunas realizaciones, el grupo 100 además muestra un signo "+" o una notación similar 402, lo que significa aún más información relacionada con los activos en el clúster 100 está disponible. Refiriéndonos ahora a la FIG. 5, cuando el usuario hace clic en el signo "+" 402, en una realización, una lista desplazable 502 de los activos del clúster se muestra al usuario en el cuadro emergente 400. El usuario puede seleccionar un activo de la lista desplazable 502, cuya información detallada se muestra a continuación en un cuadro emergente 400 de manera similar a la representada en la FIG. 3. De esta manera, la información detallada perteneciente a cada activo en el clúster 100 está disponible para el usuario, incluso cuando el clúster 100 tiene una gran cantidad de activos.

Refiriéndonos ahora a las FIGS. 6 a y 6B, la función de los conglomerados con referencia a una ubicación geográfica específica, según una realización, se analiza ahora con más detalle. Representado en la FIG. 6 a es un racimo 600 con un área delimitante 602 que abarca gran parte de Eureka, California. Como es evidente, el grupo 600 comprende 34 activos. Cuando un usuario acerca el clúster 600, como se muestra en la FIG. 6 B, grupo 600 se reemplaza con cuatro nuevos clústeres 604-610. Colectivamente, los nuevos clústeres 604-610 comprenden los mismos activos que el clúster 600. Nuevos clústeres 604-610, sin embargo, están posicionados con mayor precisión en el mapa para reflejar la ubicación de sus activos subyacentes. Por tanto, como se muestra en la FIG. 6 B, un usuario puede ver que hay 3 activos en Fortuna y 2 activos en McKinleyville, con los activos restantes ubicados cerca de Eureka y Fields Landing. Si un usuario acerca el zoom al punto en el que es útil mostrar activos individuales, un clúster se reemplaza con la ubicación precisa en tiempo real de cada activo dentro del clúster. Alternativamente, en algunas realizaciones, un usuario puede hacer clic en uno de los grupos 604-610 para mostrar la ubicación de cada uno de sus activos. Si un usuario se aleja de un área específica, como alejándose de la FIG. 6 B a la FIG. 6 a, o de la FIG. 6 a a la FIG. 2, los grupos se combinan y se vuelven más generales y menos vinculados a una ubicación espacial específica. Por lo tanto, la representación y la reproducción de mapas y sus respectivos grupos es jerárquica.

En algunas realizaciones, la estructura de activos y clusters se puede pensar de la siguiente manera:

La manera en que el sistema agrupa activos (o agrupaciones) y divide agrupaciones como se discutió anteriormente se describe ahora con más detalle, de acuerdo con una realización. Refiriéndose a la FIG. 7, se muestra un diagrama de flujo 700 describiendo en detalle la creación de un clúster. Primero, al paso 702, se determinan las coordenadas de latitud y longitud del elemento que se va a agrupar (ya sea un activo o un grupo) y, utilizando técnicas de reproyección estándar, se convierten en coordenadas de píxeles xey en función de la pantalla del usuario. A continuación, en el paso 704, se crea un cuadro (u otra forma) alrededor de las coordenadas xey indicativas del tamaño del icono del elemento. Por ejemplo, en algunas realizaciones, el icono que ve un usuario para un grupo es de 30 píxeles por 30 píxeles. Así, en el paso 704, se coloca una caja de 30 × 30 píxeles alrededor de las coordenadas xey determinadas para dicho grupo. Al paso 706, se consulta un R-Tree, una estructura de datos bien conocida familiar para los expertos en la técnica, con la caja para determinar si la caja ya está en el sistema. Como se muestra en el resultado 708, si la caja ya es parte de un grupo existente en el sistema, la caja y su elemento se agregan a ese grupo. De lo contrario, como se muestra en el resultado 710, la caja y su elemento se agregan como un nuevo grupo. El proceso anterior se repite para cada elemento que se agrupará. Si bien las realizaciones se describen en este documento con referencia a un R-Tree, los expertos en la técnica reconocerán que se pueden usar otros tipos de árboles y estructuras de datos para implementar otras realizaciones, y que el tipo y la configuración de tales estructuras de datos dependerán , por ejemplo, en la aplicación y funcionalidad específicas deseadas.

Refiriéndonos ahora a las FIGS. 8 a-D, se muestra un ejemplo gráfico de los pasos llevados a cabo en el diagrama de flujo 700, según una realización. Como se muestra en la FIG. 8 a, y como se describe con referencia al paso 702, activos 100a-100C con latitudes y longitudes del mundo real se reproyectan en coordenadas de píxeles xey en función de la pantalla de un usuario 800. En la Fig. 5 B, y de acuerdo con el paso 704, una caja u otra forma de icono 802a-C se crea alrededor de cada activo 100a-C. De acuerdo con los pasos 706-710, cada caja 802a-C luego se utiliza para consultar el R-Tree. El R-Tree se consulta primero con la casilla 802a. Dado que el R-Tree está vacío, el R-Tree no devolverá un resultado, y el cuadro 802a se agrega al R-Tree como un nuevo clúster 804a, como se muestra en la FIG. 8 C. A continuación, se consulta el R-Tree con el recuadro 802B. Como se muestra en la FIG. 8 B, ya que no hay superposición entre el cuadro 802a (que ya está en el R-Tree) y el cuadro 802B, el R-Tree nuevamente no devolverá un resultado, y el cuadro 802B se agrega al R-Tree como un nuevo clúster 804B. A continuación, se consulta el R-Tree con el recuadro 802C. Como se muestra en la FIG. 5 B, hay superposición entre el cuadro 802B y 802C. Por lo tanto, el R-Tree devolverá el clúster 804B como resultado, y caja 802C se agrega ese grupo, como se muestra en la FIG. 8 C. Como se muestra en la FIG. 8 C, grupo 804B se expande para incluir cajas 802B y 802C. Como resultado de los pasos anteriores, los dos grupos 804a-B se muestran al usuario, con los cuadros subyacentes y la información de activos ya no se muestra, como se muestra en la FIG. 8 D.

En algunas realizaciones, el método descrito con referencia a las Figs. 7 y 8 pueden producir clústeres con demasiados elementos (ya sea demasiados activos u otros clústeres). Para hacer que los clústeres que se han creado sean más utilizables, los clústeres se dividen a partir de entonces en clústeres más pequeños y utilizables. Al dividir los grupos, la información contenida en los grupos se distribuye, en algunas realizaciones, de manera más uniforme a través de la vista de la pantalla del usuario.

En algunas realizaciones, los grupos se dividen si son horizontal o verticalmente más grandes que una variable definida M (tamaño máximo del grupo). Esta variable, por ejemplo, se basa en la resolución de la pantalla del usuario y en el tamaño de los iconos que normalmente se utilizan con el sistema. En una pantalla estándar que utiliza iconos de 32 píxeles de ancho, M, en algunas realizaciones, se establece en 100 píxeles. Los expertos en la técnica reconocerán que otros valores de M pueden ser óptimos, dependiendo de la resolución y el tamaño de la pantalla del usuario, el tamaño de los iconos utilizados en conexión con el sistema u otras variables.

Si se va a dividir un grupo, entonces el grupo se divide tanto horizontal como verticalmente. Los valores máximos de píxeles verticales y horizontales para los nuevos clústeres se basan, en algunas realizaciones, en las siguientes fórmulas:
Yseparar= M−2 (ICONOancho)
Xseparar= Yseparar/2+ Yseparar
Donde Yseparar es el valor máximo de píxel horizontal y Xseparar es el valor de píxel vertical máximo, y el ICONOancho es el ancho, en píxeles, de los íconos de activos o clústeres. Las fórmulas anteriores tienen en cuenta las dimensiones de los iconos para garantizar que los grupos no se superpongan en la pantalla de un usuario. Según lo anterior, donde M se establece en 100 píxeles y los íconos son 32 píxeles, cada nuevo grupo debe tener menos de 54 píxeles de ancho y menos de 36 píxeles de alto.

Refiriéndonos ahora a la FIG. 9, se muestra un proceso para dividir un clúster 900 según una realización. Por ejemplo, dado un grupo con un ancho de 132 píxeles de ancho, el grupo se divide primero horizontalmente en el paso 902 en el número mínimo de secciones para las que cada sección es menor que Xseparar, (54 píxeles) de ancho. Por lo tanto, el grupo se divide primero en tres secciones, cada una con un ancho de 44 píxeles. Como se muestra en el paso 904, cada sección obtenida en el paso 902 luego se divide horizontalmente en secciones menores que Yseparar (36 píxeles) de altura. Como resultado, el clúster original 900 es, dividido en 12 ranuras 906a-l, cada uno con unas dimensiones de 44 píxeles por 30 píxeles. Al paso 906, se crean los nuevos clústeres. En algunas realizaciones, las ranuras pares se retienen (es decir, ranuras 908a, 908C, 908mi, 908gramo, 908I, y 908k), mientras que las ranuras impares se descartan. Cualquier elemento en las ranuras con números impares se mueve una ranura hacia arriba (es decir, elementos en la ranura 908B se mueven a la ranura 908a, y así). Las ranuras retenidas se convierten en los nuevos clústeres.

Refiriéndonos ahora a la FIG. 10, se muestra un ejemplo de elementos que se mueven desde ranuras impares 908B y 908D para igualar las ranuras 908a y 908C, según una realización. Como se muestra, las ranuras impares 908B y 908D se dividen por la mitad horizontalmente, como se muestra con las líneas punteadas 1002a y 1002B. Elementos en los espacios impares 908B y 908D que están por encima de sus respectivas líneas de puntos 1002a y 1002B se mueven a las ranuras con números pares de arriba, mientras que los elementos en las ranuras con números impares 908B y 908D que están debajo de sus respectivas líneas de puntos 1002a y 1002B se mueven a las ranuras pares a continuación. Donde, como en el caso de slot 908D, no hay una ranura de número par debajo de la ranura de número impar, todos los elementos en la ranura de número impar se mueven a la ranura de número par de arriba. Por lo tanto, como se muestra, todos los elementos en ranuras impares 908D se mueven a la misma ranura 908C.

Refiriéndonos ahora a la FIG. 11, se muestra un grupo de muestra 1100, con referencia a una pantalla de visualización 1102, que se va a dividir, según una forma de realización. Como es evidente, cluster 1100 comprende 20 elementos (activos o agrupaciones más pequeñas). Como se muestra en la FIG. 12, los elementos del clúster (indicados por X en la pantalla 1102) se encuentran cerca de ambos bordes verticales de la pantalla 1102. Como se muestra en la FIG. 13, racimo 1100 (no mostrado) se divide según las realizaciones discutidas anteriormente con referencia a las Figs. 9 y 10. Los elementos en ranuras impares (1302B, 1302D, y 1302F) se mueven a las ranuras pares 1302a, 1302C, y 1302mi. Como se muestra en la FIG. 14, tres nuevos clústeres resultantes 1402a-C son creados. El resultado final, como se muestra en la FIG. 15, son nuevos clústeres 1402a-C se muestra al usuario en lugar del clúster anterior, mientras que los elementos subyacentes en los clústeres 1402a-C están ocultos a la vista.

Refiriéndonos ahora a la FIG. 16, se muestra un diagrama de sistema general 1600 de componentes y dispositivos usados ​​en conexión con los sistemas y métodos anteriores, según una realización. Cada activo (no mostrado) comprende un dispositivo de comunicación 1602a-C. Por ejemplo, un vehículo puede tener un pequeño dispositivo transceptor instalado en su cabina, o una persona puede llevar un teléfono inteligente o un dispositivo similar con capacidad para determinar la ubicación. Tales dispositivos 1602a-C puede utilizar, por ejemplo, GPS, sistemas inerciales (giroscopio) o tecnologías basadas en redes celulares, como la triangulación, para determinar la información de latitud y longitud del activo.

Los dispositivos pueden proporcionar la ubicación, el estado, la alarma, la clase, la velocidad y otros tipos de información pertinente relacionada con el activo de un dispositivo. 1602a-C a un sistema de procesamiento central 1604. En algunas realizaciones, los dispositivos 1602a-C comunicar dicha información en tiempo real. En otras realizaciones, dicha información se transmite periódicamente, a intervalos aleatorios o en una condición de alarma. Dichas transmisiones se realizan, en algunas realizaciones, a través de un sistema de comunicación inalámbrico o basado en satélite y / o por Internet o una red de área amplia similar. 1606, al sistema de procesamiento central 1604.

    • Información recibida por los dispositivos 1602a-C se almacena en las bases de datos 1610.
    • Los servidores web 1608 recibir solicitudes de actualización de un cliente 1612a-C a través de Internet o una red de área amplia similar 1614
    • El sistema de procesamiento central 1604 accede a la información pertinente de la base de datos 1610 y realiza los procesos de agrupación y entrega de mapas discutidos anteriormente en respuesta a las solicitudes recibidas, y
    • Los servidores web 1604 transmitir los datos resultantes al cliente 1612a-C a través de la red 1614.

    En algunas realizaciones, el sistema de procesamiento central 1604 utiliza capacidades y / o tecnología de computación distribuida o en la nube. En algunas realizaciones, el sistema de procesamiento central 1604 comparte responsabilidades informáticas con un cliente solicitante 1612a-C. En otras realizaciones, el sistema de procesamiento central 1604 es responsable de todas o sustancialmente todas las responsabilidades informáticas. Un beneficio de las disposiciones anteriores, en algunas realizaciones, es que la cantidad de datos que deben transferirse desde el servidor web 1608 al cliente 1612a-C es muy pequeño. En algunas realizaciones, se transfiere a los clientes poca o ninguna de la información del activo subyacente. 1612a-C. En estas realizaciones, simplemente se transfiere a los clientes la información de grupo de alto nivel que muestra la información de activos agregada (por ejemplo, gráficos, valor numérico y / o información del área delimitante, como la que se analiza con referencia a la Figura 1). 1612a-C. Estas realizaciones hacen posible tratar con un número prácticamente ilimitado de elementos, incluso cuando se tiene una capacidad de red limitada y / o un cliente de hardware. 1612a-C con capacidad de procesamiento limitada. Los expertos en la materia reconocerán que las redes 1606 y 1614 pueden ser las mismas o diferentes redes. En algunas realizaciones, ambas redes serán Internet. En otras formas de realización, las redes 1606 y 1614 puede comprender redes privadas y / o públicas.

    Un cliente 1612a-C puede ser, por ejemplo, una computadora personal o un teléfono inteligente. En otras formas de realización, un cliente 1612a-C puede ser en sí mismo un servidor o una computadora central que está configurada para transmitir la información recibida por el sistema de procesamiento central 1640 a los clientes del usuario final (no se muestra). En algunas formas de realización, los clientes 1612a-C comprenden una interfaz gráfica de usuario que se muestra en una ventana de navegador de una aplicación de navegador. Tal arreglo permite al usuario final de un cliente 1612a-C para ver fácilmente el mapa, la información geográfica, la información del clúster y los datos de activos subyacentes proporcionados por el sistema de procesamiento central 1604. Por tanto, el sistema y sus capacidades de zoom inteligente pueden ser utilizados por cualquier usuario con un dispositivo informático cliente capaz de ejecutar un navegador web y acceder a una red de área amplia, como Internet.

    En algunas realizaciones, la interfaz gráfica de usuario se implementa utilizando programación HTML, JavaScript, CSS, JSON y / o XML. Dicha programación puede ser compatible con AJAX. En algunas realizaciones, el sistema de procesamiento central crea una página HTML dinámica o contenido XML. 1604 en respuesta a una solicitud de un cliente 1612a-C. Tal interacción, en algunas realizaciones, procede del usuario de un cliente. 1612a-C hacer llamadas XML API y / o Java Applet al servidor web 1608 del sistema de procesamiento central 1604. Usando las técnicas discutidas anteriormente, el sistema de procesamiento central 1604 Genera clústeres, información de activos u otra información solicitada por el usuario, y proporciona dicho contenido, junto con los datos de mapas correspondientes, al cliente. 1612a-C. La interfaz gráfica de usuario de la ventana del navegador muestra posteriormente dicho contenido para que lo vea un usuario.

    El sistema de zoom inteligente y su interfaz gráfica de usuario se pueden implementar utilizando tecnologías distintas a las descritas. Por ejemplo, en una realización, la interfaz gráfica de usuario se implementa como un objeto de Adobe Flash. En algunas realizaciones, donde la interfaz gráfica de usuario se implementa usando Flash, la interfaz gráfica de usuario está incrustada en una página HTML y se ejecuta mediante un complemento compatible con Flash para la aplicación de navegador. El objeto Flash almacena archivos de datos y / o se comunica con el sistema de procesamiento central para recibir información actualizada de mapas, grupos y activos. En otras realizaciones, se utilizan tecnologías como Java, Java Applets, Synchronized Multimedia Integration Language (SMIL) o Microsoft Silverlight para implementar la interfaz gráfica de usuario e interactuar con el sistema de procesamiento central. 1604. En otras realizaciones, la interfaz gráfica de usuario es ejecutada por un reproductor independiente externo a la aplicación del navegador u otro programa especializado usado para acceder al sistema de procesamiento central. 1604.

    Como es evidente, los métodos y sistemas de agrupación de zoom inteligente descritos permiten diversas herramientas e interfaces de usuario para permitir que cualquier número de usuarios finales visualicen cientos o miles de activos y su ubicación y estado en tiempo real. Al utilizar los métodos y sistemas de zoom inteligente anteriores, una flota de vehículos u otro administrador de activos puede determinar rápida y fácilmente el estado de cientos de activos, identificar problemas con los activos, reasignar activos según sea necesario y tomar otras decisiones administrativas de una manera que no es posible. utilizando otros métodos y sistemas.

    Una realización adicional es un código legible por ordenador o instrucciones de programa en uno o más medios legibles por ordenador capaces de llevar a cabo los procesos descritos anteriormente. Un medio legible por computadora es cualquier dispositivo de almacenamiento de datos que sea capaz de almacenar datos, o que permita que los datos almacenados sean leídos por un sistema informático. Los ejemplos incluyen unidades de disco duro (HDD), tarjetas de memoria flash, como tarjetas CF, tarjetas SD, tarjetas MS y tarjetas xD, almacenamiento conectado a la red (NAS), memoria de solo lectura (ROM), memoria de acceso aleatorio (RAM) , CD-ROM, CD-R, CD-RW, DVD, DVD-R, DVD-RW, medios de almacenamiento holográficos, cintas magnéticas y otros dispositivos de almacenamiento de datos ópticos y no ópticos. El medio legible por ordenador también puede estar distribuido en múltiples sistemas o dispositivos informáticos que están acoplados o conectados en red de otro modo y son capaces de presentar una vista única a un usuario del medio.

    Otra realización más es un sistema informático o dispositivo similar configurado para acceder a un código legible por computadora o instrucciones de programa desde un medio legible por computadora y para ejecutar instrucciones de programa usando una o más CPU para llevar a cabo las realizaciones descritas. Dicho sistema informático puede ser, entre otros, una computadora personal típica, microcomputadoras, un dispositivo de mano como un teléfono celular, PDA, BlackBerry o un sistema más avanzado, como un grupo de computadoras, un sistema informático distribuido, un servidor al que se accede a través de dispositivos con cable o inalámbricos, una computadora central o una supercomputadora. En otra realización, el servidor o servidores del sistema también se almacenan y se accede a ellos desde el medio legible por ordenador. En otras realizaciones, se implementan utilizando hardware.

    En algunas realizaciones, parte o todo el contenido almacenado en el medio legible por ordenador se transmite a través de una red similar. En otras realizaciones, el sistema de procesamiento central genera señales o instrucciones basadas en los resultados de las instrucciones del programa y / o el contenido del medio legible por computadora.

    En otras realizaciones, los sistemas y métodos anteriores son aplicables a entornos distintos a los de dos dimensiones. Por ejemplo, se pueden implementar conglomerados, mapas, áreas limítrofes y activos tridimensionales utilizando las mismas técnicas y métodos discutidos anteriormente.

    La invención se ha descrito en el presente documento utilizando realizaciones específicas con fines ilustrativos únicamente. Sin embargo, resultará fácilmente evidente para un experto en la técnica que los principios de la invención pueden materializarse de otras formas. Por lo tanto, la invención no debe considerarse limitada en su alcance a las realizaciones específicas descritas en el presente documento.


    HTML personalizado dentro del mapa de folletos: sistemas de información geográfica

    Los procedimientos de SUGI y SAS Global Forum tienen derechos de autor de SAS Institute Inc. Todos los derechos están reservados. Se prohíbe cualquier reproducción no autorizada.
    SAS® y todos los demás nombres de productos o servicios de SAS Institute Inc. son marcas comerciales registradas o marcas comerciales de SAS Institute Inc. en EE. UU. Y otros países.
    Copyright © 1999-2021 Lex Jansen. Reservados todos los derechos.
    La información de este sitio se proporciona únicamente con fines de referencia general. Si bien se hace todo lo posible para garantizar que el sitio esté actualizado y sea preciso, Lex Jansen no garantiza, ni acepta ninguna responsabilidad u obligación por la precisión o integridad del contenido o por cualquier pérdida que pueda surgir de la confianza en información contenida en este sitio. Los enlaces a otros sitios se proporcionan para su conveniencia, pero Lex Jansen no acepta ninguna responsabilidad por el contenido de esos sitios o de cualquier sitio externo que enlace a este sitio. Las referencias a cualquier producto comercial, proceso, servicio o corporación específicos también son solo para información y no constituyen respaldo, recomendación o favoritismo por parte de Lex Jansen.


    HTML personalizado dentro del mapa de folletos: sistemas de información geográfica

    Inconvenientes: Descubrí que se producían cambios inesperados cuando intentaba explorar las opciones de DataWrangler. Tenía que hacer clic constantemente en "borrar" para restablecer. Y no todas las sugerencias son útiles ("promocionar fila a encabezado" parecía una sugerencia extraña cuando la fila estaba en blanco) o fáciles de entender ("doble división 1 usando 2 como clave").

    Nivel de habilidad: Principiante avanzado

    Se ejecuta en: Cualquier navegador web para Data Wrangler Windows o macOS X para Trifacta

    Aprende más: Hay un screencast en la página de inicio de Data Wrangler. Además, consulte esta publicación sobre el uso de DataWrangler para formatear datos (del blog de Tableau Public). Para obtener más información sobre Trifacta, consulte su página de recursos.

    OpenRefine (anteriormente Google Refine)

    Que hace: OpenRefine se puede describir como una hoja de cálculo con esteroides para echar un primer vistazo tanto al texto como a los datos numéricos. Al igual que Excel, puede importar y exportar datos en varios formatos, incluidos archivos de texto separados por comas y tabuladores.

    CAPTURA DE PANTALLA DEL SOFTWARE OPENREFINE

    OpenRefine ayuda a limpiar datos desordenados

    OpenRefine presenta varios algoritmos integrados que encuentran elementos de texto que deben agruparse. Después de importar sus datos, puede seleccionar editar celdas - & gt cluster y editar y elija qué algoritmo desea utilizar. Una vez que se ejecuta OpenRefine, usted decide si acepta o rechaza cada sugerencia. Por ejemplo, podría decir sí a la combinación de Microsoft y Microsoft Corp., pero no a la combinación de Coach Inc. con CQG Inc. Si ofrece muy pocas o demasiadas sugerencias, puede cambiar la fuerza de la función de sugerencias.

    También hay opciones numéricas que ofrecen una descripción general rápida y sencilla de las distribuciones de datos. Esta funcionalidad puede revelar anomalías que podrían ser el resultado de errores de entrada de datos, como $ 800,000 en lugar de $ 80,000 para una entrada de salario, o podría exponer inconsistencias, como diferencias en la forma en que se informan los datos de compensación de entrada a entrada, con algunos muestran, digamos, salarios por hora y otros muestran el pago semanal o los salarios anuales.

    Más allá del mantenimiento de los datos, OpenRefine ofrece algunas herramientas de análisis útiles, como la clasificación y el filtrado.

    Que es genial: Una vez que se acostumbre a qué comandos hacen qué, esta es una poderosa herramienta para la manipulación y el análisis de datos que logra un buen equilibrio entre funcionalidad y facilidad de uso. La lista de deshacer / rehacer de cada acción que ha realizado le permite retroceder cuando sea necesario. También puede almacenar historiales de comandos para ejecutarlos nuevamente. Y las funciones de texto manejan expresiones regulares de sintaxis Java, lo que le permite buscar patrones (como, por ejemplo, tres números seguidos de dos dígitos), así como cadenas de texto y números específicos.

    Finalmente, si bien esta es una aplicación basada en navegador, funciona con archivos en su escritorio, por lo que sus datos permanecen locales.

    Inconvenientes: Si tiene un gran conjunto de datos, reserve algo de tiempo en su día para revisar todos los cambios sugeridos por Refine, ya que puede llevar un tiempo. Y, dependiendo del conjunto de datos, esté preparado cuando busque elementos de texto para fusionar: es probable que obtenga muchos falsos positivos o problemas perdidos, o ambos.

    Nivel de habilidad: Principiante avanzado. El conocimiento de los conceptos de análisis de datos es más importante que la destreza técnica. Los usuarios de Excel que comprenden las necesidades de limpieza de datos deben sentirse cómodos con esto.

    Se ejecuta en: Windows, macOS X (si parece que no hace nada después de cargar en una Mac, apunte un navegador manualmente a http://127.0.0.1:3333/), Linux

    Aprende más: Estos tres screencasts brindan una buena descripción general de por qué y cómo usarías Refine. También hay documentación bastante detallada en GitHub.

    Análisis estadístico

    A veces es necesario combinar la representación gráfica de sus datos con análisis numéricos más importantes.

    El Proyecto R para Computación Estadística

    Que hace: R comenzó su vida como un lenguaje de análisis estadístico con soporte incorporado para gráficos y manejo de ciertos formatos de datos comunes, como filas y columnas similares a hojas de cálculo. Miles de paquetes complementarios más adelante, también se usa para mapeo, paneles, aplicaciones web interactivas y más.

    El Proyecto R para Computación Estadística proporciona una amplia gama de opciones de análisis de datos.

    Que es genial: Hay una gran cantidad de funcionalidad en R, que incluye una gran cantidad de opciones de visualización, así como análisis numérico y espacial. Y la comunidad de R está agregando al lenguaje todo el tiempo, además de ser receptiva y útil en general. Divulgación: soy un fan desde hace mucho tiempo.

    Inconvenientes: El hecho de que R se ejecute en la línea de comandos significa que los usuarios tendrán que tomarse el tiempo para aprender qué comandos hacen qué, y no todos los usuarios se sentirán cómodos con una interfaz de solo texto. Algunos todavía se quejan de que el lenguaje es lento, aunque los entusiastas responden que esto generalmente se puede solucionar con un mejor código y herramientas de big data de clase empresarial como Microsoft R Server.

    Nivel de habilidad: Intermedio a avanzado. La comodidad con las indicaciones de la línea de comandos y el conocimiento de las estadísticas son imprescindibles para la aplicación principal.

    Se ejecuta en: Linux, macOS X, Unix, Windows

    Aplicaciones y servicios de visualización

    Estas herramientas ofrecen varias opciones de visualización diferentes. Si bien algunos se apegan a tablas y gráficos convencionales, muchos ofrecen una variedad de otras opciones, como mapas de árbol y nubes de palabras. Algunos también ofrecen mapeo, aunque si está interesado en mapas, nuestras secciones sobre GIS / mapeo se enfocan específicamente en eso.

    Tablas dinámicas de Google

    Que hace: Esta es una de las formas más sencillas que he visto de convertir datos en un gráfico o mapa. Puede cargar un archivo en varios formatos diferentes y luego elegir cómo mostrarlo: tabla, mapa, gráfico de líneas, gráfico de barras, gráfico circular, gráfico de dispersión y más. Es personalizable, lo que le permite cambiar los iconos del mapa y las ventanas de información de estilo.

    Google Fusion Tables es una herramienta fácil de usar que facilita la asignación de datos.

    Hay algunas funciones de edición de datos dentro de Fusion Tables, aunque cambiar más de unas pocas entradas de celda individuales puede volverse tedioso rápidamente. También puede unir tablas (lo cual es importante cuando los datos que desea mapear están en varias tablas) y filtrar, ordenar y agregar columnas, etc.

    El mapeo va más allá de la mera colocación de puntos, como muchos de nosotros estamos acostumbrados con Google Maps. Las tablas de fusión también pueden mapear varios polígonos con variaciones de color según los datos subyacentes.

    Google le permite designar sus datos como privados o no listados, así como públicos, aunque sus datos aún residen en los servidores de Google, un beneficio o un inconveniente, dependiendo de si los costos de ancho de banda del servidor o la privacidad de los datos son más importantes para usted.

    Que es genial: Fusion Tables ofrece gráficos y mapas relativamente rápidos, incluidas funciones del sistema de información geográfica (GIS) para analizar datos por geografía. El servicio también geocodifica automáticamente las direcciones, lo que resulta útil cuando se intenta colocar numerosos puntos en un mapa. Esta es una herramienta excelente para principiantes y principiantes avanzados para que se sientan cómodos con la visualización de datos y también es una buena opción para las personas que no programan. Para usuarios más avanzados, hay una API.

    Inconvenientes: La funcionalidad, la personalización y la capacidad de datos son limitadas en comparación con las aplicaciones de escritorio o el código personalizado, y la interacción con grandes conjuntos de datos en el sitio puede ser lenta. Y, aunque Fusion Tables existe desde hace años, Google todavía lo considera un producto experimental.

    Nivel de habilidad: Principiante

    Se ejecuta en: Cualquier navegador web

    Aprende más: Consulte el tutorial de tres minutos de Google sobre cómo hacer un mapa en Google Fusion Tables. Además, hay otros procedimientos en el centro de ayuda de Google Fusion Tables y hay varios tutoriales disponibles. Consulte también la Galería de ejemplos de Fusion Tables.

    Microsoft Power BI

    Que hace: Esta es la plataforma de BI general de Microsoft, con visualización y visualización de datos para muchas fuentes de datos diferentes (sin los límites de filas de Excel), así como un servicio web que permite la transmisión de datos y actualizaciones de datos programadas.

    Creación de un gráfico de barras en Power BI.

    Power BI fue diseñado para un análisis de datos robusto que va más allá de las capacidades naturales de Excel. Con el objetivo de ser simple, ofrece visualizaciones de arrastrar y soltar, así como la capacidad de crear paneles e informes que se actualizan automáticamente. Hay tanto software de escritorio gratuito, que incluye capacidades de gestión de datos y es solo para Windows, como un servicio en la nube de powerbi.com para visualizar datos que pueden ejecutarse en cualquier navegador moderno. A partir de junio de 2017, el uso compartido privado en powerbi.com requiere cuentas de pago, pero los usuarios gratuitos aún pueden publicar visualizaciones públicas y utilizar el software de escritorio.

    Que es genial: Esto es fácil de usar para visualizaciones básicas y creación de informes y facilita bastante la exploración de datos. Manejará archivos demasiado grandes para Excel. La personalización y el filtrado también son bastante sencillos. Ejecuta scripts de R dentro del software de escritorio y puede generar muchas visualizaciones de R.

    Inconvenientes: La personalización puede ser un poco engorrosa y algo limitada. Ir y venir entre el escritorio y el servicio en la nube puede ser un poco confuso al principio. El filtrado de datos también es un poco limitado a veces, aunque Microsoft está agregando nuevas capacidades a la plataforma mensualmente.

    Nivel de habilidad: Principiante

    Se ejecuta en: Windows para el escritorio cualquier navegador web para el servicio

    Tableau Public

    Que hace: Esta herramienta puede convertir datos en cualquier cantidad de visualizaciones, desde simples hasta complejas. Puede arrastrar y soltar campos en el área de trabajo y pedirle al software que sugiera un tipo de visualización, luego personalizar todo, desde etiquetas y sugerencias de herramientas hasta tamaño, filtros interactivos y visualización de leyendas.

    Tableau Public puede convertir los datos en cualquier cantidad de visualizaciones, desde simples hasta complejas.

    Que es genial: Tableau Public ofrece una variedad de formas de mostrar datos interactivos. Puede combinar múltiples visualizaciones conectadas en un solo tablero, donde un filtro de búsqueda puede actuar en numerosos cuadros, gráficos y mapas, también se pueden unir tablas de datos subyacentes. Y una vez que aprendas cómo funciona el software, su interfaz de arrastrar y soltar es considerablemente más rápida que la codificación manual en JavaScript o R para la mayoría de los usuarios, lo que hace que sea más probable que pruebes escenarios adicionales con tu conjunto de datos. Además, puede realizar cálculos fácilmente sobre los datos dentro del software. Tableau ofrece 10 G de almacenamiento para cuentas públicas y 15 millones de filas por libro de trabajo.

    Inconvenientes: En la versión gratuita del software de inteligencia empresarial de Tableau, su visualización y sus datos deben residir en el sitio de Tableau. Siempre que guarda su trabajo, se envía al sitio web público, lo que significa que no puede guardar el trabajo en curso sin correr el riesgo de que se vea antes de que esté listo (aunque el sitio de Tableau no expondrá deliberadamente su trabajo, se basa en la seguridad por oscuridad, por lo que alguien podría ver su trabajo si adivina su URL). Y una vez que se guarda su trabajo, se invita a los espectadores a descargar su libro de trabajo completo con datos. La actualización a una suscripción personal de un solo usuario cuesta $ 35 / mes, la edición profesional cuesta $ 70 / mes.

    La curva de aprendizaje de Tableau es más pronunciada que, digamos, Fusion Tables. Incluso con la interfaz de arrastrar y soltar, tomará más de una hora o dos aprender a usar las verdaderas capacidades del software, aunque puede comenzar a trabajar con gráficos y mapas simples en poco tiempo.

    Nivel de habilidad: Principiante avanzado a intermedio

    Se ejecuta en: Windows macOS X

    Aprende más: Hay varios videos breves de capacitación en el sitio de Tableau, donde también puede encontrar archivos de datos descargables que puede usar para seguir.

    Estudio de datos de Google

    Que hace: Este servicio está diseñado para crear paneles e informes a partir de múltiples fuentes de datos. La atención se centra en las fuentes de Google, como Google Sheets, Google Analytics y BigQuery, pero también se admiten otras fuentes, como las bases de datos MySQL y PostgreSQL.

    CAPTURA DE PANTALLA DEL INFORME DE GOOGLE DATAT STUDIO

    Informe de muestra en Google Data Studio

    Es bastante fácil de usar, ya que ofrece visualizaciones de arrastrar y soltar como series de tiempo, gráficos de barras, tablas, mapas y "tarjetas de puntuación" (una tarjeta que indica una estadística). El estilo incluye una cuadrícula y opciones de alineación, lo que facilita asegurarse de que varios cuadros no estén ligeramente separados en una fila. También puede crear sus propios campos calculados dentro de Data Studio, incluidas fórmulas con algunas docenas de funciones disponibles.

    Que es genial: Relativamente fácil de usar: estaba en funcionamiento después de ver un par de videos tutoriales. Una de las formas más sencillas de crear paneles de Google Analytics para varios sitios web.

    Inconvenientes: Es un producto beta, lo que significa que existe un riesgo superior al promedio de que desaparezca (o deje de ser gratuito). Número limitado de visualizaciones disponibles en comparación con algunas otras opciones. Los datos deben residir en la nube, lo que podría ser un factor decisivo para cierta información confidencial.

    Nivel de habilidad: Principiante

    Se ejecuta en: Cualquier navegador web

    Aprende más: Vea los videos tutoriales de Data Studio de Google.

    Plotly

    Que hace: El servicio web le permite crear y alojar visualizaciones, desde gráficos básicos y diagramas de dispersión hasta gráficos estadísticos como histogramas y diagramas de caja.

    CAPTURA DE PANTALLA DE INTERFAZ PLOTLY

    Editar una visualización de muestra en Plotly

    Plotly tiene como objetivo el análisis estadístico junto con cuadros y gráficos que puede ver en su periódico local. Una cuenta gratuita incluye un archivo privado, así como archivos públicos ilimitados y conexiones a siete tipos de fuentes de datos.

    Plotly también abrió su biblioteca de JavaScript, para aquellos que quieran trabajar con sus datos localmente y hacer más bibliotecas de personalizaciones para Python y R y un cliente para MATLAB. Incluso hay un complemento de Excel gratuito.

    Que es genial: Es relativamente fácil realizar visualizaciones interactivas en el servicio y la tecnología se puede utilizar en una amplia variedad de plataformas.

    Inconvenientes: Incluso con la personalización, las visualizaciones de Plotly tienen un aspecto distintivo que puede no ser para todos. Hay un uso gratuito limitado de datos privados en el servicio.

    Nivel de habilidad: Principiante para experto en servicios web para la mayoría de las bibliotecas de código abierto

    Se ejecuta en: Navegadores web modernos

    Aprende más: Consulta los recursos en el Centro de ayuda de Plotly.

    Escritorio Qlik Sense

    Que hace: Esta herramienta de BI multipropósito puede disputar datos y crear visualizaciones de datos, informes y cuadros de mando interactivos.

    CAPTURA DE PANTALLA DEL TABLERO DE ESCRITORIO QLIK SENSE

    Panel de control de muestra en Qlik Sense Desktop

    La aplicación de escritorio gratuita de Qlik está diseñada para explorar o compartir datos personales en grupos pequeños. Si desea colaborar o compartir, Qlik Sense Cloud es gratuito para compartir con hasta cinco usuarios más.

    Puede preparar los datos antes de cargarlos, crear asociaciones a partir de múltiples fuentes, editar dentro de la aplicación y crear visualizaciones como gráficos combinados y mapas de árbol.

    Que es genial: Esta es una aplicación bastante robusta de forma gratuita y todos los datos se pueden guardar localmente. Las fuentes de datos pueden incluir Apache Hive, REST y Salesforce, así como otros tipos, como bases de datos y hojas de cálculo.

    Inconvenientes: Con el poder viene la complejidad: deberá invertir algo de tiempo en aprender esta aplicación. Algunos de los últimos videos tutoriales de introducción asumen el conocimiento de la versión anterior del producto en lugar de centrarse en los principiantes en la plataforma.

    Nivel de habilidad: Principiante avanzado a intermedio

    Se ejecuta en: Windows de 64 bits

    Que hace: Aunque el sitio web de VIDI lo considera una herramienta para el sistema de gestión de contenido de Drupal, los gráficos creados por el asistente de visualización del sitio se pueden utilizar en cualquier página HTML, sin necesidad de Drupal.

    Cargue sus datos, seleccione un tipo de visualización, haga un poco de selección de personalización y su gráfico, línea de tiempo o mapa estará listo para usar a través del código de inserción generado automáticamente (usando un iframe, no JavaScript o Flash).

    Los gráficos creados por el asistente de visualización de VIDI se pueden utilizar en cualquier página HTML, no se requiere Drupal.

    Que es genial: Esto es fácil de usar, con opciones de mapeo y no es necesario que su visualización y conjunto de datos sean públicos en su sitio web. Hay capturas de pantalla rápidas que explican cada tipo de visualización y varias opciones de personalización de color diferentes.

    Inconvenientes: Sorprendentemente, el asistente de visualización fue más fácil de usar que el código de inserción: mi iframe incrustado no se mostró mientras intentaba obtener una vista previa en el sitio web de VIDI. Necesitaba guardar la visualización e ir a la página "Mi VIDI" para obtener el código de inserción. que realmente funcionó. Además, como con cualquier servicio en la nube, si lo está utilizando para la publicación web, querrá estar seguro de que los servidores del host pueden manejar su tráfico y estarán disponibles más tiempo del que necesita para mostrar los datos.

    Nivel de habilidad: Principiante

    Se ejecuta en: Cualquier navegador web

    Aprende más: La página de inicio de VIDI incluye un enlace a un video tutorial.

    Me tomó menos de cinco minutos crear una muestra: un mapa de terremotos de magnitud 7.0 o más desde el 1 de enero de 2000.

    Informes de Zoho

    Que hace: Zoho Reports puede tomar datos de varios formatos de archivo o directamente de una base de datos y convertirlos en gráficos, tablas y tablas dinámicas, formatos familiares para la mayoría de los usuarios de hojas de cálculo.

    Que es genial: Puede programar importaciones de datos de fuentes en la web. Los datos se pueden consultar mediante SQL y se pueden convertir en visualizaciones, y el servicio está configurado para publicación y uso compartido en la web (aunque si acceden a él más de dos usuarios, necesitará una cuenta paga).

    Zoho Reports proporciona cuadros y gráficos comerciales tradicionales.

    Inconvenientes: Las opciones de visualización son bastante básicas y limitadas. La interacción en vivo con los datos basados ​​en la web puede resultar lenta a veces. Los archivos de datos están limitados a 100.000 filas en la versión gratuita. Encontré la navegación confusa a veces.

    Nivel de habilidad: Principiante avanzado

    Se ejecuta en: Cualquier navegador web

    Aprende más: Hay demostraciones de video y muestras en el sitio web de Zoho.

    Ayuda de código: asistentes, bibliotecas, API

    A veces, nada puede sustituir la codificación de su propia visualización, especialmente si la apariencia que busca no se puede lograr sin una aplicación web o de escritorio existente. Pero eso no significa que deba comenzar desde cero, gracias a una amplia gama de bibliotecas y API disponibles.

    Que hace: Una de las bibliotecas de JavaScript más populares para crear visualizaciones web, D3.js "combina potentes componentes de visualización y un enfoque basado en datos para la manipulación de DOM [documento web]", según el sitio web del proyecto.

    Documentos basados ​​en datos (D3).

    D3.js le permite crear visualizaciones basadas en datos en una página web, lo que permite a los diseñadores crear una amplia gama de visualizaciones interactivas.

    Que es genial: Si puede imaginarlo, es muy probable que pueda implementarlo en D3.js. Un viejo pero bueno de Los New York Times: Comparación de las ofertas de acciones iniciales de Facebook con otras OPI de tecnología.

    Inconvenientes: Esta no es una habilidad trivial de aprender. Necesitará una buena cantidad de conocimientos sobre esta biblioteca de JavaScript y las tecnologías web en general para hacer algo convincente. Para la visualización de datos básica, esto supondrá mucho trabajo para los no iniciados.

    Nivel de habilidad: Experto

    Se ejecuta en: La mayoría de los navegadores modernos

    Aprende más: Consulte la página de tutoriales de D3, que incluye enlaces a algunos tutoriales útiles para principiantes de Scott Murray.

    Exposición

    Que hace: Este derivado del MIT Simile Project está diseñado para ayudar a los usuarios a "crear fácilmente páginas web con funciones avanzadas de búsqueda y filtrado de texto, con mapas interactivos, líneas de tiempo y otras visualizaciones". Facturada como un marco de publicación, la biblioteca de JavaScript permite adiciones fáciles de filtros, búsquedas y más. La página Easy Data Visualization for Journalists ofrece ejemplos del código que se utiliza en varios sitios web de periódicos.

    "Fácil" está en el ojo del espectador: lo que es fácil para los profesionales del MIT que crearon Exhibit puede no ser tan simple para un usuario cuyo nivel de comodidad se detiene en Excel. Como la mayoría de las bibliotecas de JavaScript, Exhibit requiere más codificación manual que servicios como Google Fusion Tables. Por otro lado, Exhibit tiene documentación clara para principiantes, incluso para aquellos sin experiencia en JavaScript.

    Que es genial: Para los que están codificación cómoda, Exhibit ofrece una serie de vistas (mapas, gráficos, gráficos de tiempo, calendarios y más), así como lentes personalizados (formas de formatear un registro individual) y facetas (propiedades que se pueden buscar u ordenar). Es más probable que obtenga la presentación exacta que desea con Exhibit que un servicio web con personalización limitada. Y sus datos se mantienen locales a menos que y hasta que decida publicarlos.

    Inconvenientes: Para los recién llegados que no están acostumbrados a codificar visualizaciones, lleva tiempo familiarizarse con la codificación y la sintaxis de la biblioteca.

    Nivel de habilidad: Experto

    Aprende más: Hay varios ejemplos que puede ver, incluidas las ciudades de EE. UU. Por población y otras.

    Herramientas de gráficos de Google

    Que hace: A diferencia de Google Fusion Tables, que es una aplicación completa e independiente para almacenar datos y generar gráficos y mapas, Chart Tools está diseñado para visualizar datos que residen en otros lugares, como su propio sitio web o dentro de Google Docs.

    Google Chart Tools ofrece un asistente y una API para crear gráficos web a partir de datos.

    La API de herramientas de gráficos accede a una biblioteca de JavaScript de Google para crear gráficos interactivos. (Nota: Google dejó de admitir la creación de gráficos de imágenes estáticas. La API de herramientas de gráficos no se ve afectada).

    La API de visualización incluye varios tipos de gráficos, mapas, tablas y otras opciones.

    Que es genial: La API le permite extraer datos de una hoja de cálculo de Google. Puede crear iconos que combinen texto e imágenes para visualizaciones, como esta nota de pronóstico del tiempo y lo que llama un gráfico "Google-o-meter". La API de visualización también tiene la mejor documentación que he visto para una biblioteca de JavaScript.

    Inconvenientes: La API, al igual que otras bibliotecas de JavaScript, requiere codificación, lo que la convierte en una herramienta de programación más que en una aplicación de inteligencia empresarial para el usuario final. Pero a diferencia de la mayoría de las otras bibliotecas de JavaScript, no tiene acceso al código subyacente y tiene que depender de Google para seguir admitiendo la plataforma.

    Nivel de habilidad: Principiante avanzado a experto

    Se ejecuta en: Cualquier navegador web

    Aprende más: Consulte el Inicio rápido. También hay ejemplos en la Galería de API de visualización de Google.

    Kit de herramientas de JavaScript InfoVis

    Que hace: InfoVis probablemente no se encuentra entre las bibliotecas de visualización de JavaScript más conocidas, pero podría valer la pena echarle un vistazo si está interesado en publicar visualizaciones de datos interactivas en la web.

    Lo que distingue a esta herramienta de muchas otras son los gráficos altamente pulidos que crea a partir de muestras de código básico. El creador de InfoVis, Nicolás García Belmonte, arquitecto senior de software en Sencha Inc., claramente se preocupa tanto por el diseño estético como por el código, y se nota.

    Este resplandor solar de un árbol de directorios muestra algunas de las capacidades de visualización de JavaScript InfoVis Toolkit. Puede ver una versión interactiva más grande en el sitio web de InfoVis.

    Que es genial: Las muestras son magníficas y no hay codificación adicional involucrada para obtener ingeniosos efectos de vuelo. Puede elegir descargar código solo para los tipos de visualización que desea utilizar para minimizar el peso de las páginas web.

    Inconvenientes: Dado que esta no es una aplicación, sino una biblioteca de códigos, debe tener experiencia en codificación para poder usarla. Por lo tanto, es posible que esto no sea adecuado para los usuarios que analizan datos pero no saben cómo programar. Además, la elección de tipos de visualización es algo limitada. Y parece que el código no se ha actualizado durante varios años.

    Nivel de habilidad: Experto

    Se ejecuta en: Navegadores web habilitados para JavaScript

    Aprende más: Vea demostraciones con código fuente.

    GIS / mapeo en el escritorio

    Existe una amplia gama de usos comerciales para los sistemas de información geográfica (GIS), que van desde la exploración de petróleo hasta la elección de sitios para nuevas tiendas minoristas. O como El Miami Herald hizo por su cobertura ganadora del premio Pulitzer del huracán Andrew, puede comparar las velocidades máximas del viento con los informes de daños y la información del edificio (y quizás descubrir, por ejemplo, que el peor daño no ocurrió en las áreas que sufrieron los vientos más fuertes, sino en áreas con mucha construcción nueva y de mala calidad).

    GIS cuántico (QGIS)

    Que hace: Este es un software GIS completo, diseñado para crear mapas que ofrecen un análisis sofisticado, detallado y basado en datos de una región geográfica.

    El software GIS de escritorio más conocido es probablemente ArcGIS de Esri, una aplicación robusta y bien soportada que cuesta bastante dinero. El QGIS de código abierto es una alternativa.

    Quantum GIS (QGIS) ofrece visualización y análisis geoespacial completo en el escritorio.

    Como OpenOffice es para Microsoft Office, QGIS es para ArcGIS. Los entusiastas de ArcGIS argumentan que la oferta de Esri está un par de iteraciones por delante de las alternativas de código abierto, tiene una interfaz mejor desarrollada, cuenta con soporte comercial y es más adecuada para la impresión. Pero los usuarios de QGIS dicen que la alternativa de código abierto es un programa excelente que hace una gran cantidad de trabajo GIS útil, y ahora hay una compañía llamada Boundless que tiene como objetivo ofrecer soporte empresarial (pagado).

    Que es genial: QGIS tiene una enorme cantidad de funcionalidad GIS, incluida la capacidad de crear mapas, superponer varios tipos de datos, realizar análisis espaciales, publicar en la web y más. También se puede mejorar con complementos que agregan soporte para numerosas empresas, incluida la codificación geográfica, la administración de datos de tablas subyacentes, la exportación a MySQL y la generación de mapas de imágenes HTML.

    Inconvenientes: Como ocurre con cualquier aplicación SIG sofisticada, aprender a utilizar este software implica un compromiso serio de tiempo y formación. Incluso en sesiones prácticas de una hora con primero ArcGIS y luego QGIS, noté cosas que eran más fáciles de hacer en la opción comercial, como algunos campos calculados.

    Se ejecuta en: Linux, Unix, macOS X, Windows. (Este es un caso en el que la instalación es más complicada en OS X, ya que requiere la instalación manual de varias dependencias. Hay un instalador de un clic para Windows).

    Nivel de habilidad: Intermedio a experto

    Aprende más: Timothy Barmann de El diario de la providencia publicó dos tutoriales muy útiles para la conferencia CAR que todavía están disponibles: Introducción a QGIS y Lo último en mapeo con JavaScript y jQuery. Otro recurso para ayudarlo a comenzar: QGIS Tutorial Labs, de Richard E. Plant, profesor emérito de la Universidad de California, Davis.

    Nota: Si está interesado en SIG y desea considerar otras opciones de software gratuito, descargue esta lista en PDF de productos SIG de código abierto / no comerciales. Y si está buscando un programa GIS de escritorio de código abierto gratuito que pueda ser bastante fácil de usar, Jacob Fenton, director de informes asistidos por computadora en el Taller de informes de investigación de la American University, recomienda echar un vistazo al Sistema de análisis geocientíficos automatizados. (SAGA) sitio. Finalmente, si analizar datos geográficos en una base de datos convencional suena interesante, PostGIS "habilita espacialmente" la base de datos relacional PostgreSQL.

    GIS / mapeo basado en la web

    La mayoría de nosotros estamos familiarizados con las herramientas de mapeo de las principales empresas como Google (que tiene una serie de interfaces de terceros, como Map A List, un complemento que agrega información a un mapa de Google desde una hoja de cálculo). También hay Bing Maps con API. Pero existen otras opciones de organizaciones más pequeñas o entusiastas solitarios del código abierto que fueron diseñadas desde cero para mapear también datos geográficos.

    OpenLayers

    Que hace: OpenLayers es una biblioteca de JavaScript para mostrar información de mapas. Su objetivo es proporcionar una funcionalidad similar a las bibliotecas de código de esas grandes empresas, pero con código de fuente abierta. OpenLayers funciona con OpenStreetMap y otros mapas.

    Otros proyectos se basan en él para agregar funcionalidad o facilidad de uso, como GeoExt, que agrega más capacidades GIS. Para los usuarios que se sienten cómodos codificando manualmente JavaScript y prefieren no utilizar una plataforma comercial como Google o Bing, esta puede ser una opción atractiva.

    Inconvenientes: OpenLayers no es tan fácil de usar como, digamos, Google Maps.

    Nivel de habilidad: Experto

    Se ejecuta en: Cualquier navegador web

    Aprende más: Pruebe este inicio rápido de OpenLayers.

    OpenStreetMap

    Que hace: OpenStreetMap es algo así como la Wikipedia del mundo de la cartografía, con varias características como carreteras y edificios aportados por usuarios de todo el mundo.

    Que es genial: El principal atractivo de OpenStreetMap es su naturaleza comunitaria, que ha dado lugar a una serie de usos interesantes. Por ejemplo, es compatible con la plataforma móvil Ushahidi que se utiliza para la colaboración colectiva de información después de desastres como terremotos. (Si bien Ushahidi puede usar varios proveedores diferentes para la capa del mapa base, incluidos Google y Yahoo, algunos creadores de proyectos se sienten más cómodos con una opción de código abierto).

    Inconvenientes: Al igual que con cualquier proyecto que acepte aportaciones del público, a veces puede haber problemas con la precisión de los contribuyentes (como la plataforma de aterrizaje de helicópteros que alguien colocó en mi vecindario; en realidad, está a bastantes millas de distancia). Aunque, para ser justos, encontré más de una lista de empresas en Google Maps que también estaba desactualizada. Además, la apariencia general de los mapas no está tan pulida como algunas alternativas comerciales.

    Nivel de habilidad: Principiante avanzado a intermedio

    Se ejecuta en: Cualquier navegador web

    Aprende más: Vea el tutorial rápido en el sitio de OpenLayers.

    Análisis de datos temporales

    Si el tiempo es un componente importante de sus datos, las visualizaciones tradicionales de la línea de tiempo pueden mostrar patrones, pero no permiten un análisis sofisticado ni una gran interacción. Ahí es donde entra este proyecto.

    TimeFlow

    Que hace: Este software de escritorio es para analizar puntos de datos que involucran un componente de tiempo. En una demostración sobre la que escribí antes de su lanzamiento, los creadores Fernanda Viégas y Martin Wattenberg, la pareja detrás del proyecto pionero Many Eyes de IBM que luego se fue a Google, mostraron cómo TimeFlow puede generar líneas de tiempo visuales a partir de archivos de texto, con entradas de color y tamaño. -codificado para detectar patrones fácilmente. También permite clasificar y filtrar la información y ofrece algunos resúmenes estadísticos de los datos.

    TimeFlow ofrece varias formas diferentes de visualizar fácilmente los datos con un componente de tiempo importante.

    Que es genial: TimeFlow facilita la interacción con los datos de varias formas, como cambiar de vista o filtrar por criterios como rangos de fechas o terremotos de magnitud 8 o más. La vista de línea de tiempo ofrece un control deslizante para que pueda concentrarse en un período de tiempo. Si bien muchas aplicaciones pueden trazar gráficos de barras, pocas también ofrecen vistas de calendario. Y a diferencia de Google Fusion Tables basadas en la web, TimeFlow es una aplicación de escritorio que hace que editar entradas individuales sea rápido y sencillo.

    Inconvenientes: No hay ninguna otra función para publicar o compartir resultados que no sea tomar una instantánea de la pantalla, y el código no se ha actualizado en varios años.

    Nivel de habilidad: Principiante

    Se ejecuta en: Sistemas de escritorio que ejecutan Java, incluidos Windows y macOS X

    Aprende más: Consulte los mejores consejos.

    Nota: si está buscando publicar líneas de tiempo visualizadas, las mejores opciones incluyen Google Fusion Tables, VIDI o el widget SIMILE Timeline.

    Nubes de texto / palabras

    Muchos expertos en visualización de datos no piensan mucho en las nubes de palabras, considerándolas poco serias y poco originales. Puede pensar en ellos como el tiramisú de las visualizaciones: hace mucho que están de moda, ahora se usan en exceso. Pero algunos todavía disfrutan de estos gráficos que muestran cada palabra de un archivo de texto una vez, y el tamaño de las palabras varía según la frecuencia con la que cada una aparece en la fuente.

    Generador de nube de palabras de IBM

    Que hace: Varias herramientas mencionadas anteriormente pueden crear nubes de palabras, incluidas Many Eyes y la API de visualización de Google, así como el sitio web Wordle (que es una herramienta útil para crear nubes de palabras a partir de sitios web en lugar de archivos de texto). Pero si está buscando un software de escritorio sencillo dedicado a la tarea, la aplicación de escritorio gratuita Word-Cloud de IBM se ajusta a sus necesidades.

    Que es genial: Esta es una forma rápida y sencilla de encontrar la frecuencia de las palabras en el texto.

    Inconvenientes: Debido a que está tratando de ignorar palabras como "a" y "el", la configuración básica puede perder algunos términos importantes. En las primeras pruebas, no conocía la diferencia entre "eso" y "TI", y omitió por completo "AT & ampT".

    Nivel de habilidad: Principiante avanzado. Esta aplicación se ejecuta en la línea de comandos, por lo que los usuarios deben tener la capacidad de encontrar rutas de archivos y conectarlas a un comando de muestra.

    Se ejecuta en: Windows, macOS X y Linux con Java

    Aprende más: Consulte los ejemplos que vienen con la descarga.

    Análisis de redes sociales y de otro tipo

    Estas herramientas utilizan una definición anterior a Facebook / Twitter de "análisis de redes sociales" (SNA), que se refiere a la disciplina de encontrar conexiones entre personas en función de varios conjuntos de datos. Los periodistas de investigación han utilizado estas herramientas para, por ejemplo, encontrar vínculos entre personas que están involucradas en proyectos de desarrollo o que son miembros de varios consejos de administración.

    Es necesario comprender las teorías estadísticas del análisis de nodos de red para utilizar esta categoría de software. Dado que solo tuve una introducción muy básica a esa disciplina, esta es una categoría de herramientas que no probé en la práctica. Pero si está buscando software para realizar dicho análisis, uno de estos podría satisfacer sus necesidades.

    Gephi

    Que hace: Facturado como Photoshop para datos, este proyecto beta de código abierto está diseñado para visualizar información estadística, incluidas las relaciones dentro de redes de hasta 50.000 nodos y medio millón de bordes (conexiones o relaciones), así como análisis de redes de factores como "intermediación , "cercanía y coeficiente de agrupamiento.

    Gephi puede visualizar redes de hasta 50.000 nodos.

    Se ejecuta en: Windows, Linux, Mac OS X con Java 1.6

    Aprende más: Pruebe este tutorial de inicio rápido.

    NodeXL

    Que hace: Este complemento de Excel muestra gráficos de red de una lista determinada de conexiones, lo que le ayuda a analizar y ver patrones y relaciones en los datos.

    NodeXL fusiona las definiciones más antiguas y actuales de SNA. Está "optimizado para analizar las redes sociales en línea; incluye conexiones integradas para consultar las API de Twitter, Flickr y YouTube, lo que le permite dibujar redes de usuarios y su actividad", según Peter Aldhous, jefe de la oficina de San Francisco Científico nuevo revista.

    También maneja archivos de análisis de redes convencionales y de correo electrónico (incluidos los datos creados por la popular, pero no gratuita, herramienta de análisis UCINET).

    Se ejecuta en: Excel en Windows

    Aprende más: Descargue este tutorial gratuito de NodeXL (PDF) del periodista científico Peter Aldhous.


    Principios de visualización de información

    Ahora debería quedar claro que leer el historial a través de un macroscopio implicará visualización. La visualización es un método para deformar, comprimir o manipular datos para verlos de formas nuevas y esclarecedoras. Una buena visualización puede convertir horas de estudio cuidadoso en un destello de conocimiento, o puede transmitir una narrativa compleja en un solo momento. Las visualizaciones también pueden mentir, confundir o tergiversar si no se utilizan correctamente. Esta sección presentará a los historiadores los tipos de visualizaciones, por qué podrían querer usarlas y cómo usarlas de manera efectiva. También mostrará algunas visualizaciones que los historiadores han utilizado con eficacia.

    ¿Por qué visualizar?

    Una edición coreana del siglo XIII del canon budista contiene más de 52 millones de caracteres en 166.000 páginas. Lewis Lancaster describe un análisis tradicional de este corpus como tal:

    El enfoque previo al estudio de este canon fue el tradicional analítico de lectura atenta de ejemplos específicos de textos seguido de una búsqueda a través de un corpus definido de ejemplos adicionales. Cuando se enfrentó a 166.000 páginas, dicha actividad tuvo que ser limitada. Como resultado, se realizó un análisis sin tener una imagen completa del uso de las palabras objetivo en toda la colección de textos. Es decir, nuestra beca a menudo estuvo determinada y limitada por factores externos como la disponibilidad, el acceso y el tamaño del material escrito. Para superar estos problemas, los académicos tendieron a buscar un cuerpo reducido de material que se consideraba importante por el peso de los precedentes académicos. 23

    A medida que avanzaban las tecnologías, las viejas limitaciones ya no estaban presentes Lancaster y su equipo trabajó para crear una interfaz de búsqueda (figura 3.12) que permitiría a los historiadores ver la evolución y el uso de los glifos a lo largo del tiempo, permitiéndoles efectivamente explorar todo el texto en una vez. Los historiadores ya no necesitarían elegir de forma selectiva qué áreas de este texto analizar, podrían ver rápidamente en qué parte del corpus se usaba con más frecuencia su consulta, y partir de allí.

    [inserte la Figura 3.12 Captura de pantalla de la interfaz de Lancaster para estudiar la evolución de los glifos a lo largo del tiempo]

    Este enfoque de la lectura a distancia, ver dónde en un texto el objeto de la investigación es más denso, se ha vuelto tan común desde entonces que ya no se siente como una visualización. El Kindle de Amazon tiene una función de búsqueda llamada X-Ray (figura 3.13) que permite al lector buscar una serie de palabras y ver la frecuencia con la que esas palabras aparecen en un texto a lo largo de sus páginas. En el navegador web de Google, Chrome, la búsqueda de una palabra en una página web resalta la barra de desplazamiento en el lado derecho, de modo que es fácil ver la distribución del uso de esa palabra en la página.

    [inserte la Figura 3.13 Búsqueda de rayos X de Amazon yuxtapuesta con el indicador de término de búsqueda de la barra de desplazamiento de Google Chrome]

    El uso de visualizaciones para mostrar la distribución de palabras o temas en un documento es una forma efectiva de tener una idea de la ubicación y frecuencia de su consulta en un corpus, y representa solo uno de los muchos usos de la visualización de información. Los usos de la visualización de información generalmente se dividen en dos categorías: exploración y comunicación.

    Exploración

    Al obtener o crear un conjunto de datos por primera vez, las visualizaciones pueden ser una ayuda valiosa para comprender exactamente qué datos están disponibles y cómo se interconectan. De hecho, incluso antes de que se complete un conjunto de datos, las visualizaciones se pueden utilizar para reconocer errores en el proceso de recopilación de datos. Imagine que está recopilando metadatos de unos cientos de libros en una colección de biblioteca, tomando nota del editor, la fecha de publicación, los nombres de los autores, etc. Unas pocas visualizaciones simples, hechas fácilmente en software como Microsoft Excel, pueden ser de gran ayuda para señalar errores. Observe cómo en el cuadro de la figura 3.14, se puede notar fácilmente que quien ingresó los datos sobre las fechas de publicación del libro accidentalmente ingresó “1909” en lugar de “1990” para uno de los libros.

    [inserte la Figura 3.14 Un error en la entrada de datos se hace evidente rápidamente cuando los datos se representan como un gráfico].

    De manera similar, las visualizaciones se pueden usar para obtener una comprensión rápida de la estructura de los datos que se ingresan, directamente en la hoja de cálculo. La visualización en la figura 3.15, de los salarios en una universidad, hace que sea trivial identificar qué facultad del departamento tiene los salarios más altos y cómo se distribuyen esos salarios. Utiliza funciones básicas en versiones recientes de Microsoft Excel.

    [Insertar Figura 3.15 Incluso una hoja de cálculo puede considerarse una visualización.>

    Se pueden explorar conjuntos de datos más complejos con visualizaciones más avanzadas, y esa exploración se puede usar para todo, desde obtener una idea de los datos disponibles hasta comprender los detalles minuciosos de un punto de datos en relación con otro. La visualización en la Figura 3.16, ORBIS, permite al usuario explorar las redes de transporte en el mundo de la Antigua Roma. Esta pantalla en particular muestra la ruta más probable de Roma a Constantinopla bajo un cierto conjunto de condiciones, pero se invita al usuario a modificar esas condiciones, o las ciudades de inicio y finalización, según lo que mejor se adapte a sus propias preguntas de investigación.

    [* Insertar Figura 3.16 Captura de pantalla de un detalle de ORBIS] *

    Las visualizaciones exploratorias como esta forman una parte clave del proceso de investigación al analizar grandes conjuntos de datos. Se sientan particularmente bien como una capa adicional en el proceso hermenéutico de formación de hipótesis. Puede comenzar su investigación con un conjunto de datos y algunas ideas preconcebidas de lo que significa y lo que implica, pero sin una tesis bien formada para argumentar. La visualización exploratoria le permite notar tendencias o valores atípicos que quizás no haya notado de otra manera, y es posible que valga la pena explicar o discutir con más detalle esas tendencias o valores atípicos. Una investigación histórica cuidadosa de esos puntos podría revelar direcciones aún más interesantes que vale la pena explorar, que luego se pueden plegar en visualizaciones futuras.

    Comunicación

    Una vez que se completa el proceso de investigación, las visualizaciones aún tienen un papel importante que desempeñar en la traducción de relaciones de datos complejas en unidades fácilmente digeribles. La visualización correcta puede reemplazar páginas de texto con un solo gráfico y aun así transmitir la misma cantidad de información. La visualización creada por Ben Schmidt reproducida en la figura 3.17, por ejemplo, muestra la frecuencia con la que se mencionan ciertos años en los títulos de las disertaciones de historia. 24 La visualización muestra claramente que la gran mayoría de las disertaciones cubren los años posteriores a 1750, con picos en torno a la Guerra Civil estadounidense y las Guerras mundiales. Si bien mi descripción del gráfico describe las tendencias con precisión, no transmite la gran magnitud de la diferencia entre los años anteriores y los posteriores que cubren las disertaciones, ni menciona la caída repentina en las disertaciones que cubren períodos posteriores a 1970.

    [Insertar Figura 3.17 Los años mencionados en los títulos de tesis, después de Schmidt 2013]

    Las visualizaciones en las publicaciones se utilizan a menudo, pero no siempre, para mejorar la comprensión del lector del contenido que se describe. También es común que las visualizaciones se utilicen para llamar la atención de los lectores o revisores, para hacer que la investigación sea más notoria, memorable o publicable. En un mundo público que valora tanto la cuantificación, las visualizaciones pueden dar un aire de legitimidad a una investigación que puede o no merecer. No comentaremos sobre las implicaciones éticas de tales visualizaciones, pero sí notamos que tales visualizaciones son cada vez más comunes y parecen desempeñar un papel para aprobar con éxito la revisión por pares, recibir financiación o captar la atención del público. Si el fin justifica los medios es una decisión que dejamos a nuestros lectores.

    Tipos de visualizaciones

    Hasta este momento, hemos utilizado la frase visualización de información sin explicarlo ni diferenciarlo de otros términos relacionados. Remediamos eso aquí: la visualización de información es el mapeo de datos abstractos a variables gráficas para hacer una representación visual. Usamos estas representaciones para aumentar nuestras habilidades para leer datos, no podemos esperar intuir todas las relaciones en nuestros datos solo por la memoria y una cuidadosa consideración, y las visualizaciones hacen que esas relaciones sean más evidentes.

    Un información visualización difiere de un científico visualización en los datos que pretende representar y en cómo se instancia esa representación. Las visualizaciones científicas mantienen un sistema de referencia espacial específico, mientras que las visualizaciones de información no. Las visualizaciones de moléculas, clima, motores y cerebros son todas visualizaciones científicas porque cada una de ellas ya tiene una instanciación física y su forma visual se conserva en la visualización. Los gráficos de barras, los diagramas de dispersión y los gráficos de red, por otro lado, son visualizaciones de información, porque se presentan en datos espaciales que no tienen espacialidad inherente. Un infografia suele ser una combinación de información y visualizaciones científicas incrustadas en una narrativa muy explícita y marcada con una gran cantidad de texto.

    Estos tipos son fluidos y algunas visualizaciones caen entre categorías. La mayoría de las visualizaciones de información, por ejemplo, contienen algo de texto, y cualquier visualización que creamos está imbuida de la narrativa y el propósito que le damos, ya sea que nos demos cuenta de que lo hemos hecho o no. Una visualización verdaderamente “objetiva”, donde los datos hablen por sí mismos, es imposible. Nuestras decisiones sobre cómo codificar nuestros datos y qué datos presentar influyen profundamente en la comprensión que los lectores obtienen de una visualización.

    Las visualizaciones también varían entre estáticas, dinámicas e interactivas. Los expertos en el área han argumentado que las visualizaciones más poderosas son imágenes estáticas con leyendas claras y un punto claro, aunque eso puede estar cambiando con pantallas interactivas cada vez más poderosas que brindan a los usuarios cantidades impresionantes de control sobre los datos. Algunos de los mejores ejemplos modernos provienen del equipo de visualización del New York Times. Estático visualizaciones son los que no se mueven y no se pueden manipular dinámica visualizaciones son animaciones breves que muestran cambios, ya sea a lo largo del tiempo o en alguna otra variable interactivo visualizaciones Permitir al usuario manipular las variables gráficas ellos mismos en tiempo real.A menudo, debido a la ceguera al cambio, las visualizaciones dinámicas pueden ser confusas y menos informativas que las visualizaciones estáticas secuenciales. Las visualizaciones interactivas tienen el potencial de sobrecargar a la audiencia, especialmente si los controles son variados y poco intuitivos. La clave es lograr un equilibrio entre claridad y flexibilidad.

    La visualización es más que gráficos de barras y diagramas de dispersión. Los académicos están creando constantemente nuevas variaciones y combinaciones de visualizaciones, y lo han estado haciendo durante cientos de años. Sería imposible una lista exhaustiva de todas las formas en que se visualiza o se puede visualizar la información, aunque intentaremos explicar muchas de las variedades más comunes. Nuestra taxonomía está influenciada por visualizing.org, un sitio web dedicado a catalogar visualizaciones interesantes, pero también tomamos ejemplos de muchas otras fuentes.

    Gráficos estadísticos y series temporales de amp

    Los gráficos estadísticos son probablemente los que resultarán más familiares para cualquier audiencia. Al visualizar con fines de comunicación, es importante tener en cuenta qué tipos de visualizaciones su audiencia encontrará legibles. A veces, la visualización más adecuada para el trabajo es la que se comprende más fácilmente, en lugar de la que representa con mayor precisión los datos disponibles. Esto es particularmente cierto cuando se representan muchas variables abstractas a la vez: es posible crear una visualización con color, tamaño, ángulo, posición y forma que representen diferentes aspectos de los datos, pero puede volverse tan compleja que resulte ilegible.

    [inserte un gráfico de barras básico en la Figura 3.18]

    La figura 3.18 es una gráfico de barras de la cantidad de libros de no ficción que se encuentran en una pequeña colección, categorizados por género. Una dimensión de los datos es el género, que es cualitativo, y cada uno se compara en una segunda categoría, el número de libros, que es cuantitativo. Los datos con dos dimensiones, una cualitativa y otra cuantitativa, generalmente se representan mejor como gráficos de barras como este.

    A veces, desea visualizar los datos como parte de un todo, en lugar de en valores absolutos. En estos casos, con la misma división cualitativa / cuantitativa de datos, la mayoría dependerá inmediatamente de gráficos circulares como el de la figura 3.19. A menudo, esta es una mala elección: los gráficos circulares tienden a estar desordenados, especialmente a medida que aumenta el número de categorías, y las personas tienen dificultades para interpretar el área de un sector circular.

    [inserte un gráfico circular en la Figura 3.19]

    Los mismos datos se pueden representar como gráfico de barras apiladasfigura 3.20), lo que produce una visualización con mucho menos desorden. Este gráfico también reduce significativamente la carga cognitiva del lector, ya que simplemente necesitan comparar la longitud de la barra en lugar de intentar calcular internamente el área de una porción de pastel.

    [inserte la Figura 3.20 Un gráfico de barras apiladas]

    Cuando hay que representar dos variables cuantitativas, en lugar de una cuantitativa y una cualitativa, la visualización más útil es la gráfico de líneas o gráfico de dispersión. Los volúmenes de libros de una colección ordenados por año de publicación, por ejemplo, se pueden expresar con el año en el eje horizontal (X-eje) y el número de libros en el eje vertical (y-eje). La línea trazada entre cada (x, y) representa nuestra suposición de que los puntos de datos están relacionados entre sí de alguna manera, y una tendencia ascendente o descendente es de alguna manera significativa (figura 3.21).

    [inserte un gráfico lineal en la Figura 3.21]

    Podríamos reemplazar las líneas individuales entre años con una línea de tendencia, una que muestre la tendencia general hacia arriba o hacia abajo de los puntos de datos a lo largo del tiempo (figura 3.22). Esto refleja nuestra suposición de que los cambios de un año a otro no solo son significativos, sino que hay algún factor subyacente que está causando que el número total de volúmenes se mueva hacia arriba o hacia abajo a lo largo de todo el período de tiempo. En este caso, parece que, en promedio, la colección de libros parece estar disminuyendo a medida que las fechas de publicación se acercan a la actualidad, lo que puede explicarse fácilmente por el retraso en el tiempo que puede tomar antes de tomar la decisión de comprar un libro para colección.

    [insertar Figura 3.22 La línea en la figura 3.21 se elimina y se reemplaza con una línea de tendencia en los puntos]

    Los diagramas de dispersión tienen la ventaja adicional de poder adaptarse a dimensiones adicionales de datos. El diagrama de dispersión en 3.23 compara tres dimensiones de datos: género (cualitativo), número de volúmenes de cada género en la colección (cuantitativo) y número promedio de páginas por género (cuantitativo). Nos muestra, por ejemplo, que la colección contiene bastantes biografías, y las biografías tienen muchas menos páginas en promedio que los libros de referencia. El diagrama de dispersión también nos muestra que es bastante inútil que no haya tendencias o correlaciones discernibles entre ninguna de las variables y que no surjan nuevos conocimientos al ver la visualización.

    [inserte una gráfica de dispersión en la Figura 3.23]

    La histograma es una visualización que es a la vez particularmente útil y extremadamente engañosa para los desconocidos. Parece ser un gráfico de barras verticales, pero en lugar del eje horizontal que representa datos categóricos, el eje horizontal de un histograma suele además representa datos cuantitativos, subdivididos de una manera particular. Otra forma de decir esto es que en un gráfico de barras, las categorías se pueden mover hacia la izquierda o hacia la derecha sin cambiar el significado de la visualización, mientras que en un histograma, hay un orden definido para las categorías de la barra. Por ejemplo, la siguiente figura representa el histograma de distribuciones de calificaciones en una clase universitaria. No tendría sentido que las calificaciones con letras estuvieran en otro orden que no sea el que se presenta a continuación. Además, los histogramas siempre representan la distribución de ciertos valores, es decir, la altura de la barra nunca puede representar algo como la temperatura o la edad, sino que representa la frecuencia con el que aparece algún valor. En la figura 3.24, la altura de la barra representa la frecuencia con la que los estudiantes de un curso universitario obtienen ciertas calificaciones.

    [Figura 3.24 un histograma de las calificaciones de los estudiantes]

    El histograma (figura 3.24) muestra que la distribución de las calificaciones de los estudiantes no sigue una verdadera curva de campana, con tantas A como F en la clase. Esto no es sorprendente para cualquiera que haya impartido un curso, pero es una visualización útil para representar tales divergencias de las distribuciones esperadas.

    A pesar de su aparente simplicidad, estas visualizaciones estadísticas muy básicas pueden ser impulsoras de análisis extremadamente útiles. La visualización en la figura 3.25 muestra la frecuencia cambiante del uso de "aboue" y "above" (variaciones ortográficas de la misma palabra) en el texto impreso en inglés de 1580-1700. Sam Kaislaniemi señaló en una publicación de blog lo sorprendente que es que la variación ortográfica parezca haber cambiado tan drásticamente en un período de dos décadas. Esto instigó una mayor investigación, lo que condujo a una publicación de blog extendida e investigación en una serie de otros conjuntos de datos del mismo período de tiempo.

    [Figura 3.25 La frecuencia cambiante de "arriba" y "arriba"]

    Los mapas básicos pueden considerarse visualizaciones científicas, porque la latitud y la longitud es un sistema de referencia espacial preexistente al que la mayoría de las visualizaciones geográficas se ajustan exactamente. Sin embargo, a medida que se agrega contenido a un mapa, puede obtener una capa o capas de visualización de información.

    Una de las visualizaciones geográficas más comunes es la coropleta, donde las regiones delimitadas están coloreadas y sombreadas para representar alguna variable estadística (figura 3.26). Los usos comunes de las coropletas incluyen representar la densidad de población o los resultados de las elecciones. La siguiente visualización, creada por Mike Bostock, colorea los condados según la tasa de desempleo, y los condados más oscuros tienen un desempleo más alto. Los mapas de coropletas deben usarse para proporciones y tasas en lugar de valores absolutos; de lo contrario, las áreas más grandes pueden tener un color desproporcionadamente más oscuro debido simplemente al hecho de que hay más espacio para que las personas vivan.

    [inserte la Figura 3.26 Un mapa de coropletas]

    Para algunos propósitos, las coropletas proporcionan una granularidad insuficiente para representar la densidad. En la década de 1850, un brote de cólera en Londres dejó a muchos preocupados y desconcertados por el origen de la epidemia. El Dr. John Snow creó un mapa de densidad de puntos (Figura 3.27) que muestra la ubicación de los casos de cólera en la ciudad. La visualización reveló que la mayoría de los casos se produjeron alrededor de una sola bomba de agua, lo que sugiere que el brote se debió a un suministro de agua contaminada.

    [inserte la figura 3.27 mapa de densidad de puntos de John Snow]

    Para representar valores absolutos en mapas, debería considerar usar un mapa de símbolo proporcional. El mapa que se muestra en la figura 3.28, creado por Mike Bostock, muestra las poblaciones de algunas de las ciudades más grandes de Estados Unidos. Estas visualizaciones son buenas para comparar directamente valores absolutos entre sí, cuando el tamaño de la región geográfica no es particularmente relevante. Tenga en cuenta que a menudo, incluso si planea representar información geográfica, es posible que las mejores visualizaciones no estén en un mapa. En este caso, a menos que intente demostrar que la mayor densidad de áreas pobladas se encuentra en el este de los EE. UU., Es posible que le sirva mejor un gráfico de barras, con alturas de barra representativas del tamaño de la población. Es decir, la latitud y longitud de las ciudades no es particularmente importante para transmitir la información que estamos tratando de transmitir.

    [inserte la Figura 3.28 Un mapa de símbolos proporcionales que muestra la población de las ciudades más grandes de los EE. UU.]

    Los datos que cambian continuamente en todo el espacio geográfico (por ejemplo, temperatura o elevación) requieren visualizaciones más complejas. Los más comunes en este caso se conocen como isopleta, isarítmico, o mapas de contorno, y representan un cambio gradual utilizando líneas curvas adyacentes. Tenga en cuenta que estas visualizaciones funcionan mejor para datos que contienen transiciones suaves. Los mapas topográficos (figura 3.29) utilizan líneas adyacentes para mostrar cambios graduales en la elevación. Cuanto más cerca están las líneas, más rápidamente cambia la elevación.

    [inserte el detalle de la figura 3.29 de un mapa de contorno]

    Los mapas geográficos tienen una característica que los distingue de la mayoría de las otras visualizaciones: los conocemos sorprendentemente bien. Si bien pocas personas pueden etiquetar con precisión todos los estados de EE. UU. O países europeos en un mapa, conocemos la forma del mundo lo suficiente como para tomarnos algunas libertades con visualizaciones geográficas que no podemos tomar con otros. Cartogramas son mapas que distorsionan el sistema de referencia espacial básico de latitud y longitud para representar algún valor estadístico. Funcionan porque sabemos cómo se supone que debe ser la referencia, por lo que podemos intuir inmediatamente en qué se diferencian los resultados del cartograma del “mapa base” con el que estamos familiarizados. El cartograma que se muestra en la Figura 3.30, creado por M.E.J. Newman, distorsiona el tamaño de los estados según su población y colorea a los estados por la forma en que votaron en las elecciones presidenciales estadounidenses de 2008. 25 Muestra que, aunque una mayor área de los Estados Unidos puede haber votado a los republicanos, esas áreas tendían a estar muy escasamente pobladas.

    [inserte el gráfico 3.30 cartograma de Newman de los resultados de las elecciones presidenciales de EE. UU. de 2008]

    Los mapas no siempre son necesariamente las visualizaciones más apropiadas para el trabajo, pero cuando se usan bien, pueden ser extremadamente informativos.

    En las humanidades, las visualizaciones de mapas a menudo deberán ser de espacios históricos o imaginarios. Si bien hay muchas canalizaciones convenientes para crear superposiciones de datos personalizados de mapas, crear mapas nuevos por completo puede ser un proceso agotador con pocas herramientas fáciles para respaldarlo. Nunca es tan simple como tomar una foto de un mapa antiguo y escanearlo en la computadora, el aspirante a cartógrafo deberá emparejar minuciosamente los puntos en un mapa escaneado antiguo con su latitud y longitud modernas, o crear nuevos mosaicos de mapas por completo. Las siguientes visualizaciones son dos ejemplos de tales esfuerzos: el primero (figura 3.31) es un mapa reconstruido del mundo antiguo que incluye acueductos, muros de defensa, sitios y carreteras de Johan Åhlfeldt con Pelagios, 26 y el segundo (figura 3.32) es un mapa reconstruido de la Tierra Media de Tolkien por Emil Johansson. 27 Ambos son ejemplos de un trabajo humanístico extremadamente cuidadoso que involucró tanto capas de datos adicionales como cambios en el mapa base.

    [Insertar detalle de la Figura 3.31 centrado en Roma, mapa digital del imperio romano]

    [inserte la Figura 3.32 Detalle del mapa de LOTRProject de la Tierra Media, con The Shire a la izquierda]

    Jerarquías y árboles amp

    Mientras que los tipos anteriores de visualizaciones trataban con datos que eran una combinación de categóricos, cuantitativos y geográficos, algunos datos son inherentemente relacionales y no se prestan a este tipo de visualizaciones. Los datos jerárquicos y anidados son una variedad de datos de red, pero son una variedad lo suficientemente común como para que muchas visualizaciones se hayan diseñado pensando en ellos específicamente. Ejemplos de este tipo de datos incluyen linajes familiares, jerarquías organizativas, subdirectorios informáticos y la ramificación evolutiva de especies.

    Las formas más comunes de visualización para este tipo de datos son vertical y árboles horizontales. El árbol horizontal de la figura 3.33, realizado en D3.js, muestra a los hijos y nietos de Josiah Wedgwood. Estas visualizaciones son extremadamente fáciles de leer para la mayoría de las personas y se han utilizado para muchas variedades de datos jerárquicos. Los árboles tienen la ventaja de ser más legibles que la mayoría de las otras visualizaciones de red, pero tienen la desventaja de ser bastante restrictivos en lo que pueden visualizar.

    [inserte la Figura 3.33 Mapa de árbol horizontal que muestra los descendientes de Josiah Wedgwood]

    Otra forma de visualización jerárquica, llamada árbol radial, se utiliza a menudo para mostrar estructuras siempre ramificadas, como en una organización. El árbol radial de la figura 3.33, un organigrama de 1924 en un volumen sobre estadísticas de gestión de W.H Smith, 28 enfatiza cómo el poder en la organización está centralizado en una autoridad primaria. Es importante recordar que las elecciones estilísticas pueden influir profundamente en el mensaje tomado de una visualización. Los árboles horizontales y radiales pueden representar la misma información, pero el primero enfatiza el cambio en el tiempo, mientras que el segundo enfatiza la centralidad del peldaño más alto en la jerarquía. Ambos son igualmente válidos, pero envían mensajes muy diferentes al lector.

    [Insertar Figura 3.34 Árbol radial]

    Una de las visualizaciones jerárquicas más populares recientemente es la mapa de árbol diseñado por Ben Shneiderman. Los mapas de árbol utilizan rectángulos anidados para mostrar jerarquías, cuyas áreas representan algún valor cuantitativo. Los rectángulos suelen estar coloreados para representar una tercera dimensión de datos, ya sea categórica o cuantitativa. La visualización en la figura 3.35 es del presupuesto de Washington D.C. en 2013, separado en categorías gubernamentales. Los rectángulos tienen un tamaño proporcional a la cantidad de dinero recibido por categoría en 2013, y están coloreados por el porcentaje que esa cantidad había cambiado desde el año fiscal anterior.

    [inserte la figura 3.35 del presupuesto de Washington D.C., 2013, como un mapa de árbol]

    Redes y matrices de amplificador

    Las visualizaciones de red pueden ser complejas y difíciles de leer. Los nodos y los bordes no siempre se representan como puntos y líneas, e incluso cuando lo son, cuanto más grande es la red, más difíciles de descifrar. Las razones detrás de la visualización de una red pueden diferir, pero en general, las visualizaciones de redes pequeñas son mejores para permitir al lector comprender las conexiones individuales, mientras que las visualizaciones de redes grandes son las mejores para revelar la estructura global.

    Las visualizaciones de red, al igual que el análisis de red, pueden o no aportar información según el contexto. Una buena regla general es preguntarle a un amigo alfabetizado en redes que lee el producto final si la visualización de la red les ayuda a comprender los datos o la narrativa más que la prosa sola. A menudo no lo hará. Recomendamos no incluir una visualización de los datos únicamente con el propósito de revelar la complejidad de los datos en cuestión, ya que transmite poca información y alimenta un estereotipo negativo de la ciencia de redes como una metodología vacía. Entraremos en las visualizaciones de red con cierta profundidad en el Capítulo 6, y es posible que el lector desee seguir adelante.

    De hecho, recomendamos que, siempre que sea posible, se eviten por completo las visualizaciones de red complejas. A menudo, es más fácil y significativo para una narrativa histórica simplemente proporcionar una lista de los nodos mejor conectados o, por ejemplo, un diagrama de dispersión que muestre la relación entre conectividad y vocación. Si la pregunta en cuestión puede responderse de manera más simple con una visualización tradicional que los historiadores ya están capacitados para leer, debería serlo.

    Múltiplos pequeños y minigráficos de amplificador

    Los pequeños múltiplos y minigráficos no son exactamente diferentes tipos de visualización de los que ya se han discutido, pero representan una forma única de presentar visualizaciones que pueden ser extremadamente convincentes y efectivas. Encarnan la idea de que las visualizaciones simples pueden ser más poderosas que las complejas, y que múltiples visualizaciones individuales a menudo pueden entenderse más fácilmente que una visualización increíblemente densa.

    Pequeños múltiplos son exactamente lo que parecen: el uso de múltiples visualizaciones pequeñas adyacentes entre sí con fines de comparación. Se utilizan en lugar de animaciones o una única visualización extremadamente compleja que intenta representar el conjunto de datos completo. La Figura 3.36, de Brian Abelson de OpenNews, muestra las anomalías de clima frío y cálido en los Estados Unidos desde 1964. 29 Las anomalías de clima frío están en azul y las anomalías de clima cálido están en lectura. Esta visualización se utiliza para mostrar un clima cálido cada vez más extremo debido al calentamiento global.

    [insertar * Figura 3.36 múltiplos pequeños, una serie de mapas que representan anomalías climáticas en los EE. UU. Desde 1964, después de Brian Abelson] *

    Minigráficos, un término acuñado por Edward Tufte, son pequeños gráficos de líneas sin eje ni leyenda. Se pueden usar en medio de una oración, por ejemplo, para mostrar un cambio en el precio de las acciones durante la última semana (), lo que nos mostrará tendencias generales al alza o a la baja, o en pequeños múltiplos para comparar varios valores. Microsoft Excel tiene una función de minigráfico incorporada para tal propósito. La figura 3.37 es una captura de pantalla de Excel, que muestra cómo se pueden usar minigráficos para comparar la frecuencia de apariciones de personajes en diferentes capítulos de una novela.

    [Inserte la figura 3.37 minigráficos en MS Excel, que representan las apariencias de los personajes en una novela].

    Los minigráficos de arriba muestran rápidamente a Carol como el personaje principal, y que se introdujeron dos personajes en el Capítulo 3, sin que el lector tenga que mirar los números en el resto de la hoja de cálculo.

    Elegir la visualización correcta

    No hay una visualización correcta. Una visualización es una decisión que tomas en función de lo que quieres que aprenda tu audiencia. Dicho esto, hay muchos equivocado visualizaciones. Usar un diagrama de dispersión para mostrar la precipitación promedio por país es una decisión incorrecta; usar un gráfico de barras es una mejor opción.En última instancia, su elección de qué tipo de visualización usar está determinada por la cantidad de variables que está usando, ya sean cualitativas o cuantitativas, cómo está tratando de compararlas y cómo le gustaría presentarlas. La creación de una visualización eficaz comienza eligiendo uno de los muchos tipos adecuados para la tarea en cuestión y descartando los tipos inapropiados según sea necesario. Una vez que haya elegido la forma que tomará su visualización, debe decidir cómo creará la visualización: ¿qué colores usará? ¿Qué símbolos? ¿Habrá una leyenda? Las siguientes secciones cubren estos pasos.

    Codificación visual

    Una vez que se ha elegido un tipo de visualización, los detalles pueden parecer evidentes o insignificantes. ¿Realmente importa de qué color o forma tienen los puntos? En resumen, sí, importa tanto como la elección de visualización que se utilice. Y, cuando sepa cómo utilizar de forma eficaz varios tipos de codificaciones visuales, podrá diseñar de forma eficaz nuevas formas de visualización que se adapten perfectamente a sus necesidades. El arte de la codificación visual está en la capacidad de hacer coincidir las variables de datos y las variables gráficas de manera adecuada. Las variables gráficas incluyen el color, la forma o la posición de los objetos en la visualización, mientras que las variables de datos incluyen lo que se intenta visualizar (por ejemplo, temperatura, altura, edad, nombre del país, etc.)

    Escalas de medida

    El aspecto más importante de elegir una variable gráfica adecuada es conocer la naturaleza de sus variables de datos. Aunque la forma que pueden tomar los datos diferirá de un proyecto a otro, probablemente se ajustará a una de cinco variedades: nominal, relacional, ordinal, de intervalo, de razón o relacional.

    Datos nominales, también llamado datos categóricos, es una medida completamente cualitativa. Representa diferentes categorías o etiquetas o clases. Los países, los nombres de las personas y los diferentes departamentos de una universidad son variables nominales. No tienen un orden intrínseco y su único significado está en cómo se diferencian entre sí. Podemos poner los nombres de los países en orden alfabético, pero ese orden no dice nada significativo sobre sus relaciones entre ellos.

    Datos relacionales son datos sobre cómo los datos nominales se relacionan entre sí. No es necesariamente cuantitativo, aunque puede serlo. Los datos relacionales requieren algún tipo de datos nominales para anclarlos y pueden incluir amistades entre personas, la existencia de carreteras entre ciudades y la relación entre un músico y el instrumento que toca. Este tipo de datos suele visualizarse, aunque no siempre, en árboles o redes. Un aspecto cuantitativo de los datos relacionales puede ser la duración de una llamada telefónica entre personas o la distancia entre dos ciudades.

    Datos ordinales es lo que tiene un orden inherente, pero no un grado inherente de diferencia entre lo que se ordena. Los ganadores del primer, segundo y tercer lugar en una carrera están en una escala ordinal, porque no sabemos cómo mucho más rápido el primer lugar fue que el segundo, solo que uno fue más rápido que el otro. Las escalas Likert, comúnmente utilizadas en encuestas (por ejemplo, muy en desacuerdo / en desacuerdo / ni de acuerdo ni en desacuerdo / de acuerdo / totalmente de acuerdo), son un ejemplo de datos ordinales de uso común. Aunque el orden es significativo para esta variable, el hecho de que carece de cualquier magnitud inherente convierte a los datos ordinales en una categoría cualitativa.

    Datos de intervalo son datos que existen en una escala con magnitudes cuantitativas significativas entre valores. Es como ordinal en que el orden importa y, además, la diferencia entre el primer y el segundo lugar es la misma que la distancia entre el segundo y el tercer lugar. La longitud, la temperatura en grados Celsius y las fechas existen en una escala de intervalo.

    Datos de relación son datos que, al igual que los datos de intervalo, tienen un orden significativo y una escala constante entre los valores ordenados, pero además tienen un valor cero significativo Compare esto con el peso, la edad o la cantidad que no tiene peso es físicamente significativo y diferente tanto en cantidad como en clase a tener algún peso por encima de cero.

    Tener un valor cero significativo nos permite usar cálculos con datos de razón que no podríamos realizar en datos de intervalo. Por ejemplo, si una caja pesa 50 libras y otra 100 libras, podemos decir que la segunda caja pesa el doble que la primera. Sin embargo, no podemos decir que un día de 100 ° F sea dos veces más caluroso que un día de 50 ° F, y eso se debe a que 0 ° F no es un valor cero intrínsecamente significativo.

    La naturaleza de cada uno de estos tipos de datos dictará qué variables gráficas se pueden usar para representarlos visualmente. La siguiente sección analiza varias posibles variables gráficas y cómo se relacionan con las distintas escalas de medida.

    Tipos de variables gráficas

    Las variables gráficas son cualquiera de esos elementos visuales que se utilizan para representar sistemáticamente información en una visualización. Son bloques de construcción. La longitud es una variable gráfica en los gráficos de barras, las barras más largas se utilizan para representar valores más grandes. La posición es una variable gráfica en un diagrama de dispersión, la ubicación vertical y horizontal de un punto se utiliza para representar su X y y valores, sean los que sean. El color es una variable gráfica en un mapa de coropletas de los resultados de la votación de los Estados Unidos, el rojo se usa a menudo para mostrar los estados que votaron por los republicanos y el azul para los estados que votaron por los demócratas.

    Como era de esperar, algunos tipos de variables gráficas son mejores que otros para representar diferentes tipos de datos. La posición en una cuadrícula 2D es excelente para representar datos cuantitativos, ya sea de intervalo o de proporción. El área o la longitud son particularmente buenos para mostrar datos de relación, ya que el tamaño también tiene un punto cero significativo. Estos tienen la ventaja adicional de tener un número virtualmente ilimitado de puntos discernibles, por lo que pueden usarse con la misma facilidad para un conjunto de datos de 2 o 2 millones. Compare esto con el ángulo. Es concebible que pueda crear una visualización que utilice un ángulo para representar valores cuantitativos, como en la figura 3.38. Esto está bien si tiene muy pocos puntos de datos increíblemente variados, pero eventualmente alcanzará un límite más allá del cual las diferencias mínimas en el ángulo son apenas perceptibles. Algunos tipos de variables gráficas están bastante limitados en el número de variaciones potenciales, mientras que otros tienen un rango mucho más amplio.

    [inserte la Figura 3.38, un mal uso del ángulo para indicar la edad].

    La mayoría de las variables gráficas que son buenas para datos totalmente cuantitativos funcionarán bien para datos ordinales, aunque en esos casos es importante incluir una leyenda asegurándose de que el lector sepa que un cambio constante en una variable gráfica no es indicativo de ningún cambio constante en los datos subyacentes. Los cambios en la intensidad del color son particularmente buenos para los datos ordinales, ya que no podemos decir fácilmente la magnitud de la diferencia entre los pares de intensidad del color.

    El color es un concepto particularmente complicado en la visualización de información. Se pueden usar tres variables para describir el color: tono, valor y saturación (figura 3.39).

    [inserte la Figura 3.39 tono, valor y saturación]

    Estas tres variables deben usarse para representar diferentes tipos de variables. Excepto en una circunstancia, que se analiza a continuación, el tono debe solo ser usado para representar datos cualitativos nominales. Las personas no están bien equipadas para comprender la diferencia cuantitativa entre, por ejemplo, rojo y verde. En un gráfico de barras que muestra el salario promedio de los profesores de diferentes departamentos, se puede usar el tono para diferenciar los departamentos. La saturación y el valor, por otro lado, se pueden utilizar para representar datos cuantitativos. En un mapa, la saturación puede representar la densidad de población en un diagrama de dispersión, la saturación de los puntos de datos individuales puede representar la edad o la riqueza de alguien. El tono único que se puede utilizar para representar valores cuantitativos es cuando tiene datos binarios divergentes. Por ejemplo, un mapa puede mostrar azules cada vez más saturados para los estados que se inclinan más por los demócratas y rojos cada vez más saturados para los estados que se inclinan más por los republicanos. Además de este caso especial de dos colores opuestos, es mejor evitar el uso de matices para representar datos cuantitativos.

    La forma es buena para datos nominales, aunque solo si hay menos de media docena de categorías. Verá que se usa la forma en los diagramas de dispersión al diferenciar entre algunas categorías de datos, pero las formas se agotan rápidamente después del triángulo, el cuadrado y el círculo. Los patrones y texturas también se pueden usar para distinguir datos categóricos, estos son especialmente útiles si necesita distinguir entre categorías en algo como un gráfico de barras, pero la visualización debe imprimirse en blanco y negro.

    Los datos relacionales se encuentran entre los más difíciles de representar. La distancia es la variable gráfica más simple para representar relaciones (los objetos más cercanos están más relacionados), pero esa variable puede volverse engorrosa rápidamente para grandes conjuntos de datos. Otras dos variables gráficas a utilizar son el recinto (elementos circundantes que están relacionados con una línea cerrada) o las conexiones de línea (que conectan elementos relacionados directamente a través de una línea continua). Cada uno tiene sus fortalezas y debilidades, y una gran parte del arte de la visualización de la información viene al aprender cuándo usar qué variable.

    Aspectos cognitivos y sociales de la visualización

    Por suerte para nosotros, existen algunos calibres para elegir entre tipos de visualización y variables gráficas que van más allá de lo meramente estético. La investigación social ha demostrado varias formas en que las personas procesan lo que ven y que la investigación debe guiar nuestras decisiones para crear visualizaciones de información efectivas.

    Aproximadamente una décima parte de todos los hombres y una centésima parte de todas las mujeres tienen alguna forma de daltonismo. Hay muchas variedades de daltonismo que algunas personas ven completamente en monocromo, otras tienen dificultades para distinguir entre rojo y verde, o entre azul y verde, u otras combinaciones además. Para compensar, las visualizaciones pueden codificar los mismos datos en múltiples variables. Los semáforos presentan un ejemplo perfecto de esto, la mayoría de nosotros estamos familiarizados con los esquemas de color rojo, amarillo y verde, pero para aquellas personas que no pueden distinguir entre estos colores, la orientación de arriba a abajo envía la misma señal. Si necesita elegir colores que la mayoría de las audiencias puedan distinguir con seguridad, algunos servicios en línea pueden ayudarlo. Un servicio popular es colorbrewer (http://colorbrewer2.org/), que le permite crear un esquema de color que se ajuste a cualquier conjunto de parámetros que pueda necesitar.

    En 2010, Randall Munroe realizó una encuesta masiva en línea pidiendo a las personas que nombraran los colores que se les presentaban al azar. Los resultados mostraron que las mujeres nombraron los colores de manera desproporcionada más específicamente que los hombres, de modo que cuando una mujer podría haber etiquetado un color como verde neón, un hombre podría haberlo llamado simplemente verde. Esto no implica que las mujeres puedan diferenciar más fácilmente entre colores, como algunos sugieren ocasionalmente, aunque parte de los resultados de la encuesta definitivamente muestran la cantidad desproporcionada de hombres que tienen algún tipo de daltonismo. Más allá del sexo y el género, la cultura también juega un papel en la interpretación de los colores en una visualización. En algunas culturas, la muerte está representada por el color negro, en otras, está representada por el blanco. En la mayoría de las culturas, tanto el calor como la pasión están representados por el color rojo, a menudo, pero no siempre, la enfermedad se identifica con el amarillo. Su audiencia debe influir en su elección de paleta de colores, ya que los lectores siempre llegarán a una visualización con nociones preconcebidas de lo que implican sus variables gráficas.

    Psicología Gestalt es una práctica centenaria de comprender cómo las personas perciben los patrones. Intenta mostrar cómo percibimos los elementos visuales separados como unidades completas, cómo organizamos lo que vemos en objetos discernibles (figura 3.40). Entre los principios de la psicología Gestalt se encuentran:

    Proximidad. Percibimos los objetos que están muy juntos como parte de un solo grupo.

    Semejanza. Los objetos visualmente similares (por ejemplo, del mismo color) se percibirán como parte de un solo grupo.

    Cierre. Tendemos a completar los espacios en blanco cuando falta información. Si vemos un cuadro en el que faltan dos esquinas, seguiremos viendo el cuadro como una sola unidad, en lugar de dos segmentos de línea inconexos.

    [inserte un cuadro de Gestalt en la Figura 3.40]

    Estos y otros principios gestálticos se pueden utilizar para tomar decisiones informadas con respecto a las variables gráficas. Saber qué patrones tienden a conducir a percepciones de continuidad o discontinuidad es esencial para realizar visualizaciones de información efectivas.

    En un nivel más detallado, al elegir entre variables gráficas igualmente apropiadas, la investigación sobre procesamiento previo a la atención puede guiarnos en la dirección correcta. Procesamos con atención ciertas variables gráficas, lo que significa que podemos detectar diferencias en esas variables en menos de 10 milisegundos. El color es una variable gráfica procesada previamente y, por lo tanto, en la figura 3.41, detectará muy rápidamente el punto que no corresponde. Que el procesamiento sea presencial implica que no es necesario buscar activamente la diferencia para encontrarla.

    [inserte la figura 3.41 Una de estas cosas simplemente no pertenece aquí]

    El tamaño, la orientación, el color, la densidad y muchas otras variables se procesan con atención previa. El problema surge cuando hay que combinar múltiples variables gráficas y, en la mayoría de visualizaciones, esa es precisamente la tarea que tenemos entre manos. Cuando se combinan variables gráficas (por ejemplo, forma y color), lo que inicialmente se procesó con atención previa a menudo pierde su facilidad de descubrimiento. La investigación sobre el procesamiento previo a la atención se puede utilizar para mostrar qué combinaciones siguen siendo útiles para la recopilación rápida de información. Una de esas combinaciones es la distancia espacial y el color. En la figura 3.42, puede determinar rápidamente los dos grupos espacialmente distintos y los colores espacialmente distintos.

    [inserte la Figura 3.42 grupos espacialmente distintos, colores espacialmente distintos]

    Otra limitación importante de la percepción humana a tener en cuenta es Cambia la ceguera. Cuando a las personas se les presentan dos imágenes de la misma escena, una tras otra, y a la segunda imagen le falta algún objeto que estaba en la primera, es sorprendentemente difícil discernir qué ha cambiado entre las dos imágenes. Lo mismo ocurre con las visualizaciones animadas / dinámicas. Tenemos dificultades para retener en nuestra mente la información de los fotogramas anteriores, por lo que, si bien una animación parece una forma noble de visualizar el cambio temporal, rara vez es eficaz. Reemplazar una animación con pequeños múltiplos, o alguna otra visualización estática, mejorará la capacidad del lector para notar cambios específicos a lo largo del tiempo.

    Hacer una visualización eficaz

    Si elegir los datos para una visualización es el primer paso, elegir una forma general el segundo y seleccionar la codificación visual adecuada el tercero, el paso final para armar una visualización de información efectiva es seguir los principios de diseño estético adecuados. Este paso ayudará a que su visualización sea efectiva y memorable. Para esta sección, nos inspiramos en los muchos libros de Edward Tufte sobre el tema y en la excelente guía en línea de Angela Zoss sobre visualización de información. 30

    Un principio aparentemente obvio que a menudo no se sigue es asegurarse de que su visualización sea alta resolución. Los detalles y las palabras más pequeños de la visualización deben ser nítidos, claros y completamente legibles. En la práctica, esto significa guardar sus gráficos en grandes resoluciones o crear sus visualizaciones como gráficos vectoriales escalables. Tenga en cuenta que la mayoría de los proyectores en las aulas aún no tienen una resolución tan alta como una hoja de papel impresa, por lo que crear una copia impresa para los estudiantes o asistentes de una conferencia puede ser más efectivo que proyectar su visualización en una pantalla.

    Otro elemento importante de las visualizaciones que a menudo se omiten son leyendas que describen cada variable gráfica en detalle y explica cómo esas variables gráficas se relacionan con los datos subyacentes. La mayoría de los programas de visualización no crean automáticamente leyendas, por lo que se descuidan. Una buena leyenda significa la diferencia entre una imagen bonita pero indescifrable y una visualización académica informativa. Adobe Photoshop e Illustrator, así como Inkscape y Gimp gratuitos, son buenas herramientas para crear leyendas.

    Una buena regla general al diseñar visualizaciones es reducir la proporción de datos: tinta tanto como sea posible. Maximice los datos, minimice la tinta. Las líneas extrañas, los cuadros delimitadores y otros elementos de diseño pueden distraer la atención de los datos que se presentan. La figura 3.43 muestra una comparación entre dos gráficos idénticos, excepto por la cantidad de tinta extraña.

    [inserte la Figura 3.43 El mismo gráfico, con y sin líneas extrañas]

    Una regla relacionada es evitar chartjunk cueste lo que cueste. Chartjunk son esas florituras artísticas que los periódicos y revistas colocan en sus visualizaciones de datos para hacerlas más llamativas: un hombre que cae en una fuerte tormenta junto a una visualización del clima ventoso actual o una casa que se derrumba para representar el colapso del mercado inmobiliario. Chartjunk puede llamar la atención, pero en última instancia, distrae la atención de los datos que se presentan, y los lectores tomarán más tiempo para digerir la información que se les presenta.

    Los efectos gráficos estilizados pueden distraer tanto como chartjunk. Los gráficos circulares "explotados" en los que los sectores circulares están muy separados entre sí, los gráficos de barras 3D y otras peculiaridades estilísticas que proporciona Excel son una decoración deficiente de la ventana y, de hecho, pueden disminuir la capacidad de la audiencia para leer su visualización. En un gráfico circular inclinado 3D, por ejemplo, puede ser bastante difícil estimar visualmente el área de cada sector circular. La inclinación hace que las porciones de pastel en la parte posterior parezcan más pequeñas que las del frente, y el aspecto 3D confunde a los lectores sobre si deberían estimar el área o el volumen.

    Si bien no es relevante para todas las visualizaciones, es importante recordar etiquetar sus ejes y asegurarse de que cada eje tenga la escala adecuada. En particular, el eje vertical de los gráficos de barras debe comenzar en cero. La figura 3.44 es un ejemplo perfecto de cómo mentir con la visualización de datos iniciando el eje demasiado alto, haciendo que parezca que una pequeña diferencia en los datos es en realidad una gran diferencia.

    [inserte la Figura 3.44 Un cuadro que se encuentra.]

    Hay un arte en perfeccionar una visualización. Ninguna fórmula le dirá qué hacer en cada situación, pero siguiendo estos pasos (1. Elija sus datos, 2. Elija su tipo de visualización, 3. Elija sus variables gráficas, 4. Siga los principios básicos de diseño), las visualizaciones que crea será eficaz e informativo. La combinación de esto con las lecciones en otras partes de este libro sobre texto, redes y otros análisis debería sentar las bases para producir proyectos de historia digital efectivos.

    Este capítulo ha cubierto mucho terreno: hemos pasado del campo relativamente simple de las nubes de palabras al mundo más sofisticado de la descripción general, las expresiones regulares y hemos insinuado técnicas aún más avanzadas que acechan en las sombras.Sin embargo, todos comparten el mismo objetivo: cómo tomar mucha información y explorarla de maneras que una persona no podría. ¿Cómo podemos usar nuestras computadoras, estas poderosas máquinas ubicadas en nuestros escritorios o regazos, para más que solo procesamiento de texto, pero aprovechar su potencial computacional? Sin embargo, como notaremos en el próximo capítulo, un problema potencial de esto es que nosotros, en la mayoría de estos casos, todavía necesitábamos saber lo que estábamos buscando. Los datos no "hablan" por sí mismos: requieren interpretación, requieren visualización.

    Los académicos, a menudo aprenden leyendo y tamizando: mirando a través de cajas de archivo, leyendo literatura, no con la mirada puesta en un resultado de investigación en particular, sino con el objetivo de comprender de manera integral el campo, abordado desde una perspectiva particular (teoría). Podemos hacer lo mismo con los repositorios de Big Data, tratando de obtener una vista macroscópica del campo, a través de métodos que incluyen el modelado de temas y el análisis de redes. En los siguientes capítulos, nos basamos en nuestras investigaciones más específicas aquí con una implementación a gran escala del macroscopio de nuestro historiador.

    Adam Crymble, "¿Podemos reconstruir un texto a partir de una nube de palabras?" 5 de agosto de 2013, Reflexiones sobre la historia pública y digital, http://adamcrymble.blogspot.ca/2013/08/can-we-reconstruct-text-from-wordcloud.html.↩

    Sinclair, Stéfan y Geoffrey Rockwell. Hermenutic.ca - La retórica del análisis de texto http: //hermeneuti.ca↩

    Hay más herramientas disponibles en Voyant, haciendo clic en el icono "guardar" en la parte superior derecha de la página en la barra de título azul "Herramientas de Voyant: Revele sus textos". Este icono abre una ventana emergente con cinco opciones de exportación diferentes. El primero, 'una URL para esta herramienta y datos actuales' le proporcionará una URL directa a su corpus que luego puede compartir con otros o volver a la opción final en un momento posterior, 'una URL para una herramienta / máscara diferente and current data 'abrirá otro menú que le permitirá seleccionar qué herramienta desea utilizar. Si seleccionó "RezoViz" (una herramienta para construir una red con organizaciones, individuos y nombres de lugares extraídos de sus textos), terminaría con una URL como esta:

    La cadena de números es el ID del corpus de sus textos. Si conoce el nombre de otra herramienta, puede escribirlo después de / tool / y antes de /?corpus.↩

    Jonathan Stray ha escrito un artículo excelente sobre el uso de la descripción general como parte de un flujo de trabajo de "periodismo de datos", muchos de los cuales son apropiados para el historiador. Véase Stray, J. 2014 "Tienes los documentos. ¿Ahora que?' Fuente.OpenNews.org https://source.opennews.org/en-US/learning/you-got-documents-now-what/↩

    La documentación de la descripción general se puede encontrar en http://overview.ap.org/ el software en sí se puede descargar en https://github.com/overview/overview-server/wiki/Installing-and-Running-Overview↩

    Como en este ejemplo http://overview.ap.org/blog/2013/07/comparing-text-to-data-by-importing-tags/↩

    Las expresiones Regex se instancian a veces de manera diferente dependiendo del programa con el que esté trabajando. Simplemente no funcionan en Microsoft Word. Para obtener los mejores resultados, pruebe TextWrangler (en Mac) o Notepad ++ (en Windows) .↩

    Notepad ++ (para Windows) se puede descargar en http://notepad-plus-plus.org/. Textwrangler (para Mac) se puede encontrar en http://www.barebones.com/products/textwrangler/↩

    Disponible en http://notepad-plus-plus.org/ si aún no lo ha instalado. En mac, pruebe Textwrangler http://www.barebones.com/products/textwrangler/↩

    Estos son marcadores de "límites de palabras". Ver http://www.regular-expressions.info/wordbo limits.html↩

    descrito con más detalle aquí https://github.com/OpenRefine/OpenRefine/wiki/Clustering-In-Depth.↩

    Vale la pena señalar que una vez que haya limpiado los datos en formato CSV o TSV, sus datos se pueden importar a una variedad de otras herramientas o estar listos para otros tipos de análisis. Muchas herramientas de visualización en línea como Raw (http://app.raw.densitydesign.org/) y Palladio (http://palladio.designhumanities.org/) aceptan y esperan datos en este formato.

    http://nlp.stanford.edu/software/CRF-NER.shtml. Puede desarrollar clasificadores para sus propios dominios particulares utilizando el NER de Stanford. Se proporciona más información al respecto aquí: http://nlp.stanford.edu/software/crf-faq.shtml↩

    Michelle Moravec ofrece un buen tutorial sobre NER en su blog en "Cómo usar el NER de Stanford y extraer resultados". Historia en la Ciudad 28 de junio de 2014 http://historyinthecity.blogspot.ca/2014/06/how-to-use-stanfords-ner-and-extract.html↩

    Vea, por ejemplo, "redes dinámicas en gephi" en nuestro sitio de borrador para este libro, http://www.themacroscope.org/?page_id=525↩

    Si bien no entramos en detalles sobre el formato json, es cada vez más común como formato de datos para visualizaciones basadas en web que utilizan la biblioteca de código d3.js. Una muy buena referencia para trabajar en esta biblioteca y con archivos json es Elijah Meeks, D3.js en acción Manning, 2014 http://www.manning.com/meeks/↩

    Extraviado, Jonathan. "Tienes los documentos. ¿Ahora que? - Aprendizaje - Fuente: Un proyecto de OpenNews ". Fuente, 14 de marzo de 2014. https://source.opennews.org/en-US/learning/you-got-documents-now-what/.↩

    http://tabula.nerdpower.org/ Dado que es de código abierto, puede bifurcarlo en github para obtener y mantener su propia copia, en caso de que el sitio web original de "Tabula" se desconecte. De hecho, este es un hábito en el que debes adquirir.

    Gill, David W. J. y Christopher Chippindale. "Consecuencias materiales e intelectuales de la estima por las figuras de las Cícladas". Revista estadounidense de arqueología 97, no. 4 (Octubre de 1993): 601. doi: 10.2307 / 506716.↩


    Tianditu y ampHuawei Cloud

    Los datos comerciales de Tiandi son complejos y diversos, combinados con los requisitos del cliente y las características comerciales. La base de datos HUAWEI CLOUD adopta una arquitectura de nube híbrida con servicios de nube pública como servicio externo principal y pruebas internas de nube privada como complemento, proporcionando múltiples soluciones de motor de base de datos para crear conjuntamente una base digital de alto rendimiento y alta disponibilidad.

    Huawei Cloud GaussDB (para Mongo) brinda servicios de procesamiento de datos en mosaico para mapas en línea Huawei Cloud RDS para PostgreSQL brinda datos vectoriales y servicios de procesamiento de datos 3D Huawei Cloud RDS para MySQL brinda administración de usuarios y servicios de atributos de capa temáticos, y una variedad de bases de datos son extremadamente rápidas Integración y esfuerzos conjuntos, la migración de 17TB de datos masivos tomó solo 2 días.

    Como plataforma de servicios a nivel nacional, la seguridad y confiabilidad de los datos es de suma importancia. HUAWEI CLOUD GaussDB (para Mongo) admite alta disponibilidad cruzada entre las zonas de disponibilidad, tiene una estrategia integral de recuperación ante desastres entre regiones, respaldo completo automático y respaldo incremental todos los días, y simulacros de recuperación regulares para verificar la efectividad del proceso de respaldo y recuperación, y lograr restauración de copias de seguridad a nivel de minutos. Al mismo tiempo, proporciona nodos de enrutamiento sin estado, admite la conmutación por error de segundo nivel, los servicios al cliente no lo saben y las operaciones comerciales son estables.

    Sky Map proporciona servicios básicos de plataforma de información geográfica para más de 30 ministerios y agencias y más de 30 provincias y ciudades en todo el país. La API y las llamadas de servicio diarias promedio superan los 600 millones de veces, y la presión de acceso es extremadamente alta. HUAWEI CLOUD GaussDB (para Mongo) puede lograr una expansión de nodos a nivel de minutos y una expansión de almacenamiento de segundo nivel para satisfacer las necesidades de flexibilidad empresarial ágil. No tiene presión sobre el acceso de hasta cientos de millones de Tiandi, y la capacidad de respuesta es rápida, estable y precisa, lo que garantiza de manera efectiva que Tiandi sea alta. El funcionamiento normal de la empresa en el escenario de carga. Además, GaussDB (para Mongo) se basa en la arquitectura de separación de almacenamiento-computación y la optimización de rocksdb. En comparación con el MongDB de código abierto, el rendimiento se mejora en más de 3 veces. Admite una capacidad máxima de procesamiento de datos de 96 TB, lo que satisface plenamente los requisitos comerciales masivos de Tiantu.

    GaussDB (para Mongo) es totalmente compatible con el protocolo MongoDB. Los clientes pueden cambiar fácilmente las bases de datos sin ninguna transformación, lo que reduce en gran medida el costo de transformación y, a través de la capacidad de generar y eliminar instantáneas en tiempo real, GaussDB (para Mongo) realiza un conjunto de clústeres. Puede proporcionar la capacidad de separar la lectura y la escritura, ahorrando al menos el 50% de los costos de la base de datos. Después de HUAWEI CLOUD en el mapa, basado en la plataforma de operación y mantenimiento automatizado del servicio de base de datos, la eficiencia de actualización de datos se ha multiplicado por 5 y la velocidad de los lanzamientos de nuevos negocios se ha multiplicado por 2. También reduce la gran presión de operación y mantenimiento del DBA y permite que los clientes se concentren más en el nivel comercial.

    Desde su lanzamiento en febrero de 2019, la base de datos de HUAWEI CLOUD ha respaldado fácilmente las más de 600 millones de visitas diarias promedio de Tiandi, asegurando el buen funcionamiento del negocio y logrando cero accidentes al mismo tiempo, ha brindado al público información más completa, precisa, autoritario, inteligente y humano El servicio integrado de información geográfica permite que toda la sociedad comparta los logros del desarrollo de la topografía y la cartografía y sienta el encanto único de & quotDigital China & quot.