Academia de Datos Abiertos

Acceso libre a información pública

Datos para mejorar la transparencia, eficiencia y participación ciudadana

Ver videos
Ir a la Academia
Datos Abiertos Creado: 18/08/2025

Introducción a los Datos Abiertos

Curso completo sobre el concepto, importancia y aplicación de los datos abiertos en la sociedad actual. Aprenderás a acceder, analizar y utilizar datos abiertos para proyectos de investigación, periodismo de datos y desarrollo de aplicaciones.

Contenido del curso

1. Fundamentos de Datos Abiertos

¿Qué son los datos abiertos?
Historia y evolución
Principios y características

2. Fuentes de Datos Abiertos

3. Formatos y Estándares

4. Herramientas de Análisis

5. Casos de Uso y Aplicaciones

Bienvenido al curso de Datos Abiertos

Selecciona un tema del menú de la izquierda para comenzar a aprender sobre los datos abiertos. Este curso te proporcionará una comprensión completa de qué son los datos abiertos, cómo acceder a ellos y cómo utilizarlos para diversos propósitos.

Este curso está diseñado para principiantes y no requiere conocimientos previos en análisis de datos o programación.

Lo que aprenderá

Comprender el concepto y la importancia de los datos abiertos
Identificar y acceder a fuentes de datos abiertos
Trabajar con diferentes formatos de datos abiertos
Utilizar herramientas básicas para análisis de datos
Crear visualizaciones efectivas con datos abiertos
Aplicar datos abiertos en proyectos prácticos

Además, podrá:

  • Explorar ejemplos reales del uso de datos abiertos en proyectos institucionales, sociales y periodísticos.
  • Reconocer principios éticos, licencias de uso y buenas prácticas para compartir y reutilizar datos abiertos.
  • Conocer recursos adicionales, comunidades de práctica y herramientas para profundizar más allá del curso.

¿Qué son los datos abiertos?

Los datos abiertos son información accesible, disponible y reutilizable por cualquier persona, sin restricciones de copyright, patentes u otros mecanismos de control. Se caracterizan por:

  • Disponibilidad y acceso: los datos deben estar disponibles completos y en un formato conveniente y modificable.
  • Reutilización y redistribución: los datos deben ser provistos bajo términos que permitan su reutilización y redistribución.
  • Participación universal: todos deben poder usar, reutilizar y redistribuir los datos sin discriminación.

Beneficios de los datos abiertos

Transparencia

Permiten mayor rendición de cuentas y transparencia en gobiernos e instituciones.

Innovación

Son materia prima para creación de nuevos productos y servicios.

Eficiencia

Mejoran procesos al permitir acceso a información previamente inaccesible.

Participación

Facilitan la participación ciudadana en la toma de decisiones.

Ejemplos de datos abiertos

Tipo Ejemplo Uso potencial
Presupuestos Gastos del gobierno Análisis de transparencia fiscal
Transporte Horarios de autobuses Aplicaciones de movilidad
Salud Estadísticas epidemiológicas Investigación médica

Historia y evolución de los datos abiertos

El movimiento de datos abiertos tiene sus raíces en varias corrientes históricas que convergen en el siglo XXI:

2007

Primera reunión del Open Government Working Group

Grupo de activistas que definió los 8 principios de los datos abiertos gubernamentales en Sebastopol, California.

2009

Lanzamiento de Data.gov

Estados Unidos lanza el primer portal nacional de datos abiertos bajo la administración Obama.

2011

Creación de la Open Knowledge Foundation

Organización internacional que promueve el conocimiento abierto, incluyendo datos abiertos.

2013

Carta Internacional de Datos Abiertos

Países del G8 adoptan principios comunes para la publicación de datos gubernamentales abiertos.

Hitos en América Latina

México fue pionero en la región con la creación de datos.gob.mx en 2015, seguido por Argentina, Brasil y Colombia.

Factores clave en su desarrollo

  • Avances en tecnologías de internet
  • Movimientos por gobierno abierto
  • Demanda de transparencia pública
  • Crecimiento de la economía digital

Retos actuales

  • Calidad y actualización de datos
  • Interoperabilidad entre sistemas
  • Privacidad y protección de datos
  • Sostenibilidad de iniciativas

Principios y características de los datos abiertos

Los datos abiertos se rigen por principios fundamentales que garantizan su utilidad y accesibilidad. Estos principios fueron establecidos originalmente en 2007 y han sido adoptados internacionalmente:

Completos

Los datos deben estar disponibles en su totalidad, sin omisiones significativas.

Primarios

Deben publicarse en su forma original, tal como fueron recolectados.

Oportunos

Deben estar disponibles tan pronto como sea necesario para preservar su valor.

Accesibles

Deben estar disponibles para el público más amplio posible y para los usos más diversos.

Características técnicas

Para que los datos sean verdaderamente abiertos, deben cumplir con características técnicas específicas que faciliten su uso y reutilización.

Característica Descripción Ejemplo
Formatos abiertos Formatos que pueden ser procesados por múltiples herramientas CSV, JSON, XML
Estructura clara Datos bien organizados con metadatos descriptivos Encabezados de columnas descriptivos
Licencia abierta Permiso explícito para uso y reutilización Creative Commons CC-BY
Identificadores persistentes URLs estables para referencia a largo plazo DOIs o URLs permanentes

Portales gubernamentales de datos abiertos

Los gobiernos de todo el mundo han establecido portales oficiales para publicar sus datos abiertos. Estos portales son la principal fuente de datos gubernamentales accesibles al público.

Principales portales internacionales

Portales en América Latina

La mayoría de países latinoamericanos cuentan con portales nacionales de datos abiertos, aunque con diferentes niveles de desarrollo y contenido.

País Portal Conjuntos de datos Temas principales
México datos.gob.mx +35,000 Economía, salud, educación
Colombia datos.gov.co +10,000 Transporte, contratación pública
Argentina datos.gob.ar +5,000 Estadísticas, medio ambiente
Brasil dados.gov.br +8,000 Educación, seguridad pública

Cómo utilizar estos portales

Búsqueda básica

La mayoría de portales ofrecen sistemas de búsqueda por palabras clave, categorías temáticas o instituciones responsables.

Filtros avanzados

Puedes filtrar por formato de datos, frecuencia de actualización, licencia o fecha de publicación.

Visualización previa

Muchos portales permiten visualizar los datos directamente en el navegador antes de descargarlos.

APIs

Algunos portales ofrecen acceso programático a los datos mediante interfaces de programación (APIs).

Organizaciones internacionales con datos abiertos

Además de los gobiernos nacionales, muchas organizaciones internacionales publican datos abiertos sobre temas globales como salud, desarrollo, economía y medio ambiente.

Principales organizaciones

ONU

Naciones Unidas

La ONU ofrece datos sobre desarrollo sostenible, derechos humanos, población y más.

data.un.org
Banco Mundial

Banco Mundial

Extensas bases de datos sobre desarrollo económico, pobreza, infraestructura y más.

data.worldbank.org
OMS

Organización Mundial de la Salud

Datos sobre salud global, epidemias, sistemas de salud y estadísticas vitales.

www.who.int/data

Tipos de datos disponibles

Indicadores de desarrollo

Mediciones estandarizadas para comparar países (ej. PIB, esperanza de vida).

Microdatos de encuestas

Resultados detallados de encuestas a hogares o empresas.

Datos geoespaciales

Información mapeada sobre clima, recursos naturales, población.

Cómo acceder a estos datos

Algunas organizaciones requieren registro para acceder a ciertos conjuntos de datos, aunque la mayoría son completamente abiertos.

1. Explorar el catálogo

La mayoría de portales tienen sistemas de búsqueda y filtrado por temas, países o años.

2. Verificar la documentación

Es crucial leer las notas metodológicas para entender cómo se recolectaron y procesaron los datos.

3. Descargar en formato adecuado

Seleccionar el formato que mejor se adapte a tus necesidades (CSV para análisis, JSON para desarrollo web).

APIs y catálogos de datos abiertos

Las APIs (Interfaces de Programación de Aplicaciones) permiten acceder a datos abiertos de manera programática, facilitando la integración en aplicaciones y análisis automatizados.

¿Qué es una API de datos?

Una API es un conjunto de reglas que permite a diferentes aplicaciones comunicarse entre sí. En el contexto de datos abiertos, las APIs permiten consultar y obtener datos directamente desde programas informáticos sin necesidad de descargar archivos completos.

Ventajas de usar APIs

  • Acceso a datos actualizados en tiempo real
  • Posibilidad de consultar solo los datos necesarios
  • Integración directa con aplicaciones y dashboards
  • Automatización de procesos de recolección de datos

Ejemplos comunes

  • APIs de datos meteorológicos
  • APIs de indicadores económicos
  • APIs de transporte público
  • APIs de datos demográficos

Catálogos de datos abiertos

Los catálogos son repositorios que agregan metadatos sobre conjuntos de datos disponibles en múltiples fuentes. Algunos ejemplos destacados:

CKAN

Plataforma de código abierto utilizada por muchos gobiernos para publicar sus catálogos de datos.

ckan.org

DataHub

Plataforma comunitaria para compartir y descubrir conjuntos de datos.

datahub.io

Google Dataset Search

Buscador de Google especializado en conjuntos de datos.

datasetsearch.research.google.com

Cómo trabajar con APIs

No necesitas ser programador para usar muchas APIs, existen herramientas como Postman o incluso hojas de cálculo que pueden conectarse a APIs simples.

1. Encontrar la documentación

Toda API buena tiene documentación que explica cómo hacer consultas y qué datos están disponibles.

2. Obtener una clave API (si es necesaria)

Algunas APIs requieren registro para obtener una clave de acceso.

3. Hacer consultas de prueba

Comenzar con consultas simples para entender la estructura de los datos devueltos.

4. Procesar los resultados

Los datos suelen venir en formato JSON o XML, que pueden ser procesados por muchos lenguajes de programación.

Formatos comunes: CSV, JSON, XML

Los datos abiertos se publican en diversos formatos, cada uno con sus ventajas y casos de uso específicos. Conocer estos formatos es esencial para trabajar eficientemente con datos.

CSV (Comma-Separated Values)

Características

  • Formato de texto plano
  • Datos organizados en filas y columnas
  • Separados por comas u otros delimitadores
  • Primera línea suele contener los nombres de las columnas

Ventajas

  • Simple y universalmente compatible
  • Fácil de leer y editar
  • Eficiente para grandes volúmenes de datos
  • Ideal para hojas de cálculo
nombre,edad,ciudad
                     Juan,28,Madrid
                     María,34,Barcelona
                     Luis,45,Valencia

JSON (JavaScript Object Notation)

Características

  • Formato basado en texto
  • Estructura de pares clave-valor
  • Anidamiento jerárquico
  • Muy usado en APIs web

Ventajas

  • Estructura flexible y legible
  • Soporte para datos complejos
  • Ampliamente usado en desarrollo web
  • Fácil de procesar en JavaScript
{
                        "personas": [
                           {
                              "nombre": "Juan",
                              "edad": 28,
                              "ciudad": "Madrid"
                           },
                           {
                              "nombre": "María",
                              "edad": 34,
                              "ciudad": "Barcelona"
                           }
                        ]
                     }

XML (eXtensible Markup Language)

Características

  • Lenguaje de marcado
  • Estructura jerárquica con etiquetas
  • Extensible y autodescriptivo
  • Más verboso que JSON

Ventajas

  • Estandarizado y bien documentado
  • Soporte para esquemas (XSD)
  • Amplia compatibilidad
  • Bueno para documentos complejos
<personas>
                        <persona>
                           <nombre>Juan</nombre>
                           <edad>28</edad>
                           <ciudad>Madrid</ciudad>
                        </persona>
                        <persona>
                           <nombre>María</nombre>
                           <edad>34</edad>
                           <ciudad>Barcelona</ciudad>
                        </persona>
                     </personas>

Comparación de formatos

Formato Mejor para Tamaño Legibilidad
CSV Datos tabulares simples Pequeño Media (sin estructura)
JSON Datos estructurados jerárquicos Mediano Alta
XML Documentos complejos Grande Media-alta

Linked Open Data

Linked Open Data (LOD) es un método para publicar datos estructurados de manera que puedan ser interconectados y enlazados entre diferentes fuentes, creando una "web de datos".

Principios de Linked Data

1. Usar URIs como identificadores

Cada cosa (entidad) debe tener un identificador único (URI) que permita referenciarla.

2. Usar HTTP URIs

Las URIs deben ser accesibles vía HTTP para que tanto personas como máquinas puedan buscarlas.

3. Proporcionar información útil

Cuando alguien busca una URI, debe obtener información útil sobre la entidad que representa.

4. Incluir enlaces

Los datos deben incluir enlaces a otras URIs para permitir el descubrimiento de más información.

Ventajas de Linked Open Data

LOD permite conectar datos de diferentes fuentes como si fuera una gran base de datos global, facilitando el descubrimiento de relaciones entre datos aparentemente no relacionados.

Interoperabilidad

Datos de diferentes fuentes pueden trabajar juntos usando estándares comunes.

Reutilización

Los datos pueden ser combinados de formas no previstas originalmente.

Descubrimiento

Los enlaces entre datos facilitan encontrar información relacionada.

Ejemplos de proyectos LOD

Wikidata

Wikidata

Base de conocimiento libre que sirve como almacenamiento centralizado para los datos estructurados de los proyectos de Wikimedia.

wikidata.org
DBpedia

DBpedia

Proyecto que extrae información estructurada de Wikipedia y la publica como datos enlazados.

dbpedia.org

Cómo consumir Linked Open Data

1. Explorar con navegadores LOD

Herramientas como lod-cloud.net permiten explorar la nube de datos enlazados.

2. Consultar con SPARQL

SPARQL es el lenguaje de consulta para datos enlazados, similar a SQL para bases de datos relacionales.

3. Usar APIs específicas

Muchos proyectos LOD ofrecen APIs amigables para desarrolladores.

Metadatos y documentación

Los metadatos son "datos sobre los datos" que proporcionan información esencial para entender, interpretar y utilizar correctamente los conjuntos de datos abiertos.

Importancia de los metadatos

Sin metadatos adecuados, los datos pueden ser difíciles de encontrar, entender o usar correctamente, reduciendo significativamente su valor potencial.

Qué incluyen los metadatos

  • Título y descripción del conjunto de datos
  • Organización responsable
  • Fecha de publicación y actualización
  • Cobertura geográfica y temporal
  • Licencia de uso
  • Estructura de los datos
  • Definiciones de variables
  • Métodos de recolección

Estándares de metadatos

  • DCAT: Data Catalog Vocabulary para portales de datos
  • Schema.org: Estándar para marcado web
  • ISO 19115: Para información geoespacial
  • Dublin Core: Metadatos básicos

Documentación de conjuntos de datos

1. Documentación técnica

Explica el formato, estructura, codificación, esquema de la base de datos, relaciones entre tablas, etc.

2. Diccionario de datos

Define cada variable, sus valores posibles, unidades de medida, códigos utilizados, etc.

3. Documentación metodológica

Describe cómo se recolectaron los datos, criterios de inclusión/exclusión, limitaciones, etc.

Ejemplo de metadatos

{
                        "title": "Estadísticas de Educación Superior",
                        "description": "Datos sobre matriculados, graduados y personal en universidades públicas",
                        "publisher": {
                           "name": "Ministerio de Educación",
                           "web": "https://www.educacion.gov"
                        },
                        "issued": "2023-01-15",
                        "modified": "2023-06-30",
                        "license": "CC-BY 4.0",
                        "keywords": ["educación", "universidades", "matrícula"],
                        "temporal": {
                           "start": "2010",
                           "end": "2022"
                        },
                        "spatial": "Nacional",
                        "columns": [
                           {
                              "name": "universidad",
                              "type": "string",
                              "description": "Nombre de la institución"
                           },
                           {
                              "name": "matriculados",
                              "type": "integer",
                              "description": "Número total de estudiantes matriculados"
                           }
                        ]
                     }

Buenas prácticas

Completos

Incluir toda la información necesaria para entender y usar los datos.

Accesibles

Publicar los metadatos junto con los datos y en formatos estándar.

Actualizados

Mantener los metadatos sincronizados con los datos que describen.

Excel y hojas de cálculo para análisis de datos

Las hojas de cálculo como Microsoft Excel y Google Sheets son herramientas accesibles y poderosas para el análisis básico de datos abiertos, especialmente para usuarios sin conocimientos de programación.

Funciones básicas para trabajar con datos

Función Descripción Ejemplo
FILTRAR Filtrar datos según criterios =FILTRAR(A2:B10, B2:B10>100)
BUSCARV Buscar valores verticalmente =BUSCARV("Madrid", A2:B10, 2, FALSO)
PROMEDIO Calcular promedio =PROMEDIO(B2:B100)
CONTAR.SI Contar con condición =CONTAR.SI(A2:A100, ">50")

Tablas dinámicas

Las tablas dinámicas son una de las herramientas más poderosas en Excel para resumir, analizar, explorar y presentar datos.

Pasos para crear una tabla dinámica

  1. Seleccionar los datos a analizar
  2. Insertar > Tabla dinámica
  3. Arrastrar campos a las áreas de filas, columnas y valores
  4. Aplicar filtros si es necesario
  5. Personalizar cálculos y formato

Usos comunes

  • Resumir grandes conjuntos de datos
  • Identificar patrones y tendencias
  • Comparar datos entre categorías
  • Crear informes dinámicos

Gráficos básicos

Gráficos de barras

Ideales para comparar categorías o mostrar cambios en el tiempo.

Gráficos de líneas

Buenos para mostrar tendencias a lo largo del tiempo.

Gráficos de dispersión

Útiles para visualizar relaciones entre variables.

Limpieza de datos en Excel

1. Eliminar duplicados

Datos > Quitar duplicados

2. Rellenar valores vacíos

Usar funciones como SI.ERROR o SI.ND

3. Dividir columnas

Datos > Texto en columnas

4. Validación de datos

Datos > Validación de datos

Python y R para análisis de datos

Para análisis más avanzados, Python y R son los lenguajes más utilizados en ciencia de datos y análisis de datos abiertos. Ofrecen mayor potencia, flexibilidad y capacidad de automatización que las hojas de cálculo.

Python

Python

Lenguaje de propósito general con una gran comunidad en ciencia de datos y un ecosistema rico de bibliotecas especializadas.

Pandas para manipulación de datos
Matplotlib/Seaborn para visualización
Scikit-learn para machine learning
R

R

Lenguaje especializado en análisis estadístico y visualización de datos, muy popular en investigación académica.

Tidyverse para manipulación de datos
ggplot2 para visualización
Amplias capacidades estadísticas

Ejemplo básico en Python (Pandas)

import pandas as pd
                     
                     # Cargar datos desde CSV
                     datos = pd.read_csv('datos_abiertos.csv')
                     
                     # Mostrar primeras filas
                     print(datos.head())
                     
                     # Estadísticas descriptivas
                     print(datos.describe())
                     
                     # Filtrar datos
                     filtrados = datos[datos['poblacion'] > 100000]
                     
                     # Agrupar y resumir
                     resumen = datos.groupby('region')['ingresos'].mean()
                     
                     # Guardar resultados
                     resumen.to_csv('resultados.csv')

Ejemplo básico en R (Tidyverse)

library(tidyverse)
                                                
                              # Cargar datos desde CSV
                              datos <- read_csv("datos_abiertos.csv")
                                                
                              # Mostrar primeras filas
                              head(datos)
                                                
                              # Estadísticas descriptivas
                              summary(datos)
                                                
                              # Filtrar datos
                              filtrados <- datos %>% filter(poblacion > 100000)
                                                
                              # Agrupar y resumir
                              resumen <- datos %>% 
                              group_by(region) %>% 
                              summarise(ingreso_promedio = mean(ingresos))
                                                
                              # Guardar resultados
                              write_csv(resumen, "resultados.csv")

Cómo elegir entre Python y R

Criterio Python R
Facilidad de aprendizaje Más fácil para principiantes Curva de aprendizaje más pronunciada
Comunidad Más grande y diversa Fuerte en estadística e investigación
Visualización Buena, requiere más código Excelente con ggplot2
Integración Mejor para integrar con otros sistemas Más orientado a análisis puro

Visualización de datos

La visualización de datos es una parte esencial del análisis, permitiendo descubrir patrones, comunicar hallazgos y hacer que los datos sean accesibles a audiencias más amplias.

Principios de buena visualización

Claridad

El mensaje principal debe ser evidente.

Precisión

Las escalas y proporciones deben ser correctas.

Eficiencia

Máxima información con mínimo ruido visual.

Tipos de visualizaciones

Para comparaciones

  • Gráficos de barras
  • Gráficos de columnas
  • Gráficos de radar

Para distribuciones

  • Histogramas
  • Gráficos de caja
  • Gráficos de densidad

Para relaciones

  • Gráficos de dispersión
  • Mapas de calor
  • Gráficos de burbujas

Para composición

  • Gráficos de torta
  • Gráficos de área apilada
  • Treemaps

Herramientas de visualización

Pandas/Matplotlib

Matplotlib/Seaborn (Python)

Bibliotecas estándar para visualización en Python, altamente personalizables.

ggplot2

ggplot2 (R)

Sistema de visualización basado en la gramática de gráficos, muy potente y expresivo.

Tableau

Tableau/Power BI

Herramientas comerciales para visualización interactiva con interfaz gráfica.

Buenas prácticas

Evita gráficos engañosos: escalas que no empiezan en cero, gráficos 3D que distorsionan proporciones, o selección sesgada de datos.

1. Conoce tu audiencia

Diseña visualizaciones apropiadas para el nivel técnico de quienes las verán.

2. Elige el tipo correcto

Selecciona el gráfico que mejor comunique tu mensaje.

3. Simplifica

Elimina elementos decorativos que no aportan información.

4. Usa color estratégicamente

El color debe tener significado y ser accesible para daltónicos.

Transparencia gubernamental

Los datos abiertos son una herramienta fundamental para promover la transparencia en la gestión pública, permitiendo a los ciudadanos monitorear las acciones de sus gobiernos y exigir rendición de cuentas.

Áreas clave para transparencia

Presupuestos

Gastos, ingresos y ejecución presupuestaria.

Contrataciones

Procesos de compra pública y adjudicaciones.

Salarios

Remuneraciones de funcionarios públicos.

Resultados

Indicadores de desempeño y logros.

Servicios

Calidad y cobertura de servicios públicos.

Normativas

Proyectos de ley y regulaciones.

Ejemplos de impacto

OpenSpending

OpenSpending

Plataforma que rastrea el gasto público en todo el mundo, permitiendo a los ciudadanos ver cómo se utilizan sus impuestos.

openspending.org
Contrataciones Abiertas

Estándar de Contrataciones Abiertas

Iniciativa para publicar datos estructurados sobre procesos de contratación pública, combatiendo la corrupción.

open-contracting.org

Cómo los ciudadanos pueden usar estos datos

Los datos por sí solos no generan transparencia; es necesario que ciudadanos, periodistas y organizaciones civiles los analicen, interpreten y utilicen para hacer preguntas y demandar respuestas.

1. Monitorear el gasto público

Identificar partidas presupuestarias inusuales o contratos sospechosos.

2. Comparar entre gobiernos

Analizar diferencias en ejecución presupuestaria o provisión de servicios.

3. Participar en audiencias públicas

Usar datos para fundamentar preguntas y propuestas.

4. Desarrollar aplicaciones cívicas

Crear herramientas que hagan los datos más accesibles.

Periodismo de datos

El periodismo de datos utiliza conjuntos de datos abiertos para investigar, contar historias y apoyar reportajes con evidencia cuantitativa, llevando el periodismo a un nuevo nivel de profundidad y rigor.

Proceso del periodismo de datos

1

Encontrar la historia

Identificar preguntas periodísticas que puedan responderse con datos.

2

Obtener los datos

Acceder a fuentes de datos abiertos o recolectar datos propios.

3

Limpiar y analizar

Preparar los datos y buscar patrones, tendencias o anomalías.

4

Visualizar y contar

Presentar los hallazgos de forma clara y atractiva.

Ejemplos destacados

ProPublica

ProPublica

Medio pionero en periodismo de datos, con investigaciones basadas en análisis de grandes conjuntos de datos.

propublica.org
The Guardian

The Guardian Data Blog

Sección especializada en visualización y análisis de datos sobre temas de actualidad.

theguardian.com/data

Herramientas para periodistas

Limpieza y transformación de datos

OpenRefine

Para limpieza y transformación de datos.

https://openrefine.org

Trifacta Wrangler

Transformación y exploración visual de datos.

https://cloud.google.com/dataprep

Tabula

Para extraer tablas desde archivos PDF.

https://tabula.technology

CSVKit

Conjunto de herramientas en línea de comandos para procesar, limpiar y transformar archivos CSV.

https://csvkit.readthedocs.io

Visualización de datos

DataWrapper

Para crear visualizaciones interactivas simples.

https://app.datawrapper.de

Flourish

Para visualizaciones avanzadas y storytelling.

https://flourish.studio

Infogram

Infografías y dashboards interactivos.

https://infogram.com

Piktochart

Diseño de infografías, reportes y presentaciones.

https://piktochart.com

Acceso a datasets

Kaggle Datasets

Acceso a miles de datasets públicos y retos de análisis.

https://www.kaggle.com/datasets

Google Dataset Search

Buscador global de conjuntos de datos públicos.

https://datasetsearch.research.google.com

datos.gob.es

Portal oficial de datos abiertos del Gobierno de España, con miles de conjuntos de datos públicos reutilizables.

https://datos.gob.es

Datahub.io

Repositorio comunitario con datasets sobre temas globales como economía, salud, medio ambiente y más.

https://datahub.io

Análisis estadístico

R + RStudio

Lenguaje especializado en estadística y visualización.

https://posit.co/products/open-source/rstudio/

Google Colab

Cuadernos interactivos en la nube con Python.

https://colab.research.google.com

Jupyter Notebook

Entorno interactivo para análisis de datos en Python, R o Julia, ampliamente utilizado en ciencia de datos y estadística.

https://jupyter.org

Statista

Plataforma de estadísticas con acceso a datos de estudios de mercado, investigaciones y análisis cuantitativos.

https://www.statista.com

Publicación y colaboración

GitHub

Plataforma de control de versiones y colaboración.

https://github.com

Observable

Notebooks interactivos para visualización con JavaScript.

https://observablehq.com

CSVLint

Para validar y depurar archivos CSV con errores de formato.

https://csvlint.io

Google Drive + Sheets

Herramientas accesibles para almacenar, compartir y colaborar en hojas de cálculo con datos en tiempo real.

https://drive.google.com

Cómo empezar en periodismo de datos

1. Explorar conjuntos de datos relevantes

Consulte portales de datos abiertos en busca de información que tenga impacto público o despierte su interés periodístico.

2. Formular preguntas concretas

Plantee interrogantes como: ¿Qué patrones se observan? ¿Existen anomalías? ¿Cómo evolucionan los datos a lo largo del tiempo?

3. Verificar y contextualizar

Compare la información con otras fuentes confiables y compleméntela con opiniones expertas o documentación técnica.

4. Transformar los datos en una historia

Convierta los hallazgos en una narrativa clara y visual que conecte con su audiencia y aporte valor informativo.

Innovación y desarrollo con datos abiertos

Los datos abiertos son un motor para la innovación, permitiendo a emprendedores, desarrolladores e investigadores crear nuevos productos, servicios y soluciones basados en información pública.

Áreas de oportunidad

Aplicaciones móviles

Transporte, turismo, servicios urbanos.

Plataformas de análisis

Herramientas para negocios y toma de decisiones.

Inteligencia artificial

Entrenamiento de modelos con datos públicos.

Casos de éxito

CityMapper

CityMapper

Aplicación que combina datos de transporte público de múltiples ciudades para ofrecer rutas óptimas.

citymapper.com
Zillow

Zillow

Plataforma de bienes raíces que utiliza datos abiertos sobre propiedades y valores.

zillow.com

Cómo desarrollar proyectos con datos abiertos

Antes de comenzar, verifique la licencia de los datos y asegúrese de cumplir con los requisitos de atribución. Algunas licencias pueden restringir usos comerciales.

1. Identificar una necesidad

¿Qué problema puede resolverse con los datos disponibles?

2. Explorar datos disponibles

Buscar en portales gubernamentales, organizaciones y comunidades.

3. Validar la idea

Crear prototipos rápidos y obtener retroalimentación.

4. Desarrollar el producto

Implementar soluciones escalables y sostenibles.

Hackatones y competencias

Eventos presenciales y virtuales

  • Desafíos de datos abiertos
  • Hackatones cívicos
  • Competencias de visualización

Beneficios de participar

  • Networking con expertos
  • Acceso a mentores
  • Posibilidad de financiamiento
  • Visibilidad para proyectos

Información pública libre para usar, compartir y promover transparencia provistos por instituciones para impulsar innovación, decisiones informadas y valor social.

Accesibles

Disponibles para todos en formatos fáciles de usar

Libres de uso

Reutilizables y redistribuibles sin restricciones

Interoperables

Compatibles con otros sistemas y datos

Universales

Comprensibles para distintos usuarios y contextos

Actualizables

Se mantienen al día para conservar su relevancia

Transparentes

Promueven la rendición de cuentas y la confianza pública

Videos informativos

01

Datos abiertos en la CCSS

La CCSS publica valiosos conjuntos de datos para que puedan ser consultados, utilizados y compartidos de manera libre, como un medio para fortalecer la transparencia institucional y la participación ciudadana.

02

¿Qué son los datos abiertos?

Los datos abiertos permiten acceder a datos que se publican desde el sector público con las características técnicas y jurídicas para ser usados, reutilizados y redistribuidos libremente por cualquier persona.

03

Principios de los datos abiertos

Los datos abiertos no solo requieren publicarse en formatos específicos y estar acompañados de una licencia que permitan su uso, sino que deben cumplir con seis principios que se explican en este video.

04

Licencia de los datos abiertos

Los datos abiertos pueden ser usados, reutilizados y redistribuidos libremente por cualquier persona, en cualquier momento y en cualquier lugar.

05

Formatos de archivos abiertos

En el caso de los datos abiertos, el formato en el que se guardan estos archivos también debe ser abierto.

06

Casos de uso de datos abiertos

Los datos abiertos han permitido crear soluciones que ayudan a las personas tomar decisiones o a entender un problema definido.

Se publica mediante licencia de atribución de Creative Commons - Ver créditos