Obtén estadísticas más completas con la nueva biblioteca cliente de Python para Data Commons

26 DE JUNIO DE 2025
Kara Moscoe Technical Writer

Los datos son la base del progreso en casi todos los campos. Sirven como materia prima con la que se forjan estadísticas profundas, que nos permiten medir con precisión las realidades actuales, identificar tendencias críticas y tal vez predecir resultados futuros.

En Google, nuestra misión con Data Commons es organizar los datos estadísticos del mundo que están disponibles públicamente y hacerlos más accesibles y útiles para todos. Se trata de un grafo de conocimiento de código abierto que unifica una amplia gama de datos públicos de diversas fuentes, con lo que simplifica el acceso y la comprensión de los desarrolladores, investigadores y analistas de datos por igual. Junto con el sitio web datacommons.org, la Búsqueda de Google utiliza Data Commons para responder consultas como ¿Cuál es la población de San Francisco?, con el grafo superior generado por Data Commons.

Hoy, anunciamos la disponibilidad general de la nueva biblioteca cliente de Python para Data Commons basada en la API REST V2. Esta nueva biblioteca de Python mejora en gran medida la forma en que los desarrolladores de datos pueden aprovechar Data Commons.


Impacto en el mundo real: asociación con ONE.org

Este hito cobró forma gracias a la visión y las contribuciones sustanciales de nuestro socio The ONE Campaign, una organización global que trabaja con el objetivo de crear las inversiones necesarias para mejorar las oportunidades económicas y lograr vidas más saludables en África. Creamos Data Commons como una plataforma de código abierto precisamente para fomentar las contribuciones de la comunidad y permitir usos innovadores, y esta asociación con The ONE Campaign ejemplifica a la perfección ese objetivo. ONE promovió, propuso el diseño y codificó la biblioteca cliente para poner los enormes conocimientos de Data Commons a disposición de los científicos y analistas de datos que desean aprovechar el rico ecosistema de herramientas y bibliotecas analíticas de Python.


Soporte para instancias personalizadas de Data Commons

La plataforma Data Commons también permite a las organizaciones, como las Naciones Unidas o ONE, alojar sus propias instancias de Data Commons. Estas instancias personalizadas permiten la integración perfecta de conjuntos de datos patentados con el grafo de conocimiento fundamental de Data Commons. Las organizaciones aprovechan el marco de trabajo y las herramientas de datos de Data Commons, al tiempo que mantienen un control total de sus datos y recursos.

Una de las adiciones más impactantes en la biblioteca V2 es el soporte consistente para instancias personalizadas. Ahora, puedes usar la biblioteca de Python para consultar mediante programación cualquier instancia pública o privada, ya sea alojada localmente, dentro de tu organización o en Google Cloud Platform.


Nuevas funciones poderosas

Con la biblioteca de Python, es muy fácil realizar consultas comunes sobre datos de Data Commons, como las siguientes:

  • Explorar la estructura del grafo de conocimiento.

  • Recuperar datos para cualquiera de las más de 200,000 variables estadísticas de más de 200 conjuntos de datos, en dominios como demografía, economía, educación, energía, medio ambiente, salud y vivienda.

  • Asignar fácilmente entidades de otros conjuntos de datos a entidades de Data Commons.


La versión 2 de la biblioteca cliente ofrece muchas mejoras técnicas en comparación con la biblioteca V1, como las siguientes:

  • Las APIs de marcos de datos de Pandas son compatibles como un módulo integral, con un paquete de instalación único, lo que permite usarlas sin problemas con otros puntos finales de API en el mismo cliente.

  • Varios métodos nuevos de conveniencia para consultas de datos comunes.

  • Administración de claves de API y otras operaciones con estado integradas en la clase de cliente.

  • Integración con las bibliotecas Pydantic para mejorar la seguridad de los tipos, la validación y la serialización.

  • Soporte para múltiples formatos de respuesta, incluidos diccionarios y listas JSON y Python.
variable = "sdg/SI_POV_DAY1"
variable_name = «Proporción de la población por debajo de la línea internacional de la pobreza"
 
df = client.observations_dataframe(variable_dcids=variable, date="all", parent_entity="Earth", entity_type="Continent")
 
df = df.pivot(index="date", columns="entity_name", values="value")
 
ax = df.plot(kind="line")
ax.set_xlabel("Year")
ax.set_ylabel("%")
ax.set_title(variable_name)
ax.legend()
ax.plot()
Python
Graph showing proportion of population below international poverty line across continental regions

Cómo comenzar

Para comenzar a usar la biblioteca Python de Data Commons, puedes instalar el paquete directamente desde PyPI. También proporcionamos recursos completos para ayudarte a empezar, como la documentación de referencia y los instructivos en línea disponibles como cuadernos de Google Colab.

A quienes usan actualmente la API de Python V1, les recomendamos actualizar a la nueva biblioteca de Python V2. Ya se programó la baja de la API V1 y la adopción de la nueva biblioteca garantiza el acceso a las funciones más recientes y la asistencia continua.


Comunidad abierta

Esta biblioteca es un testimonio del poder de la colaboración del código abierto. El código abierto está disponible en GitHub y agradecemos las contribuciones de la comunidad en virtud del Acuerdo de licencia de colaborador de Google.