02/02/2023
Mi almacén de datos preferido en cada nube
El almacén de datos adecuado
La elección del almacén de datos correcto es un punto vital a la hora de diseñar tu arquitectura y garantizar el éxito del proyecto.
Una de las cualidades que tienen las nubes es la gran variedad de soluciones que ofrecen para almacenar datos. Estas soluciones normalmente incluyen soporte para datos estructurados, no estructurados o semiestructurados, siendo cada uno de ellos necesarios para distintos tipos de proyectos.
En este artículo no voy a describir cada uno de los servicios disponibles, el uso que se le puede dar, ni cómo encajarlos en el proyecto, ya que se alargaría demasiado. El objetivo de este artículo es compartir a nivel personal cuál es mi producto preferido para almacenar datos en AWS, GCP y Azure según mi experiencia y el porqué de esa elección.
¡Sin más preámbulos paso a contaros todos los detalles!
GCP BigQuery
De carácter completamente analítico, BigQuery de Google es uno de esos productos que no puedes dejar de usar una vez que los descubres.
Este programa tiene una curva de aprendizaje rápida y se basa en sentencias SQL.
Además, no necesitas configurar nada para comenzar a trabajar. Ni siquiera necesitas gastar dinero al principio, ya que con lo que Google proporciona en la capa gratuita es suficiente para hacer pruebas.
También existen multitud de conjuntos de datos gratuitos disponibles para ayudarte a familiarizarte con el entorno y realizar las pruebas que necesites, incluso si no tienes datos propios.
Poco a poco Google ha ido viendo el potencial de la herramienta y ha ido aumentando las capacidades de ésta. Una de las capacidades que más me gusta es que es posible generar modelos en la propia herramienta y hacer análisis de datos rápidamente. Por supuesto, estos modelos los puedes integrar dentro de VertexIA para tener total control sobre ellos.
Como características añadidas podemos citar a BigQuery Onmi donde podemos realizar análisis de datos sobre ficheros ubicados en otros servicios fuera de GCP como S3 o Blob Storage, evitando el movimiento de datos ahorrando tiempo y dinero.
También podemos federar BigQuery con bases de datos relacionales como MySQL pudiendo explotar los datos directamente sin tener moverlos ni hacer nada con ellos. Mención especial a la facilidad que tenemos para generar ETL rápidos desde CloudSQL con Google DataStream llevando información hasta BigQuery en tiempo real.
Como punto final merece la pena indicar que, al ser eje del ecosistema de datos, podemos realizar representación de datos conectando con nuestras herramientas favoritas como Google DataStudio, Google Looker, Tableau y por supuesto otra de mis favoritas: PowerBI.
AWS DynamoDB
DynamoDB de Amazon es quizás uno de los almacenes de datos más flexibles que podemos encontrar en el mercado: totalmente serverless y completamente administrada, permite entrar en el sistema y empezar a trabajar directamente.
La replicación automatizada en varias regiones hace que sea perfecta para aplicaciones de carácter global donde no tienes que preocuparte por la disponibilidad de los datos. Con un nivel de servicio de hasta el 99,999% hace que sea una fuente fiable de datos a la hora de crear aplicaciones críticas.
Dispone de su propio sistema de caché que hace que el dato sea servido en tiempos inferiores a 1 milisegundo. Además gestiona la capacidad a demanda con lo cual siempre tienes el rendimiento esperado, independientemente de la carga de tu aplicación o entorno.
DynamoDB se integra completamente con los servicios de AWS donde puedes desarrollar sistemas de analítica, extracción de insights o incluso monitorizar tendencias y logs, funcionando como trigger para nuestras lambdas. Todo esto hace de DynamoDB un producto realmente atractivo y robusto.
Por supuesto AWS ofrece una cantidad mensual en su capa gratis para que puedas empezar a trabajar sin gastar un sólo euro.
Azure SQL Server DTU
Quizás sea la menos “exótica” de mis elecciones, pero no puede dejar de ser mi favorita por su bajo coste.
¿Pero qué significan esas iniciales: DTU? Para Microsoft es una unidad de transacción de base de datos que representa una combinación de CPU, memoria, lecturas y escrituras.
Con un SLA de 99,99% y un coste en modo básico de 4 euros al mes (dependiendo de la ubicación), hace de este tipo de bases de datos la solución perfecta para entornos de desarrollo, test y para pruebas piloto.
Entre sus bondades adicionales, permite cambiar de tamaño con una breve interrupción, gestiona automáticamente las copias de seguridad (varía desde los 7 días a la versión más básica hasta 35 días la versión más cara) y asegura la cantidad de recursos por lo que el rendimiento es predecible.
De acuerdo, lo sé, ¡no es tan potente! Tiene sus limitaciones funcionales, te obliga a tamaños de almacenamiento fijo y escala uniformemente los recursos sin poder salir de unos tipos fijos, pero es perfectamente válida para una gran cantidad de situaciones posibles.
Conclusiones
Al momento de elegir un sistema de almacenamiento de datos en la nube es importante considerar varios factores, como la capacidad de almacenamiento, la velocidad de transferencia de datos, la seguridad de los datos, la facilidad de uso, la compatibilidad con otros dispositivos y sistemas operativos, entre otros.
También es fundamental tener en cuenta el tipo de datos que se van a almacenar y su importancia, ya que en algunos casos es necesario contar con una solución de almacenamiento más robusta y segura, mientras que otras veces necesitamos agilidad o bajos costes.
En mi experiencia personal a lo largo de los distintos proyectos que hemos llevado a cabo desde el equipo de Cartagon para nuestros clientes, los productos que he mencionado anteriormente han demostrado ser muy eficaces y confiables, sin embargo, siempre es bueno tener en cuenta otras opciones que pueden ser más adecuadas para situaciones específicas.
Por eso, me encantaría conocer cuáles son tus productos preferidos para almacenar datos y por qué los consideras los mejores. Compartir nuestras experiencias y opiniones nos permite aprender y descubrir nuevas alternativas que pueden ser de gran utilidad en el futuro. ¡Así que cuéntanos, ¿cuáles son tus productos para almacenar datos favoritos? ¡Te leo!
Carta de fin de año 2023
Queridos clientes y apreciado equipo, una vez más, comparto con vosotros nuestras reflexiones sobre el año 2023. Este año ha sido testigo de la consolidación del equipo directivo que formamos en 2022 y la consecución exitosa de los objetivos que nos propusimos.
Un primer vistazo a GKE Enterprise: innovación, color y control en la nube
En el entorno empresarial actual, contar con un buen sistema de gestión documental se ha vuelto fundamental para el éxito y la eficiencia de las empresas. monday.com es la clave para tener resultados inmejorables en este aspecto.
Gestión documental avanzada con monday.com
En el entorno empresarial actual, contar con un buen sistema de gestión documental se ha vuelto fundamental para el éxito y la eficiencia de las empresas. monday.com es la clave para tener resultados inmejorables en este aspecto.
01
Contacta con nosotros
02
Suscribete a la newsletter