logo
. . .

Big Data

Conoce los beneficios que tiene para ti la tecnología de Big-Data que Amazon AWS tiene para ofrecerte

Contáctanos
vps image

¿Qué es big data?

Es un conjunto de datos cuyo tamaño, complejidad y velocidad de creciemiento dificultan su captura, gestión, procesamiento o análisis mediante tecnologías y herramientas convencionales, tales como bases de datos tradicionales. Aunque existen numerosas definiciones de big data, la mayoría incluyen el concepto de lo que se conoce como las “tres V” de los big data:

big-data
  • Volumen:

    Es la cantidad de datos que va a procesar desde terabytes hasta petabytes de datos.


  • Variedad

    Es el ritmo en que recibe los datos, incluye datos de una amplia variedad de orígenes y formatos (p. ej., registros web, interacciones en las redes sociales, transacciones en línea y de comercio electrónico, transacciones financieras, etc.).


  • Velocidad

    Hace referencia a los diversos tipos de datos disponibles. Cada vez más, las empresas tienen requisitos exigentes desde el momento en que se generan los datos al momento en que se entrega información procesable a los usuarios. Por lo tanto, es necesario recopilar, almacenar, procesar y analizar los datos en periodos relativamente cortos, que van desde una vez al día hasta en tiempo real.

wp-hosting

¿Cómo funciona big data?

Tanto los servidores dedicados como los bare metal son una forma de servicios en la nube en la que el usuario alquila una máquina física de un proveedor que no es compartida con ningún otro inquilino. A diferencia de la versión tradicional de computación en la nube, que se basa en máquinas virtuales, los servidores dedicados no vienen con un hipervisor instalado previamente y brindan al usuario el control completo sobre su infraestructura de servidor. Con un servidor dedicado, debido a que los usuarios obtienen el control completo de la máquina física, uno tiene la flexibilidad de elegir su propio sistema operativo, evitar los desafíos de "vecino ruidoso" de la infraestructura compartida, y ajustar el hardware y el software para cargas de trabajo específicas, a menudo intensivas en datos.

Recopilar

Recopilar los datos sin procesar, como transacciones, registros, dispositivos móviles y más, es el primer desafío de big data al que se enfrentan las empresas

Almacenar

Cualquier plataforma de big data necesita un repositorio seguro, escalable y duradero donde almacenar los datos antes o incluso después de procesarlos.

Procesar y analizar

En este paso, los datos se transforman de datos sin procesar a datos consumibles, normalmente al ordenar, acumular, unir e incluso realizar funciones y algoritmos más avanzados.

Consumir y visualizar

El objetivo de big data consiste en obtener información procesable y valiosa a partir de los activos de datos.

¿Tienes duda de alguno de nuestros servicios?

Llámanos o envíanos un correo y uno de nuestros expertos te ayudará con tus dudas

server room

Servicio de Amazon EMR

Amazon EMR es la plataforma para big data en la nube líder en la industria destinada al procesamiento de grandes volúmenes de datos mediante el uso de herramientas de código abierto como Apache Spark, Apache Hive, Apache HBase, Apache Flink, Apache Hudi y Presto. Con EMR puede ejecutar análisis a escala de petabytes a menos de la mitad del costo de las soluciones locales tradicionales y con una velocidad 3 veces superior que el Apache Spark estándar.

Elasticidad

A diferencia de la infraestructura rígida de los clústeres locales, EMR desacopla el cómputo y el almacenamiento, lo que le brinda la capacidad para ajustar la escala de cada uno de forma independiente y aprovechar el almacenamiento en niveles de Amazon S3

Fiabilidad

EMR está ajustado para la nube y monitoriza el clúster constantemente, reintenta las tareas fallidas y sustituye de forma automática las instancias que tienen un rendimiento deficiente.

Seguridad

EMR establece automáticamente los ajustes del firewall de EC2 para controlar el acceso de red a las instancias y lanza clústeres en una Amazon Virtual Private Cloud (VPC).

Flexibilidad

Puede iniciar clústeres de EMR con las AMI de Amazon Linux personalizadas e instalar fácilmente aplicaciones adicionales con acciones de arranque.