SSYSPE

Platform to share knowledge, news, discussions and jobs about software, systems and IT fields related
* Identificarse    * Registrarse


Nuevo tema Responder al tema  [ 1 mensaje ] 
Autor Mensaje
NotaPublicado: 05 May 2018, 05:44 
Desconectado
Avatar de Usuario

Registrado: 17 Mar 2018, 21:30
Mensajes: 4
Al hablar de big data ,es necesario hablar de infraextructura .Un "fierro" necesario que nos provea la potencia computacional para poder realizar la explotación de datos de Teras de información . Y aquí aparece Hadoop (Apache Hadoop) , que es básicamente un software open source que nos permite trabajar en modo Cluster para tener "Potencia" en el procesamiento de los datos .Y con el se crea todo un ecosistema.Tal vez los mas conocidos sean aquellos cuyos logotipos tengan animales como :

Pig.-Plataforma para crear MapReduce
Hive.-Infraestructura de almacenamiento de datos
Impala.-Motor de consultas de Sql de Cloudera

Sin embargo , existe una diversidad de potentes herramientas que son utilizadas dependiendo de las necesidades de la aplicación .Puede ser Batch ,Real time , pseudo-real-time .

Recomiendo revisar el siguiente articulo , en el cual nos da una mejor visión de que tipo de herramientas usar en cada caso teniendo como base de la infraextructura a Hadoop:

https://www.beeva.com/beeva-view/bigdat ... ig-data-2/


Arriba
 Perfil  
 
Mostrar mensajes previos:  Ordenar por  
Nuevo tema Responder al tema  [ 1 mensaje ] 


¿Quién está conectado?

Usuarios navegando por este Foro: No hay usuarios registrados visitando el Foro y 1 invitado


No puedes abrir nuevos temas en este Foro
No puedes responder a temas en este Foro
No puedes editar tus mensajes en este Foro
No puedes borrar tus mensajes en este Foro
No puedes enviar adjuntos en este Foro

Buscar: