Programa con Google
Inspirando la innovación tecnológica para los desarrolladores Google en español
Procesamiento masivo en la Nube con MapReduce
Thursday, May 8, 2014
Google App Engine
permite escalar aplicaciones y es por ello que en
ZupCat
desarrollamos nuestros juegos masivos free-to-play sobre esta plataforma. En esta ocasión les contaremos cómo realizamos nuestros
procesamiento batch
.
Para darles una idea de volumen que nuestros juegos alcanza, tenemos tablas con
270 millones de registros
y no es raro tener requerimientos que impliquen recorrer cada uno de ellos para realizar operaciones como reactivación de usuarios o generación de rankings.
Procesar un registro en un proceso batch lleva los siguientes pasos obligatorios:
Leer el registro de entrada
Ejecutar
queries
adicionales en función del registro de entrada
Correr ciertas líneas de código
Efectuar operaciones de escritura relacionadas al registro de entrada
Imaginen ejecutar estos 4 pasos 270 millones de veces durante varias veces al día. Si procesar un registro lleva 1 segundo, todo el proceso demoraría ¡¡3125 días!!
Ma
pReduce
es un modelo de programación destinado a
procesar grandes cantidades de datos en paralelo y de manera distribuida sobre un cluster
. Se basa en partir el total de registros a procesar en grupos con cantidades similares de registros. Cada grupo va a ser procesado en paralelo de manera distribuida.
Ese procesamiento comienza por una fase llamada
Map
que se ocupa de filtrar, seleccionar, contar u ordenar un conjunto de registros.
El resultado de la fase Map, que en general es menor al grupo original de registros, es procesado en una fase posterior llamada
Reduce
. Esta fase también corre en paralelo y en general sumariza los resultados de la fase
Map
.
En general un programador necesita implementar código en
Map
y
Reduce
mientras que el framework se ocupa de correr las tareas en paralelo, administrar la comunicación entre los procesos, transmitir datos y proveer redundancia y tolerancia a fallos.
Es posible utilizar este modelo en Google App Engine integrando el proyecto open source llamado
appengine-mapreduce
y contar con esta estrategia de procesamiento.
Esta captura de un proceso real muestra como casi
7000 registros fueron procesados a una promedio de 84 por segundo en 50 procesos en paralelo
. Las barras amarillas muestran como claramente el proceso fue dividido en 50 trabajadores paralelos.
Es importante notar que 50 trabajadores es un número configurable en relación a velocidad contra el costo de procesamiento que estamos dispuestos a pagar. Es decir,
podemos reducir linealmente el tiempo que demora un proceso aumentando la cantidad de trabajadores involucrados en Map Reduce.
Esto se logra sin tocar una sola línea de código sino solo configurando los parámetros del proceso.
Este post ha sido escrito por
Hernán Liendo
, Google Developer Expert en Cloud Computing, profesor universitario y co- fundador y CTO de ZupCat donde coordina los esfuerzos de ingeniería para desarrollar juegos masivos free-to-play.
No comments :
Post a Comment
Labels
#freeandopen
#iio2009
#OneCommunity
#UPGlobal
#UpLatam
+page
2013
A/B Testing
actionbar
AdMob
adwords
adwords api
ajax
almacenamiento
alojamiento de proyectos en google code
Analytics
android
Android (operating System)
android 4.2
android design
Android SDK
Android Studio
Android Wear
AndroidDevStory
androititlan
angelina jolie
anuncios
API Analytics YouTube
APIs
Aplicaciones
aplicaciones chrome
app engine
App Indexing
app invites
applications
AppQuality
apps
Apps Script
arte
backend
batch
Bava
Betatesting
bigdata
BigQuery
blink
bootcamp
búsqueda ajax
by Google
byCases
byCommunity
byDevelopers
byGoogle
Cardboard
caso de éxito
casos destacados
chrome
chrome web store
chromebook
chromecast
chromium
cloud
cloud test lab
CMD en vivo
coconut
code
code-in
code.org
código
código abierto
Communities
Comunidades
concurso google
conference
convocatoria
Coordinate
crear aplicaciones ajax
creatividad
CSS
cws
daniela robles
dart
dart sdk
dartium
dartlang
denis labelle
desarrolladores
Desarrolladores Google
desarrolladores LatAm
Desarrollar
Destacados
Dev.f
DevArt
DevBus
DevBusLatAm
Developer Bus
Developer Summit
DeveloperConsole
developers
DevFest
devoxx
diseño UX
Distribuir
doubleclick
Drive SDK
ecosistema
elections
elizalde
Emoticons
emprendedores
engagement
english
Enhanced Campaigns
enterprise
eventos
evolución de aplicaciones
Excel
FanBridge
Featured
find people
firebase
flu trends
Freebase
functional programming
G+
g+ goto gal
G+GotoGal
GAE
GCS
GDA
GDE
GDG
GDH
GDL
GDLevent
GitHub
gmail
golang
GOMO
Google
Google AdMob SDK
Google AdWords
Google Analytics
Google APIS
Google App Engine
Google Apps
Google Apps Script
Google Art Project
google calendar
google cast
Google Charts
Google Chrome
Google Cloud Console
Google Cloud Platform
Google Cloud Platform Newsletter
Google Cloud Storage
google code-in
Google Compute Engine
Google Developer Groups
google developers
Google Developers Academy
google developers expert
Google Developers Hackademy
Google Drawings
Google Drive
Google Earth
Google Forms
google geo
google i/o
google i/o extended
google io
Google Keep
Google Maps
google maps coordinate
Google Mexico
Google Nose
google now
Google Person Finder
google places api
Google Play
Google Play Books
google play games
Google Play Movies
Google Play Services
Google Plus
Google Science Fair
google search
Google Sheets
google sign in
Google Top Geek
Google+
Google+ Communities
Google+ Hangouts
google+ sign-in
GoogleAPI
GoogleCloudPlatform
GooglePlay
Googleplex
GTG
Hackademy
hackers
hangouts
Hangouts Remote Desktop
hardcode
Heello
honeycomb
HTML5
IFAI
in-app
ingles
Ingress
integración de soluciones
interactive post
Interesante
International Women’s Day
io15
iOS
J2EE
java
JavaScript
jelly bean
JSON
Juegos
juegos html5
latamRegionSur
Launchpad
lightbox
linux
lucero galindo
Made with Code
Mapdata
Mapeo
Maps Ad Unit
Maps API
Maps Engine
Marshmallow
Material Design
mejores apps 2013
michelle marie
MIT
MIT Global Start-up Labs
MIT-AITI
mobile
monetizar
MOOC
Mountain View
móvil
mr.white
natalie villalobos
Navigation
Next Big Sound
Next Level
nfc
Niantic
Nik
nube
OAuth2
OClock
open source
PageSpeed
patrones
patters
performance
permisos
Pipeline API
Pixability
pixel
pollito pio
Polymer
por lote
Prediction API
programación
Protocol Buffers
proyecto 20%
PYMES
python
quickoffice
seguridad
Showyou
sign-in
social media
Spain
SQLite
startup grind
Startup Launch
startup weekend
startup weekend for the planet
startupbus
startups
Street View
subtitles
sw
SyScan
tablet
Tablet Optimization Tips
tabletas
takeaction
Tango
tendencias 2013
testing
The Garage
tips G+
tips gmail
Top Experts
Top Geek
TopExpert
topics
traducciones
Transparency Report
triggers
Tubular Labs
twilio
udacity
ui
UNAM
unity
universal search
video juegos
vidIQ
ViewPager
web
Web hosting
Web móvil
Wizdeo
WizTracker
Women at Google
Women Techmakers
Yifat Cohen
youtube
YouTube Analytics API
YouTube API
YouTube Data API
YouTube One Channel
YouTube Player API
Archive
2016
Mar
Feb
Jan
2015
Dec
Nov
Oct
Sep
Aug
Jul
Jun
May
Apr
Mar
Feb
Jan
2014
Dec
Oct
Sep
Aug
Jul
Jun
May
Apr
Mar
Feb
Jan
2013
Dec
Nov
Oct
Aug
Jul
Jun
May
Apr
Mar
Feb
Jan
2012
Dec
Nov
Oct
Sep
Aug
Jul
2011
Nov
Oct
May
Mar
2010
Dec
Nov
Oct
Sep
Aug
Jul
Jun
May
Apr
Mar
Feb
Jan
2009
Dec
Nov
Sep
Aug
Jul
Jun
May
Apr
Mar
Feb
Jan
2008
Oct
Sep
Aug
Jul
Jun
May
Apr
Mar
Feb
Jan
2007
Dec
Feed
Desarrolladores
Eventos y Comunidad
Casos Destacados
No comments :
Post a Comment