viernes, 17 de enero de 2014

El éxito de Frozen

Con un Globo de Oro por mejor película animada, la última película de Disney, Frozen, es una de las favoritas a llevarse la estatuilla dorada el próximo 2 de marzo. 
Hasta el 16 de enero, Frozen ha recaudado alrededor de $ 715,231,361 a nivel mundial (del cual el 44.8% del monto total ha sido recaudado solo en Estados Unidos). 


Con todo esto Frozen se convierte en la cuarta película de Disney más taquillera de todos los tiempos, precedida por Up ($ 731,342,744), Buscando a Nemo ($ 936,743,261) y El Rey Leon($ 987,483,777).

A parte del éxito comercial del Frozen, la película ha recibido muy buenas críticas a nivel mundial, aludiendo una especie de "back to basic" por parte de Disney; y es que esto puede percibirse a partir del corto que precede al film (Sin caer en spoilers, con tan solo recordar el corto titulado Paperman sabremos que nos depara éste), así como el transcurso de las historia que rompe con algunos clichés de los típicos cuentos de hadas.

Datos adicionales:
  • El Soundtrack de Frozen lidera el Top del Billboard 200
  • El CEO y Chairman de Walt Disney, Bob Iger ha confirmado que Frozen se convertirá, eventualmente, en un musical de Broadway, como lo han hecho otros éxitos de Disney.  


domingo, 5 de enero de 2014

Instalación y elección del IDE para R

Instalación de R

R está disponible para todos los sistemas operativos así que no importa mucho si tienes Windows o Linux o si usas una Mac. 
Puedes descargar R desde el CRAN ( The Comprehensive R Archive Network) aquí.
Si tienen alguna duda pueden consultarnos a nuestra página de Facebook 


Elección e instalación del IDE

Si ya tienes instalado R o si tal vez lo habrás visto en otra PC, problemente veas que no es muy atractivo (o sexy como diría un amigo); ello debido a que al ser un software libre, su apariencia no es lo importante sino su funcionalidad.
Es por ello que existe IDEs para R (y obviamente para otros softwares como Python por dar un ejemplo) para hacer a R más amigable.
Cada IDE tiene diferentes características que lo pueden hacer atractivo para cada tipo de Usuario.

A continuación los IDE más populares y por tipo de usuario.

Simples y amigables
Estos IDEs tienen buenas características y son amigables (Es recomendable para usuarios con poca experiencia en programación).

Notepad ++ con el NppToR plugin (Sólo disponible para Windows): Tiene la función de sobresaltar y ejecutar por bloques de código y otras útiles características. Lo pueden descargar aquí

RKWard: Incluye opciones para editar e importar la data y el manejo de los paquetes de R. Lo pueden descargar aquí.


Tinn-R (Sólo disponible para Windows): Soporta otros lenguajes como LaTex e incluye el manejo de proyectos (de promación en R). Lo pueden descargar aquí.

RStudio: Es el IDE más usado de R ya que cuenta con muchas características, desde la creación y manejo de proyectos con Git, visualización de la data y gráficos, manejo de paquetes y mucho más. Lo pueden descargar aquí.

Complejos
Estos IDEs son recomendados para programadores que utilizan varios lenguajes.

• Emacs con el Emacs Speaks Statistics plugin:  Emac cuenta con diversos lenguajes, manejo de projectos, sincronización con email incluso un browser. La descarga aquí.

• Vim with the Vim-R plugin: Muy parecido al Emacs gracias a sus características es muy poderoso (en el sentido de la programación). Lo pueden descargar aquí

• Eclipse with the StatET plugin: Al igual que los anteriores cuentas con parecidas características. La descarga aquí

La elección del IDE es importante así que sería recomendable que prueben el que más les agrade y que les sea útil para sus trabajos.

Pueden revisar nuestra Página Web y Facebook para más información acerca de R y cursos aplicados de éste.




sábado, 16 de noviembre de 2013

Una solución al problema del matrimonio estable

Una de las cosas que se nos viene a la mente si escuchamos la palabra Nash es la teoría de juegos (o también la película Una mente brillante); el profesor Nash desarrolló dicha teoría especialmente en juegos no-cooperativos como el Dilema del prisionero, donde el juego se basa en las acciones y reacciones de dos personas mantenidas en forma separada. En este caso vamos a ver una variante de este supuesto: los juegos cooperativos.

El profesor Lloyd S. Sharpley trabajó precisamente en esta parte de la teoría de juegos, donde los participantes no estaban separados y podían cooperar para llegar a la mejor decisión para todos. Junto con el fallecido David Gale, desarrollan el algoritmo Gale – Sharpley con el cual analizan el problema de los matrimonios estables, en donde se establecía la mejor combinación de parejas entre una multitud de hombres y mujeres expresando sus preferencias.



El planteamiento del problema (en términos heurísticos) es el siguiente: 
Tenemos un conjunto formado por N hombres y N mujeres. Cada uno de ellos hace una lista de preferencias sobre el grupo del sexo opuesto. Finalmente, se trata de hacer un emparejamiento en donde en cada pareja, tanto el hombre como la mujer no preferirían estar con otras personas que con sus actuales parejas, es decir, un emparejamiento estable.

Gale y Sharpley demuestran que si el número de hombres es el mismo que el de mujeres, siempre existe una solución con matrimonios estables, la descripción del algoritmo es la siguiente:
- En un comienzo todos están sin parejas. 
- Para no caer en lo tradicional, vamos a suponer que la mujer es la que propone matrimonio.
Le propone matrimonio al primer hombre de su lista y ocurre que:
o   Si el hombre está libre, se casan.
o   Si el hombre ya está emparejado le pregunta si la prefiere a ella antes que a su pareja actual:
§  Si la prefiere a ella, el hombre se divorcia
§  Si no, entonces la mujer sigue y le propone matrimonio al segundo de su lista.

Finalmente el resultado va a ser un conjunto de parejas estables, aunque en este caso va a ser la solución óptima para el conjunto de mujeres y la peor para el conjunto de hombres. Si, en caso contrario, los hombres son los que proponen matrimonio, se obtiene la solución óptima para ellos.

Si te gustó el problema del matrimonio estable puedes jugar en el siguiente enlace emparejando naipes. 


Nota extra:
Cabe resaltar que Alvin E. Roth, quien junto con Lloyd ganaron el premio Nobel en el 2012, realizaron aplicaciones de este algoritmo y de sus teorías a problemas reales de asignación - justamente por lo cual fueron acreedores al Nobel - como por ejemplo la de los graduados médicos a puestos de trabajo equilibrando las preferencias de los médicos y las condiciones de los hospitales que los contratan, teniendo en cuenta las preferencias de las parejas de los médicos que muchas veces también son médicos. También han trabajado para revolucionar el sistema de escuelas públicas de New York y Boston, el sistema de admisión de las universidades norteamericanas y el sistema de donación de órganos.


viernes, 25 de octubre de 2013

Convenio con MDG Consulting

Continuando con nuestra serie de convenios para el beneficio de nuestros estudiantes, ya que la aplicación de lo aprendido es necesaria para una formación integral del estudiante, ahora contamos con un convenio con MDG Consulting para el área de Riesgos.



Requisitos:
Llevar el curso de Especialización de análisis de datos en R ya que las consultorías se trabajaran en unos meses sólo con R y excel y de preferencia conocimientos de Riesgos y finanzas (En caso sea elegido podrá acceder también al próximo curso de Finanzas Avanzadas con media beca a partir de que sea elegido como practicante).
¿Por qué tanto les interesa R a las empresas que tenemos convenios? Descúbrelo en nuestro post en el siguiente link http://goo.gl/1kwpyJ

Aquí unos ejemplos básicos de gráficos
http://goo.gl/bTNGFD
http://goo.gl/HhZMte

¿Interesante no? Recuerda que tienes sólo hasta el 10 de Noviembre para cancelar el pago del primer módulo.
Recuerda, ya puedes realizar tus pagos en nuestra oficina en San Miguel o consultarnos en la pestaña Contáctenos de nuestra página web para más información http://goo.gl/O3jYOp

miércoles, 23 de octubre de 2013

Lecciones de StarUps: Caso Youtube

En los primeros días de Facebook, cuando tenía menos de 15 empleados, un tipo llamado Steve Chen decidió después de trabajar allí por sólo un par de semanas que no era para él. Quería irse a fundar su propia empresa, y su plan era hacer crear un starup de video por internet.
Matt Cohler, el hombre que lo había contratado en el primer lugar, trató de convencerlo de lo contrario. "Estás cometiendo un terrible error. ¡Facebook va a ser enorme! Y ya hay un montón de sitios de vídeo. Si haces esto te vas a arrepentir por el resto de su vida…"
Chen no estaba convencido, por lo que decidió hacerlo de todos modos y se marchó para iniciar una empresa llamada YouTube

Lección: Si estás decidido y crees en tu modelo de negocio, sigue adelante. Sólo tú te darás los límites…

sábado, 19 de octubre de 2013

Razones para estudiar un curso de Análisis de Bases de Datos vs Econometría

¿Por qué preferir un curso de Análisis de Bases de datos que uno de Econometría? Econemetría implica el uso de la estadística para modelos económicos, ¿las empresas utilizan modelos económicos? Sí pero no tanto, aproximadamente entre un 10% a 15% a menos que sean consultorías Económicas que puedan llegar a utilizar los analistas un 40% de su tiempo en ello. ¿Y el resto? Bueno antes de hacer un modelo Económico necesitas entender la bases de datos y para ello necesitan que sepas cómo manejarlas incluso como limpiarlas. La metodología acerca de la limpieza de datos es tan importante que cualquier analista ya sea que trabaja en una consultoría Económica o una de riesgos o bursátiles debe manejarla ya que si no lo hace podría hacer casi cualquier cosa y hacer casi cualquier cosa, puede conllevar a tomar decisiones no adecuadas.
A continuación ejemplos típicos acerca de la necesidad de estos conocimientos:

Riesgos

El primer paso para cualquier consultoría de riesgos implica conocer el negocio, necesitas conocer cómo funciona, cómo ha evolucionado en el tiempo. Sólo para dar un ejemplo de la aplicación de una consultoría de riesgos. Antes de crear un modelo de riesgos para la toma adecuada de derivados financieros, debes determinar y analizar ciertas variables como el tipo de cambio y sobretodo la posición de moneda extranjera. ¿Qué pasa si hay un error en la bases de datos? Bueno aparentemente sería tan fácil como arreglar el error en Excel y continuar, pero no es tan simple o mejor dicho tan rápido. Realizar un modelo simple como una regresión con la bases de datos pequeña de una Edpyme puede tardar aproximadamente unos 30 minutos con un procesador i7, algo lento si necesitas estar analizando varios modelos y seguir analizando otras bases de datos ya que probablemente no sea la única cosa que realices. Otra sería en el caso de modelos de cosecha, un modelo por el cual debes seguir a tus clientes para analizar el comportamiento de cada uno a través del tiempo desde que toman un préstamo hasta que lo cancelas, para entender el comportamiento promedio de los morosos y poder identifarlos después. Esas bases de datos son enormes, imagínate si haces una consultoría de riesgos a un banco. Adicionalmente la consultoría no sólo implica hacer modelos sino también presentarlos a la gerencia y al directorio; ¿crees que le vas a presentar un gráfico simple de STATA o de Eviews ? En consultoría no sólo vale a la conclusión que llegues sino también tu imagen. A un trabajo importante, unos gráficos imponentes; y si se puede interactivos. R tiene el poder de realizarlos, claro sin contar con su velocidad que supera a STATA, SPSS y por supuesto al Excel.

Consultorías Económicas
Si bien pareciera que en una consultoría económica realizarás muchos modelos econométricos no son tantos. ¿Por qué? Porque la mayoría de este tipo de consultoría son del tipo descriptiva y su mayor trabajo implica conseguir bases de datos, armarlas y limpiarlas, que no es tan fácil como se escriben y pueden tardar semanas sólo en esos pasos. Realizar regresiones no es parte de la Econometría sino del campo de la Estadísticas y desde una visión práctica, del análisis de datos. A menos que realices un modelo macroeconómico o microeconómico (que obviamente podría hacerlo un Estadístico con conocimientos básicos de Economía) no utilizarás en sí Econometría.

Finanzas corporativas
De manera similar al de riesgos, se manejan datas enormes y para ello necesitas un software potente y que realice buenos gráficos. ¿Queda obvia la respuesta de que software utilizar no? La bases de datos puede variar pero la metodología no.

Finanzas bursátiles
Si bien existen muchos software o páginas webs que te dan bases de datos y sus respectivos gráficos no hay nada como hacerlos por tu cuenta y hacerlos de manera creativa. ¿Te imaginas la cantidad de data de una sóla acción de las bolsas de EEUU en un día (intraday)? Digamos que tu excel no aguantaría para analizar ni cargar fácilmente tal base de datos...

Marketing
Si quisieras analizar bases de datos a tiempo real de tu página web usando Google Analytics y otras bases de datos ¿cómo lo harías? Bueno dependiendo del tráfico web de tu página web puedes usar el excel (claro si nadie lo visita puedes usarlo), o un software más potente como STATA, SPSS, SAS. Aunque es algo aburrido descargar data... R puede descargar y analizar tales bases de datos a tiempo real en unas cuantas líneas de código y bueno ya te explicamos acerca de las gráficas así que obvia la respuesta de qué curso y software llevar este ciclo ¿no?

Y para terminar la Econemetría es importante pero el análisis de datos, imprescindible...


Puedes revisar detalles de nuestra curso de Especialización de bases de datos en R en  http://www.mylanderpages.com/keigroup/analisis-de-datos

Cualquier consulta puede escribirnos a nuestra página de facebook https://www.facebook.com/KEI.GROUP.PERU?fref=ts


jueves, 17 de octubre de 2013

La Paradoja de Monty Hall - Simulación en R

La diferencia esencial entre los juegos de estrategia y los puros pasatiempos de azar radica en las circunstancia de que la inteligencia  y la pericia son útiles cuando se trata de jugar los primeros, pero no los últimos (McKinsey,1967).





El dilema lleva este nombre en honor a Monty Hall, presentador del concurso televisivo ‘Let’s Make a Deal’ famoso en EEUU entre 1963 y 1986. En resumen, el ‘juego’ consiste en la posibilidad de que un concursante pueda llevarse a casa un premio que está oculto entre tres opciones, el único que conoce la ubicación del premio es el presentador; después de que el participante elige una de las opciones (que podría ser una maleta, una puerta, un cofre, o lo que sirviera para ocultar el premio) el presentador descubre una de las opciones que no tiene premio alguno y le pregunta al participante si desea quedarse con su elección original o desea cambiarse a la otra opción cuyo contenido sigue oculto.

Si afirmamos que para poder participar, el concursante ha pagado un monto que equivale justamente a la mitad del premio, el problema podría ser analizado desde la óptica de la Teoría de los Juegos y a su vez entendido como un juego de ‘suma cero’, pues terminado el juego sucederá que ganara el participante o ganara el presentador que por supuesto representa los intereses de otra persona. En términos específicos los elementos del juego serian: 

Jugadores
 El participante y el presentador
Alternativas
Elegir entre las tres opciones y luego adoptar la estrategia ‘quedarse’, ‘cambiar’ o ‘aleatoriamente’ decidir entre cambiar o quedarse.
Reglas
Primero ‘juega’ el participante, luego el presentador y luego otra vez el participante.
Pagos
Si el participante gana se lleva un premio equivalente al doble de lo que pago.
Si el presentador gana se lleva lo que pago el participante por concursar.
Distribución de probabilidades sobre los estados de la naturaleza.
1/3 de probabilidad de que el premio este oculta en cada opción.
Información
El presentador sabe cuál es la opción que eligió el concursante, y el concursante sabe cuáles son las probabilidades de triunfo si escoge cada opción.

Antes de empezar con el análisis del juego debe notarse algo muy importante: en este juego la decisión de uno de los jugadores es más activa que la del otro jugador. Como se dijo en un principio el presentador conoce donde está el premio y su objetivo en el juego será confundir al participante en el momento de elegir la opción y en el momento de decidir si cambia o se queda con su opción inicial. En cambio el participante tendrá en sus manos la importante decisión de elegir una de las opciones y luego de tomar la decisión igual de importante de cambiar o no su decisión inicial. Es por eso que en este artículo lo que se va hacer es analizar cuál es la mejor estrategia del participante para poder tener más probabilidades para ganar el juego.
Lo que hace de este juego una paradoja es que se afirma sin discusión alguna que para poder tener más probabilidades de triunfo lo que se debe hacer es elegir la estrategia de ‘cambiar’ es decir después de que el presentador descubra una de las opciones, el participante debe dejar su opción inicial y elegir la opción cuyo contenido aun no fue descubierto.

Como se puede observar aparentemente da lo mismo en elegir la estrategia de quedarse o cambiar la opción inicial, pero un análisis un ‘poquito’ más exhaustivo muestra que eso no es cierto pues para que suceda evento del medio existe una probabilidad de 1/3 y para que suceda los eventos de los costados existe la probabilidad de 2/3, por lo tanto la estrategia optima será ‘cambiar’ la opción inicial.


Para demostrar el resultado se puede utilizar el siguiente código en R:
#Una simulacion Monte Carlo del problema de Monty Hall.
#La simulacion tendra 1000 intentos.
#El objetivo es demostrar que adoptando la estrategia 'cambiar' se obtiene 
#una mayor probabilidad de ganar que adoptando la estrategia 'quedarse'.
#KEI Group
#########################################################
montyhall<-function(estrategia='quedarse',N=1000,print_games=TRUE)
{
  puertas=1:3
  ganar=0 # hacer un seguimiento del numero de exitos.
  for(i in 1:N) 
    {
    premio=floor(runif(n=1,min=1,max=4)) # aleatoriamente qué puerta tiene el buen premio.
    adivinar=floor(runif(n=1,min=1,max=4)) # adivinar una puerta al azar.
### Revelar una de las puertas que no tiene por supuesto el buen premio.
  if(premio!=adivinar)
    revelar=puertas[-c(premio,adivinar)]
  else
    revelar=sample(puertas[-c(premio,adivinar)],1)
### 'Quedarse' con la eleccion inicial o 'cambiar'.
  if(estrategia=='cambiar')
    seleccionar=puertas[-c(revelar,adivinar)]
  if(estrategia=='quedarse')
    seleccionar=adivinar
  if(estrategia=='aleatorio')
    seleccionar=sample(puertas[-revelar],1)
### Cuente sus exitos
  if(seleccionar==premio)
  {
    ganar=ganar+1
    resultado='ganador'
    }else
      resultado='perdedor'
    if(print_games)
    cat(paste('adivinar: ',adivinar,
    '\nPuerta Revelada: ',revelar,
    '\nPuerta Elegida: ',seleccionar,
    '\nPuerta del premio: ',premio,
    '\n',resultado,'\n\n',sep=''))
}
  cat(paste(' Usando la estrategia ',estrategia,' su porcentaje de ganar era de ', ganar/N*100,'%\n',sep=' '))
  }
montyhall(estrategia="quedarse")
montyhall(estrategia="cambiar")
montyhall(estrategia="aleatorio")