KEI Group: 2013

sábado, 16 de noviembre de 2013

Una solución al problema del matrimonio estable

Una de las cosas que se nos viene a la mente si escuchamos la palabra Nash es la teoría de juegos (o también la película Una mente brillante); el profesor Nash desarrolló dicha teoría especialmente en juegos no-cooperativos como el Dilema del prisionero, donde el juego se basa en las acciones y reacciones de dos personas mantenidas en forma separada. En este caso vamos a ver una variante de este supuesto: los juegos cooperativos.

El profesor Lloyd S. Sharpley trabajó precisamente en esta parte de la teoría de juegos, donde los participantes no estaban separados y podían cooperar para llegar a la mejor decisión para todos. Junto con el fallecido David Gale, desarrollan el algoritmo Gale – Sharpley con el cual analizan el problema de los matrimonios estables, en donde se establecía la mejor combinación de parejas entre una multitud de hombres y mujeres expresando sus preferencias.

El planteamiento del problema (en términos heurísticos) es el siguiente:

Tenemos un conjunto formado por N hombres y N mujeres. Cada uno de ellos hace una lista de preferencias sobre el grupo del sexo opuesto. Finalmente, se trata de hacer un emparejamiento en donde en cada pareja, tanto el hombre como la mujer no preferirían estar con otras personas que con sus actuales parejas, es decir, un emparejamiento estable.

Gale y Sharpley demuestran que si el número de hombres es el mismo que el de mujeres, siempre existe una solución con matrimonios estables, la descripción del algoritmo es la siguiente:

- En un comienzo todos están sin parejas.

- Para no caer en lo tradicional, vamos a suponer que la mujer es la que propone matrimonio.

- Le propone matrimonio al primer hombre de su lista y ocurre que:

o Si el hombre está libre, se casan.

o Si el hombre ya está emparejado le pregunta si la prefiere a ella antes que a su pareja actual:

§ Si la prefiere a ella, el hombre se divorcia

§ Si no, entonces la mujer sigue y le propone matrimonio al segundo de su lista.

Finalmente el resultado va a ser un conjunto de parejas estables, aunque en este caso va a ser la solución óptima para el conjunto de mujeres y la peor para el conjunto de hombres. Si, en caso contrario, los hombres son los que proponen matrimonio, se obtiene la solución óptima para ellos.

Si te gustó el problema del matrimonio estable puedes jugar en el siguiente enlace emparejando naipes.

Nota extra:

Cabe resaltar que Alvin E. Roth, quien junto con Lloyd ganaron el premio Nobel en el 2012, realizaron aplicaciones de este algoritmo y de sus teorías a problemas reales de asignación - justamente por lo cual fueron acreedores al Nobel - como por ejemplo la de los graduados médicos a puestos de trabajo equilibrando las preferencias de los médicos y las condiciones de los hospitales que los contratan, teniendo en cuenta las preferencias de las parejas de los médicos que muchas veces también son médicos. También han trabajado para revolucionar el sistema de escuelas públicas de New York y Boston, el sistema de admisión de las universidades norteamericanas y el sistema de donación de órganos.

viernes, 25 de octubre de 2013

Convenio con MDG Consulting

Continuando con nuestra serie de convenios para el beneficio de nuestros estudiantes, ya que la aplicación de lo aprendido es necesaria para una formación integral del estudiante, ahora contamos con un convenio con MDG Consulting para el área de Riesgos.

Requisitos:
Llevar el curso de Especialización de análisis de datos en R ya que las consultorías se trabajaran en unos meses sólo con R y excel y de preferencia conocimientos de Riesgos y finanzas (En caso sea elegido podrá acceder también al próximo curso de Finanzas Avanzadas con media beca a partir de que sea elegido como practicante).
¿Por qué tanto les interesa R a las empresas que tenemos convenios? Descúbrelo en nuestro post en el siguiente link http://goo.gl/1kwpyJ

Aquí unos ejemplos básicos de gráficos
http://goo.gl/bTNGFD
http://goo.gl/HhZMte

¿Interesante no? Recuerda que tienes sólo hasta el 10 de Noviembre para cancelar el pago del primer módulo.
Recuerda, ya puedes realizar tus pagos en nuestra oficina en San Miguel o consultarnos en la pestaña Contáctenos de nuestra página web para más información http://goo.gl/O3jYOp

miércoles, 23 de octubre de 2013

Lecciones de StarUps: Caso Youtube

En los primeros días de Facebook, cuando tenía menos de 15 empleados, un tipo llamado Steve Chen decidió después de trabajar allí por sólo un par de semanas que no era para él. Quería irse a fundar su propia empresa, y su plan era hacer crear un starup de video por internet.
Matt Cohler, el hombre que lo había contratado en el primer lugar, trató de convencerlo de lo contrario. "Estás cometiendo un terrible error. ¡Facebook va a ser enorme! Y ya hay un montón de sitios de vídeo. Si haces esto te vas a arrepentir por el resto de su vida…"
Chen no estaba convencido, por lo que decidió hacerlo de todos modos y se marchó para iniciar una empresa llamada YouTube

Lección: Si estás decidido y crees en tu modelo de negocio, sigue adelante. Sólo tú te darás los límites…

sábado, 19 de octubre de 2013

Razones para estudiar un curso de Análisis de Bases de Datos vs Econometría

¿Por qué preferir un curso de Análisis de Bases de datos que uno de Econometría? Econemetría implica el uso de la estadística para modelos económicos, ¿las empresas utilizan modelos económicos? Sí pero no tanto, aproximadamente entre un 10% a 15% a menos que sean consultorías Económicas que puedan llegar a utilizar los analistas un 40% de su tiempo en ello. ¿Y el resto? Bueno antes de hacer un modelo Económico necesitas entender la bases de datos y para ello necesitan que sepas cómo manejarlas incluso como limpiarlas. La metodología acerca de la limpieza de datos es tan importante que cualquier analista ya sea que trabaja en una consultoría Económica o una de riesgos o bursátiles debe manejarla ya que si no lo hace podría hacer casi cualquier cosa y hacer casi cualquier cosa, puede conllevar a tomar decisiones no adecuadas.
A continuación ejemplos típicos acerca de la necesidad de estos conocimientos:

Riesgos

El primer paso para cualquier consultoría de riesgos implica conocer el negocio, necesitas conocer cómo funciona, cómo ha evolucionado en el tiempo. Sólo para dar un ejemplo de la aplicación de una consultoría de riesgos. Antes de crear un modelo de riesgos para la toma adecuada de derivados financieros, debes determinar y analizar ciertas variables como el tipo de cambio y sobretodo la posición de moneda extranjera. ¿Qué pasa si hay un error en la bases de datos? Bueno aparentemente sería tan fácil como arreglar el error en Excel y continuar, pero no es tan simple o mejor dicho tan rápido. Realizar un modelo simple como una regresión con la bases de datos pequeña de una Edpyme puede tardar aproximadamente unos 30 minutos con un procesador i7, algo lento si necesitas estar analizando varios modelos y seguir analizando otras bases de datos ya que probablemente no sea la única cosa que realices. Otra sería en el caso de modelos de cosecha, un modelo por el cual debes seguir a tus clientes para analizar el comportamiento de cada uno a través del tiempo desde que toman un préstamo hasta que lo cancelas, para entender el comportamiento promedio de los morosos y poder identifarlos después. Esas bases de datos son enormes, imagínate si haces una consultoría de riesgos a un banco. Adicionalmente la consultoría no sólo implica hacer modelos sino también presentarlos a la gerencia y al directorio; ¿crees que le vas a presentar un gráfico simple de STATA o de Eviews ? En consultoría no sólo vale a la conclusión que llegues sino también tu imagen. A un trabajo importante, unos gráficos imponentes; y si se puede interactivos. R tiene el poder de realizarlos, claro sin contar con su velocidad que supera a STATA, SPSS y por supuesto al Excel.

Consultorías Económicas
Si bien pareciera que en una consultoría económica realizarás muchos modelos econométricos no son tantos. ¿Por qué? Porque la mayoría de este tipo de consultoría son del tipo descriptiva y su mayor trabajo implica conseguir bases de datos, armarlas y limpiarlas, que no es tan fácil como se escriben y pueden tardar semanas sólo en esos pasos. Realizar regresiones no es parte de la Econometría sino del campo de la Estadísticas y desde una visión práctica, del análisis de datos. A menos que realices un modelo macroeconómico o microeconómico (que obviamente podría hacerlo un Estadístico con conocimientos básicos de Economía) no utilizarás en sí Econometría.

Finanzas corporativas
De manera similar al de riesgos, se manejan datas enormes y para ello necesitas un software potente y que realice buenos gráficos. ¿Queda obvia la respuesta de que software utilizar no? La bases de datos puede variar pero la metodología no.

Finanzas bursátiles
Si bien existen muchos software o páginas webs que te dan bases de datos y sus respectivos gráficos no hay nada como hacerlos por tu cuenta y hacerlos de manera creativa. ¿Te imaginas la cantidad de data de una sóla acción de las bolsas de EEUU en un día (intraday)? Digamos que tu excel no aguantaría para analizar ni cargar fácilmente tal base de datos...

Marketing
Si quisieras analizar bases de datos a tiempo real de tu página web usando Google Analytics y otras bases de datos ¿cómo lo harías? Bueno dependiendo del tráfico web de tu página web puedes usar el excel (claro si nadie lo visita puedes usarlo), o un software más potente como STATA, SPSS, SAS. Aunque es algo aburrido descargar data... R puede descargar y analizar tales bases de datos a tiempo real en unas cuantas líneas de código y bueno ya te explicamos acerca de las gráficas así que obvia la respuesta de qué curso y software llevar este ciclo ¿no?

Y para terminar la Econemetría es importante pero el análisis de datos, imprescindible...

Puedes revisar detalles de nuestra curso de Especialización de bases de datos en R en http://www.mylanderpages.com/keigroup/analisis-de-datos

Cualquier consulta puede escribirnos a nuestra página de facebook https://www.facebook.com/KEI.GROUP.PERU?fref=ts

jueves, 17 de octubre de 2013

La Paradoja de Monty Hall - Simulación en R

La diferencia esencial entre los juegos de estrategia y los puros pasatiempos de azar radica en las circunstancia de que la inteligencia y la pericia son útiles cuando se trata de jugar los primeros, pero no los últimos (McKinsey,1967).

El dilema lleva este nombre en honor a Monty Hall, presentador del concurso televisivo ‘Let’s Make a Deal’ famoso en EEUU entre 1963 y 1986. En resumen, el ‘juego’ consiste en la posibilidad de que un concursante pueda llevarse a casa un premio que está oculto entre tres opciones, el único que conoce la ubicación del premio es el presentador; después de que el participante elige una de las opciones (que podría ser una maleta, una puerta, un cofre, o lo que sirviera para ocultar el premio) el presentador descubre una de las opciones que no tiene premio alguno y le pregunta al participante si desea quedarse con su elección original o desea cambiarse a la otra opción cuyo contenido sigue oculto.

Si afirmamos que para poder participar, el concursante ha pagado un monto que equivale justamente a la mitad del premio, el problema podría ser analizado desde la óptica de la Teoría de los Juegos y a su vez entendido como un juego de ‘suma cero’, pues terminado el juego sucederá que ganara el participante o ganara el presentador que por supuesto representa los intereses de otra persona. En términos específicos los elementos del juego serian:

Jugadores	El participante y el presentador
Alternativas	Elegir entre las tres opciones y luego adoptar la estrategia ‘quedarse’, ‘cambiar’ o ‘aleatoriamente’ decidir entre cambiar o quedarse.
Reglas	Primero ‘juega’ el participante, luego el presentador y luego otra vez el participante.
Pagos	Si el participante gana se lleva un premio equivalente al doble de lo que pago. Si el presentador gana se lleva lo que pago el participante por concursar.
Distribución de probabilidades sobre los estados de la naturaleza.	1/3 de probabilidad de que el premio este oculta en cada opción.
Información	El presentador sabe cuál es la opción que eligió el concursante, y el concursante sabe cuáles son las probabilidades de triunfo si escoge cada opción.

Antes de empezar con el análisis del juego debe notarse algo muy importante: en este juego la decisión de uno de los jugadores es más activa que la del otro jugador. Como se dijo en un principio el presentador conoce donde está el premio y su objetivo en el juego será confundir al participante en el momento de elegir la opción y en el momento de decidir si cambia o se queda con su opción inicial. En cambio el participante tendrá en sus manos la importante decisión de elegir una de las opciones y luego de tomar la decisión igual de importante de cambiar o no su decisión inicial. Es por eso que en este artículo lo que se va hacer es analizar cuál es la mejor estrategia del participante para poder tener más probabilidades para ganar el juego.

Lo que hace de este juego una paradoja es que se afirma sin discusión alguna que para poder tener más probabilidades de triunfo lo que se debe hacer es elegir la estrategia de ‘cambiar’ es decir después de que el presentador descubra una de las opciones, el participante debe dejar su opción inicial y elegir la opción cuyo contenido aun no fue descubierto.

Como se puede observar aparentemente da lo mismo en elegir la estrategia de quedarse o cambiar la opción inicial, pero un análisis un ‘poquito’ más exhaustivo muestra que eso no es cierto pues para que suceda evento del medio existe una probabilidad de 1/3 y para que suceda los eventos de los costados existe la probabilidad de 2/3, por lo tanto la estrategia optima será ‘cambiar’ la opción inicial.

Para demostrar el resultado se puede utilizar el siguiente código en R:

#Una simulacion Monte Carlo del problema de Monty Hall.
#La simulacion tendra 1000 intentos.
#El objetivo es demostrar que adoptando la estrategia 'cambiar' se obtiene 
#una mayor probabilidad de ganar que adoptando la estrategia 'quedarse'.
#KEI Group
#########################################################
montyhall<-function(estrategia='quedarse',N=1000,print_games=TRUE)
{
  puertas=1:3
  ganar=0 # hacer un seguimiento del numero de exitos.
  for(i in 1:N) 
    {
    premio=floor(runif(n=1,min=1,max=4)) # aleatoriamente qué puerta tiene el buen premio.
    adivinar=floor(runif(n=1,min=1,max=4)) # adivinar una puerta al azar.
### Revelar una de las puertas que no tiene por supuesto el buen premio.
  if(premio!=adivinar)
    revelar=puertas[-c(premio,adivinar)]
  else
    revelar=sample(puertas[-c(premio,adivinar)],1)
### 'Quedarse' con la eleccion inicial o 'cambiar'.
  if(estrategia=='cambiar')
    seleccionar=puertas[-c(revelar,adivinar)]
  if(estrategia=='quedarse')
    seleccionar=adivinar
  if(estrategia=='aleatorio')
    seleccionar=sample(puertas[-revelar],1)
### Cuente sus exitos
  if(seleccionar==premio)
  {
    ganar=ganar+1
    resultado='ganador'
    }else
      resultado='perdedor'
    if(print_games)
    cat(paste('adivinar: ',adivinar,
    '\nPuerta Revelada: ',revelar,
    '\nPuerta Elegida: ',seleccionar,
    '\nPuerta del premio: ',premio,
    '\n',resultado,'\n\n',sep=''))
}
  cat(paste(' Usando la estrategia ',estrategia,' su porcentaje de ganar era de ', ganar/N*100,'%\n',sep=' '))
  }
montyhall(estrategia="quedarse")
montyhall(estrategia="cambiar")
montyhall(estrategia="aleatorio")

martes, 10 de septiembre de 2013

Convenio de prácticas: RMS

En nuestro afán de generar mayor competitividad entre nuestros estudiantes y asegurar el desarrollo profesional de nuestros alumnos, estamos trabajando para conseguir acuerdos con firmas de consultores de negocios en las que pondrán en práctica los conocimientos aprendidos. Estos beneficios se darán exclusivamente a los alumnos que alcancen el nivel de excelencia*. El primer acuerdo lo hemos concretado con RSM International especializada en consultoría y auditoría, para que los mejores estudiantes de Análisis de Datos, Finanzas (próximamente) y Riesgos (próximamente) se les dé prioridad para las convocatorias de prácticas en lo que concierne a precios de transferencia, consultorías económicas y riesgos operacionales.

Para mayor información sobre la empresa, puede revisar sus páginas webs:
http://www.rsmperu.com/es/

http://www.rsmi.com/en/default.aspx

*(a partir de 18 de promedio final del curso)

domingo, 1 de septiembre de 2013

R es cool! También es hot! Algunas razones para estudiar R

Parafraseando un artículo de The New York Times, para muchos R es tan sólo una letra, pero para otros puede ser uno de los lenguajes de programación más populares especializado en estadística. A continuación algunas razones para estudiar R:

1.- Es gratuito: si lo comparamos con otros softwares del mismo tipo como STATA, SPSS, Eviews, entre otros; nos daremos con la sorpresa que R es superior a éstos y no se paga una licencia, que en muchos casos es costosa (para darnos una idea se paga aproximadamente por STATA $10 000 anuales por computadora).

2.- Es abierto: Una de las características más importantes y por la cual tiene una gran variedad de paquetes y funciones muy útiles es debido a que su código es abierto. Al ser código abierto la comunidad de especialistas (y amantes) de R pueden publicar sus propias mejoras de R (más velocidad por dar un ejemplo) y la creación y mejora de paquetes.

El CRAN almacena los mejores paquetes (4300 sólo en el CRAN) aunque existen otros servidores de paquetes como bioconductor (el cual se especializa en paquetes para bioinformáticos).

3.- Fácil de aprender: R es uno de los softwares más fáciles de aprender gracias a la gran cantidad de documentación acerca de los paquetes y funciones.

4.- Velocidad de procesamiento: Estamos en la Era de la Información y para los analistas ello es sinónimo de data y más data. STATA es uno de los mejores software estadísticos ya que puede procesar grandes cantidades de data. Pero ¿podrá competir con R? STATA tiene un límite y ese límite es el procesador y memoria RAM de la computadora, R tiene paquetes (y he ahí de nuevo su característica de abierto) entre los cuales pueden utilizar memoria y velocidad de procesamiento en nube con ello el analista que utiliza R no está limitado a la capacidad física de su computadora sino que puede apoyarse del Internet (e incluso de otras PCs conectadas en red). Además gracias a otros paquetes especializados en big data se puede procesar a una velocidad mayor gracias al poder de compresión de data de tales paquetes.

5.- Fomenta la Investigación Reproducible: ¿Se imaginan la cantidad de papers que se publican al año? ¿Cómo poder saber si las investigaciones están bien realizadas? Debemos recordar que el sólo hecho de obtener un p-value menor a 0.05 (en la mayoría de casos) no significa que ya esté realizada una buena investigación, pueden haber errores metodológicos, de limpieza de datos, de conclusiones, etc. Además ¿cómo criticar una investigación si los investigadores sólo ofrecen los resultados finales? Una solución para esto es la investigación reproducible. El término de La Investigación Reproducible se atribuye a Jon Claerbout de Standford's University y se refiere a la idea de que el producto final de la investigación no debería circunscribirse a un artículo sino también al análisis de datos gracias al entorno computacional completo (código de análisis, datos) para que éstos sean reproducidos por otros investigadores para avanzar a partir de éstos y/o analizar y aprender mejor de las investigaciones.

6.- Un software documentado: Para los análisis estadísticos existen diversas formas de realizarse que pueden variar desde autores, enfoques y, obviamente, software. Por ejemplo para realizar el bootstraping existe diversos estadísticos que tienen diversas metodologías, aunque sus resultados no difieren mucho; puede ser importante para los criterios de los investigadores. Por ejemplo al realizar en STATA y R un bootstrapping pueden diferir sus resultados, pero con R vas a saber exactamente cuál es el procedimiento de éste. En resumen con los software que no tienen documentación no sabes exactamente qué están realizando para obtener ese resultado.

7.- Puede usarse en cualquier sistema operativo: Existen algunos software que no se pueden usarse en ciertos sistemas operativos, perjudicando a ciertos usuarios. R permite instalarse y utilizarse en todos los sistemas operativos.

8.- Tiene paquetes especializados: El uso de las estadísticas no sólo lo utilizan los estadísticos; sino también diversas profesiones como Economía, Finanzas, Marketing, Medicina, Biología, etc. Existen desde paquetes especializados de Economía que pueden coger cualquier variable macro o micro del mundo hasta paquetes de Trading de Alta Frecuencia que permiten obtener data a tiempo real en finanzas. Adicionalmente de hacer espectaculares gráficos hasta la elaboración de papers con el uso del lenguaje Latex.