sábado, 4 de junio de 2016

Social Computing

Para la entrada de esta semana debiamos escribir acerca de social computing o sobre el análisis de grandes cantidades de datos. Yo voy a escribir sobre social computing. Específicamente, voy a centrarme en escribir acerca de los incentivos que llevan a la gente a participar continuamente en plataformas de este tipo.

Los tres papers que leí fueron Incentives and Rewarding in Social Computing (Ognjen et. al), Public Bookmarks and Private Benefits: An Analysis of Incentives in Social Computing (Wash y Rader) y De-anonymizing users across heterogeneous social computing platforms (Korayem y Crandall). Los primeros dos textos tienen un tema común: ¿Qué incentiva a la gente a participar en plataformas de social computing?. El último texto es un tema completamente distinto: busca encontrar algoritmos que permitan identificar cuando dos perfiles en dos plataformas distintas corresponden a una misma persona.

El equipo de Ognjen se dedica a estudiar los métodos que utilizan las compañías enfocadas a social computing para mejorar el desempeño de sus empleados. En la primera parte del paper los autores se dedican a clasificar los distintos tipos de incentivos en categorías, como por ejemplo pago por desempeño, evaluación relativa a sus pares, compensasión basada a los logros de un equipo, etc.

En la segunda parte del paper los autores hacen uso de las categorías descritas anteriormente para estudiar la forma en que las compañías hacen uso de los incentivos. Se pusieron en contacto con empresas que mencionaban social computing o crowdsourcing como rubro, y obtuvieron información acerca de los mecanismos que usaban. Concluyen que un gran porcentaje de las empresas encuestadas no usaba más de dos mecanismos de incentivo. Dependiendo del enfoque de cada compañía, se notaban dos grandes tendencias: empresas dedicadas a crowdsourcing (como Mechanical Turk de Amazon) utilizan evaluación relativa a sus pares obteniendo información objetiva de sus sistemas. Por otro lado, empresas enfocadas en generación de ideas, como por ejemplo concursos, utilizan mayormente enfoques subjetivos en los que los incentivos de tipo psicológico van ganando terreno. Una última cosa que me parece interesante destacar es que los autores comentan que muy pocas empresas hacen uso de los ascensos como método de incentivo (a diferencia de las empresas típicas, en las que la gente se esfuerza para subir en la pirámide). Lo anterior es reflejo de que la gente no espera "generar una carrera" al realizar trabajos en internet.

En el texto Public Bookmarks and Private Benefits: An Analysis of Incentives in Social Computing, de Wash y Rader estudia la página del.icio.us. El sitio web permite a sus usuarios guardar los enlaces que estime conveniente. Cada usuario es capaz de almacenar hipervínculos a otras páginas web, agregar tags para organizar dichos hipervínculos, agregar pequeñas descripciones a cada uno, además de funciones sociales tales como agregar amigos, compartir enlaces con ellos y visitar los perfiles de cada uno para ver que cosas han almacenado.

Lo interesante de sitios como del.icio.us es que cada persona que participa en la plataforma contribuye al bienestar del resto. En el estudio se encuentra que gran parte del incentivo para participar en el sitio web es para obtener beneficio personal en lugar de contribuir a una comunidad. No obstante lo anterior, cada vez que guardan un enlace para uso personal enriquecen el contenido de la página web y en consecuencia, contribuyen a una comunidad.

En el estudio se entrevistan a unos 20 usuarios activos de del.icio.us y comprueban mi punto anterior. Gran parte de los usuarios guarda enlaces para uso personal, pero a la vez revisa constantemente la actividad de sus amigos. Por lo tanto, cada vez que guardan un enlace aportan a la experiencia de los demás usuarios, ya que sus amigos seguramente encuentren interesante lo que los demás almacenan.

Por último, el paper De-anonymizing users across heterogeneous social computing platforms de Korayem y Crandall pretende establecer un método para detectar cuando dos perfiles en dos plataformas distintas de social computing pertenecen a una misma persona en la vida real. El tema de este texto no está tan relacionado con los dos anteriores (que hablaban sobre incentivos), pero decidí leerlo ya que el tema me pareció interesante.

En el texto dan por supuesto que si dos perfiles en plataformas distintas realizan actividad en horarios similares, utilizan un vocabulario similar para expresarse, entregan información geográfica similar en los mismos periodos de tiempo y tienen interacciones sociales con usuarios similares, entonces es altamente probable que correspondan a la misma persona. Para cada uno de estos factores generan diversos estimadores. En general, todos los estimadores son generados de manera similar. Por ejemplo, para medir si dos perfiles realizan actividades en horarios similares se genera un vector con información acerca del uso de la plataforma para los perfiles que se quiere analizar. Luego, se aplican técnicas de algebra lineal para medir la diferencia entre los dos vectores, como por ejemplo similaridad de Hamming o computar similaridad por coseno.

Para cada factor se crean diversos estimadores. Unos estimadores pueden ser mejores que otros, y los autores no pueden saber de antemano cual se comporta mejor para cada factor. Luego, para encontrar que estimador es conveniente utilizar los autores crearon un algoritmo de machine learning que pudiera seleccionar el mejor dado cierto tiempo. Para que el algoritmo aprenda se le entregaron sets de datos obtenidos de las APIs de flickr y twitter, en donde se conocía de antemano que algunos pares de usuarios eran en efecto los mismos, y viceversa. Finalmente, logran crear un algoritmo capaz de identificar con una alta exactitud si es que dos usuarios en ambas plataformas corresponden a la misma persona. Lo anterior da un poco de miedo ya que puede invadir la privacidad de algunas personas que podrían querer permanecer en anonimato, pero a la vez es un poco asombroso.