El corpus builder

Este artefacto con su nombre extraño Corpus Builder, es un creador de un corpus de textos, especificamente de todos los Readmes de projectos de GitHub. Asi como este aqui. Al inicio la herramienta era para mi, no queria recurrir a mi amigo Hugo, quien programó, cada vez que quisiera un corpus de algo. Entre otras cosas, esas noches de programación en Gavea fueron divertidas, yo con mis requisitos, el programando y aveces yo durmiendo en su hombro. Aveces tambien se iba el internet y era una shit. Aveces la dueña de casa se quedaba en la sala durmiendo y roncaba mientras el programaba en la oscuridad, y yo intentaba mucho no dormir pero siempre terminaba en su hombro. Aqui la aplicación .

Un día mi orientador me preguntó si tenia alguna novedad para enviar a una conferencia, y, entre las cosas que tenía, el corpus era lo mas util. Hize unas busquedas, verifique cuan importante era un corpus en algunos papers, hice unos slides, mostré a mi orientador, el aceptó, escribimos, enviamos, y… 4 vezes fue rechazado este trabajo en casi un año. Nadie lo entendió al pobre paper.

Finalmente encontró su lugar en una conferencia de Big Data en mi ciudad. El dia de su presentación no fue el mejor de los días, estar de luto te manda las energías bien abajo. De otro lado, finalmente después de 15 años, vi bonita la universidad que no me gustaba para nada y senti muchas ganas de volver a casa.

El paper aqui