Recuerdo que alguien me hizo esa pregunta hace tiempo. En esta entrada voy a intentar poner una pequeña lista (no completa ni exacta) de lo que implicó hacer mi tesis doctoral. Para hacer mi tesis se emplearon, una vez hecha la carrera de fisica y de ser aceptado en para hacer la tesis, del orden de: -3 años y 3 meses como doctorando. -100 días en el Observatorio del Teide (con un coste operativo de un millón de pesetas/día ) -4 meses escribiendo y corrigiendo a tiempo completo. -40.000 euros para mi sueldo. -2.000 euros en conferencias. -2 ordenadores, y un clúster de 20 CPU de vez en cuando. -1 Tera de espacio en disco, sin contar backups. -más 3 meses de procesado continuo de datos en 20 CPUs de 3Ghz cada una. La carpeta de la tesis en mi ordenador ocupa 850 megas, pero incluye copias de seguridad, datos, figuras y fotos. Sólo la charla de defensa de la tesis son 300 megas (tiene algunos vídeos). El archivo del texto de la tesis está escrito con LaTeX, que es un sistema de procesado de textos particularmente bueno para dar formato a textos científicos. El archivo “thesis.tex” incluye muchos comandos que no salen en libro impreso, aún asi, las estadística muestra que se compone de: -360174 caracteres en 62144 palabras, de 2 sílabas por palabra de media (es inglés, ellos no tienen palabras largas). - 7599 frases, así que 8 palabras por frase, nada de frases largas. (ïndice de Flesch de 51). -6800 líneas (10 palabras or línea). Si una persona lee una línea en 3 segundos, tardaría sólo 5 horas en leerla entera. buscando un poco más de juego con esto de la estadísticas calculé el número de ocurrencias de cada palabra. En Mac/Linux esto lo consigues con el comando: <blockquote>tr -cs “[:alpha:]” “\n” < thesis.tex |
sort | uniq -c | sort -rn</blockquote> La palabras que más uso son the, of, and, in, to, … cosa normal teniendo en cuenta que está escrita en inglés. Seleccionando algunas palabras interesantes queda: ![]() Por el otro extremo, es curioso mirar la unicidad de las palabras, osea, cuántas palabras están sólo 1 vez, o cuántas están sólo 2 veces. Resulta que de las 62144 palabras, hay 1835 únicas, un 3%. Me puedo imaginar que ésta es una buena forma de mirar lo repetitiva que es una tesis. ![]() |
¿Qué implica hacer una tesis doctoral?
| Comment