Ciencias Perdonen si me derivo

Letras y cifras: matemáticas para la hora del vermú

Ilustración de
Ilustración de Raquel Garcia Ulldemollins.

Hace unos días me comentaba mi bien querido Alberto Márquez un apunte curioso que aparecía en Microsiervos. Es este.

Por si les da pereza pinchar en el enlace, les hago un resumen. Piensen una palabra en inglés, cualquiera, la que se le venga a la cabeza. Ajá, beautiful. Gracias, no me esperaba otra. Ahora contamos las letras de la palabra beautiful, son nueve. En inglés, nine. Ahora contamos las letras de nine, son cuatro. En inglés four, y se termina el juego. Porque four es el único número que en inglés tiene tantas letras al escribirlo como indica su cifra. Esto ocurre con cualquier palabra que piensen en dicho idioma. En la misma nota de Microsiervos pueden ver ese hecho representado en este gráfico de Ramiro Gómez.

grafo

¿Qué pasa en nuestra amada lengua castellana? Pues que el resultado final de este juego es o bien cinco o bien un bucle infinito cuatro-seis. Lo de infinito es un pelín exagerado porque entiendo que cualquier persona razonable se daría cuenta enseguida de dicho bucle y pararía. Ya, Mariano no.

Si elegimos por ejemplo la palabra ignominioso, tiene once letras. Contamos las letras de once y son cuatro. Contamos las de cuatro y son seis, que se escribe con cuatro letras. Y ya. Si lo hacemos con la palabra mordaza, esta tiene siete letras. Contamos las letras de siete que son cinco y fin. Porque cinco tiene eso, cinco letras.

Es más, aunque no se dice explícitamente, puede parecer de la lectura de la nota de Microsiervos que la primera opción, el cinco, es más probable que la segunda, el bucle cuatro-seis. En primer lugar por paralelismo de todo lo que se está diciendo que ocurre con el inglés y en segundo por la propia redacción, dicen ellos:

Efectivamente: cualquier palabra acaba en cinco, que es el único número tiene tantas letras como el valor que indica, o bien en el bucle cuatro-seis.

Es verdad que no se afirma que acaben más palabras en el cinco, pero sí que se induce a pensarlo.

Comentando esto con Alberto a la hora del vermú nos planteábamos la siguiente pregunta: si elegimos una palabra al azar del castellano, ¿qué es más probable? ¿Que el juego cabe en cinco o en el bucle cuatro-seis? Como quiere el destino que los dos seamos matemáticos y sin embargo amigos, lo primero que necesitábamos definir es qué es elegir una palabra al azar. Y se nos ocurrían varios experimentos que podrían describir este hecho.

Puede que alguien esté pensando que esto no es relevante y que no es más que una frikada de dos mentes cuadriculadas ociosas. Puede que acierte en lo segundo porque, como ya he dicho, estábamos conversando a la hora del vermú. Pero no en lo primero. Para nada. A la hora de hacer un sorteo justo es imprescindible eso, que sea justo, lo que llamamos equiprobable: que todos los resultados tengan las mismas posibilidades de salir. Por ejemplo, los sorteos esos tan populares en nuestras administraciones en función de las letras de los apellidos no lo son, nunca. Pero de eso ya rajamos aquí en su momento.

Pues bien, de eso les vengo a hablar, porque estuvimos haciendo las cuentas en función de cómo se escogía una palabra del castellano al azar y nos resultó muy llamativo y simpático el resultado. Como corren malos tiempos para la alegría en este planeta no he podido resistir la tentación de compartir tan mirífico hallazgo con ustedes, por si les alegra el día tanto como me lo alegró a mí. Ya ven, algunas, a partir de cierta edad, nos conformamos con poco.

En primer lugar, vamos a ver qué es más popular en castellano para nuestro juego: terminar en cinco o en el bucle cuatro-seis. Si elegimos una palabra de una letra, una tiene tres letras, tres tiene cuatro, cuatro tiene seis y, ya saben, entramos en bucle.

Con dos pasa lo mismo en castellano porque también tiene tres letras. Si se entretienen pueden ir haciendo un gráfico como este.

cifrasletras

Va, les echo una mano. Vamos a hacer las cuentas hasta veintitrés porque la palabra más larga que aparece en el diccionario de la Academia tiene veintitrés letras. ¡Sí! Electroencefalografista, efectivamente. Eso sí, si habláramos en sueco las cuentas las iba a hacer un ídem porque estos tienen palabras de hasta ciento treinta letras, nodöstersjökustartilleriflygspaningssimulatoranläggningsmaterielunderhallsuppföljningssy-stemdiskussionsinläggsförberedelsearbeten, que, como se intuye al pronunciarla significa: artillería de la costa norte del Báltico, construcción de un simulador de vuelo, sistemas de monitorización y mantenimiento y preparación de posters de comunicación. Ya, son así. Qué se puede esperar de un país que compra los roperos a trozos pero no sabe trocear las frases (1).

Bueno, que me derivo, aquí están las cuentas:

tabla

Bueno, pues parece que si lo que elegimos al azar es la longitud de una palabra en castellano, esto es, un número (natural) entre uno y veintitrés, en el juego de marras el resultado más probable es el bucle cuatro-seis: 14/23, aparece catorce de las veintitrñes veces. ¿Podríamos concluir aquí que en castellano es más probable acabar en cuatro-seis que en cinco? No, definitivamente no. Porque hablar en castellano no consiste en elegir palabras al azar en función de su longitud, al menos no para la gente que de verdad sabe lo que quiere decir.

Tendremos que cambiar el experimento. Mira, ¿y si usamos el diccionario de la Academia, que tiene casi todas la palabras que se usan en castellano? (Salvo si te dedicas a la ciencia, claro, que muchos de tus vocablos habituales aún no están recogidos). No hace falta, porque tenemos las cuentas hechas con otro diccionario aquí. Estudiaremos qué resultado es más probable en nuestro juego si el experimento consiste en elegir al azar una palabra en ese diccionario. En este caso haría falta contar cuántas palabras de cada longitud aparecen en el mismo: cuántas palabras de una letra hay en el diccionario, cuántas de dos letras, de tres… Pero ya está hecho en el trabajo de Antonio Frías Delgado, y usando esos datos concluimos que nuestro juego acaba en el bucle cuatro-seis alrededor del 58% de las veces. O sea que, por poco, pero le gana al cinco también como cuando elegíamos las palabras en función de su longitud.

¿Estamos ya en condiciones para concluir que en castellano es más probable acabar en cuatro-cinco que en seis? Pues, mira, no, tampoco. Porque hablar castellano tampoco consiste en elegir palabras al azar del diccionario y soltarlas sin más, hay que unirlas, hilvanarlas y construir esas bellas guirnaldas que son las frases. Lo sé, me he pasado con el azúcar. En cualquier caso, para conseguir lo de las guirnaldas usamos muchas palabras de una, dos y tres letras por ejemplo. Pero en las cuentas del diccionario que acabamos de usar, las longitudes de palabra más probables son ocho, nueve y diez letras, con una probabilidad de entre un doce y un 15% cada una de ellas, mientras que las palabras de longitud uno, dos o tres letras tienen una probabilidad inferior al 1%. Hum, no parece reflejar el porcentaje de veces que usamos las preposiciones o conjunciones, por ejemplo, al hablar.

Vamos a usar un libro. En un libro «se habla» casi como se habla en castellano.

Y, o fortuna, el estudio de Frías Delgado que hemos mencionado más arriba nos va ayudar mucho con eso. Por ejemplo, podemos saber que en nuestro maravilloso Quijote más del 7% son palabras de una letra, más del, ojo, 23% son de dos letras y más del 17% de tres. Mientras que, les recuerdo, estas longitudes aparecían menos del 1% en el diccionario. Pues bien, si usamos el Quijote y hacemos las cuentas de nuestro juego, nos sale que termina en el bucle cuatro-seis alrededor del 77% de las veces. Otra vez le hemos vuelto a ganar al cinco, esta vez con más ventaja.

Ya, igual en nuestro entorno hay una o ninguna persona que hable con un castellano semejante al usado por don Miguel en tan egregia historia, con lo cual esto no nos parecerá significativo.

Pero, pero, pero… según concluye el trabajo que hemos estado usando, la longitud de las palabras en castellano es un factor estable a lo largo del tiempo. Dicho de otra forma, si hacen el recuento con textos actuales (de gente razonable, claro) los porcentajes de palabras de cada longitud serán bastante similares a los de la historia de nuestro desgraciado hidalgo y, de nuevo, el bucle cuatro-seis aparecerá más veces que el cinco en nuestro juego.

Pero si no se fían, ya tienen un pasatiempo para este verano para compartir con niños y mayores: regalen un buen libro y pídanle al obsequiado que cuando lo haya terminado haga el experimento de elegir palabras del mismo al azar y contar como en el juego que hemos propuesto. Yo creo que cien veces es un número razonable de repeticiones pero eso dependerá, claro, del sujeto al que le hayamos propuesto el juego y del tiempo que deseemos tenerlo entretenido. Si nuestra discusión es cierta, ganará el bucle cuatro-seis sobre el 5cinco. En otro caso, pues mira, no, pero y lo que hemos disfrutado leyendo…

(1) No creo que me dedique nunca a la política ni aspire a ninguna silla en ningún ayuntamiento, pero, por si acaso, lo de los suecos es un chiste, no tengo nada en contra de Suecia. Yo tengo amigos suecos.

SUSCRIPCIÓN MENSUAL

5mes
Ayudas a mantener Jot Down independiente
Acceso gratuito a libros y revistas en PDF
Descarga los artículos en PDF
Guarda tus artículos favoritos
Navegación rápida y sin publicidad
 
 

SUSCRIPCIÓN ANUAL

35año
Ayudas a mantener Jot Down independiente
Acceso gratuito a libros y revistas en PDF
Descarga los artículos en PDF
Guarda tus artículos favoritos
Navegación rápida y sin publicidad
 
 

SUSCRIPCIÓN ANUAL + FILMIN

85año
Ayudas a mantener Jot Down independiente
1 AÑO DE FILMIN
Acceso gratuito a libros y revistas en PDF
Descarga los artículos en PDF
Guarda tus artículos favoritos
Navegación rápida y sin publicidad
 

10 Comentarios

  1. Pingback: Letras y cifras: matemáticas para la hora del vermú

  2. En catalán siempre se termina en un bucle 6-3-4 (sis, tres, quatre). Excepto las palabras de una letra, claro, que el 1 es ‘u’.

  3. Juan Gabriel

    Muchas gracias por el artículo, estupendo como siempre.

    Solo un apunte, creo que hay un baile de cifras aquí:
    «¿Estamos ya en condiciones para concluir que en castellano es más probable acabar en cuatro-cinco que en seis?»

    Un saludo.

  4. Twiddlebug

    Al igual que en inglés, en alemán también se acaba siempre en 4 (vier).

  5. En euskera hay tres finales. 2 (bi), bucle 3-4 (hiru-lau) y… 9! (bederatzi).

  6. «Mira, ¿y si usamos el diccionario de la Academia, que tiene casi todas la palabras que se usan en castellano? (Salvo si te dedicas a la ciencia, claro, que muchos de tus vocablos habituales aún no están recogidos).» Casi todas es una exageración, tal vez casi todas las de uso común. Cualquier campo semántico que se me ocurra está corto de definiciones (vestimenta, cocina, electrónica, salud, lingüística, botánica y todos los demás) y si hablamos de las variedades de castellano mayoritarias que no sean la del norte de España la cosa es todavía peor, por ejemplo, el mexicano (la variedad más hablada, quizás por 100 millones) o el rioplatense.

    Un ejercicio interesante. Yo habría apostado por el bucle seis-cuatro, por la enorme cantidad de bisílabos como «casa» o «mantel» y por los trisílabos de verbos, como «camina» o «sacudo».

    Saludos.

  7. Librado.

    Qué divertido. Enredando un poco la cosa, ¿qué podríamos decir, a partir de este inofensivo entretenimiento [¡ay, hay tantos!] acerca de la concepción lógica de ingleses, españoles y catalanes (comentario de Marc) con la que afrontamos la realidad. Seguro que podríamos sacar una teoría competente. ¿Podríamos evidenciar en el carácter inglés una epistemología cabal del cuatro? ¿Y en el español un dilema entre esa decisión cabal del cinco y una indefinición infinita ¿hegeliana? cuatro-seis? ¿Y para los catalanes podríamos hablar de una ambición de infinitud más compleja, la sis-tres-quatre? ¿Y para los vascos, como no podría ser de otra forma, no se conforman con atisbar una cabalidad aristotélica de las cosas, sino que tienen dos? Saludos.

  8. Bienvenido al mundo de los autómatas ;)

    https://es.wikipedia.org/wiki/Aut%C3%B3mata_finito

  9. blunsburibarton

    En gallego solo hay un camino: el del número cinco. Definitivamente no hay relación alguna entre la matemática del lenguaje y el carácter de sus hablantes.

  10. Pingback: Letras y cifras: matemáticas para la hora del vermú – Jot Down Cultural Magazine | Cosas veredes

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

*


Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.