Tema 5: Definiciones de listas por comprensión

José A. Alonso
Departamento de Ciencias de la Computación e I.A.
Universidad de Sevilla
Sevilla, 1 de agosto de 2019

Notas:

La versión interactiva de este tema se encuentra en Binder.
Se desactiva el corrector estilo de Haskell.

In [1]:

:opt no-lint

Nota: En este tema se usarán las siguientes librerías

In [2]:

import Data.Char  
import Test.QuickCheck

Generadores¶

Definiciones por comprensión

Definiciones por comprensión en Matemáticas:
$\{x^2 : x \in \{2,3,4,5\}\} = \{4,9,16,25\}$
Definiciones por comprensión en Haskell:

In [3]:

[x^2 | x <- [2..5]]

[4,9,16,25]

La expresión x <- [2..5] se llama un generador.
Ejemplos con más de un generador:

In [4]:

[(x,y) | x <- [1,2,3], y <- [4,5]]

[(1,4),(1,5),(2,4),(2,5),(3,4),(3,5)]

In [5]:

[(x,y) | y <- [4,5], x <- [1,2,3]]

[(1,4),(2,4),(3,4),(1,5),(2,5),(3,5)]

Generadores dependientes

Ejemplo con generadores dependientes:

In [6]:

[(x,y) | x <- [1..3], y <- [x..3]]

[(1,1),(1,2),(1,3),(2,2),(2,3),(3,3)]

(concat xss) es la concatenación de la lista de listas xss. Por ejemplo,

concat [[1,3],[2,5,6],[4,7]] == [1,3,2,5,6,4,7]

In [7]:

concat' :: [[a]] -> [a]
concat' xss = [x | xs <- xss, x <- xs]

In [8]:

concat' [[1,3],[2,5,6],[4,7]]

[1,3,2,5,6,4,7]

Generadores con variables anónimas

Ejemplo de generador con variable anónima: (primeros ps) es la lista de los primeros elementos de la lista de pares ps. Por ejemplo,

sesion
primeros [(1,3),(2,5),(6,3)]  ==  [1,2,6]`

In [9]:

primeros :: [(a, b)] -> [a]
primeros ps =  [x | (x,_) <- ps]

In [10]:

primeros [(1,3),(2,5),(6,3)]

[1,2,6]

Definición de la longitud por comprensión

In [11]:

longitud :: [a] -> Int
longitud xs = sum [1 | _ <- xs]

In [12]:

longitud [4,2,7]

In [13]:

longitud "Sevilla"

Guardas¶

Las listas por comprensión pueden tener guardas para restringir los valores.
Ejemplo de guarda:

In [14]:

[x | x <- [1..10], even x]

[2,4,6,8,10]

(factores n) es la lista de los factores del número n. Por ejemplo,

sesion
factores 30  ==  [1,2,3,5,6,10,15,30]`

In [15]:

factores :: Int -> [Int]
factores n = [x | x <- [1..n], n `mod` x == 0]

In [16]:

factores 30

[1,2,3,5,6,10,15,30]

(primo n) se verifica si n es primo. Por ejemplo,

sesion
primo 30  == False
primo 31  == True

In [17]:

primo :: Int -> Bool
primo n = factores n == [1, n]

In [18]:

primo 30

False

In [19]:

primo 31

True

(primos n) es la lista de los primos menores o iguales que n. Por ejemplo,

sesion
primos 31  == [2,3,5,7,11,13,17,19,23,29,31]

In [20]:

primos :: Int -> [Int]
primos n = [x | x <- [2..n], primo x]

In [21]:

primos 31

[2,3,5,7,11,13,17,19,23,29,31]

Guarda con igualdad

Una lista de asociación es una lista de pares formado por una clave y un valor. Por ejemplo,

sesion
[("Juan",7),("Ana",9),("Eva",3)]

(busca c t) es la lista de los valores de la lista de asociación t cuyas claves valen c. Por ejemplo

sesion
busca 'b' [('a',1),('b',3),('c',5),('b',2)] ==  [3,2]

In [22]:

busca :: Eq a => a -> [(a, b)] -> [b]
busca c t = [v | (c', v) <- t, c' == c]

La función `zip`¶

La función zip y elementos adyacentes

(zip xs ys) es la lista obtenida emparejando los elementos de las listas xs e ys. Por ejemplo,

sesion
ghci> zip ['a','b','c'] [2,5,4,7]
[('a',2),('b',5),('c',4)]

(adyacentes xs) es la lista de los pares de elementos adyacentes de la lista xs. Por ejemplo,

sesion
adyacentes [2,5,3,7]  ==  [(2,5),(5,3),(3,7)]

In [23]:

adyacentes :: [a] -> [(a, a)]
adyacentes xs = zip xs (tail xs)

In [24]:

adyacentes [2,5,3,7]

[(2,5),(5,3),(3,7)]

Las funciones zip, and y listas ordenadas

(and xs) se verifica si todos los elementos de xs son verdaderos. Por ejemplo,

In [25]:

and [2 < 3, 2+3 == 5]

True

In [26]:

and [2 < 3, 2+3 == 5, 7 < 7]

False

(ordenada xs) se verifica si la lista xs está ordenada. Por ejemplo,

sesion
ordenada [1,3,5,6,7]  ==  True
ordenada [1,3,6,5,7]  ==  False

In [27]:

ordenada :: Ord a => [a] -> Bool
ordenada xs = and [x <= y | (x,y) <- adyacentes xs]

In [28]:

ordenada [1,3,5,6,7]

True

In [29]:

ordenada [1,3,6,5,7]

False

La función zip y lista de posiciones

(posiciones x xs) es la lista de las posiciones ocupadas por el elemento x en la lista xs. Por ejemplo,

sesion
posiciones 5 [1,5,3,5,5,7]  ==  [1,3,4]

In [30]:

posiciones :: Eq a => a -> [a] -> [Int]
posiciones x xs = 
    [i | (x',i) <- zip xs [0..n], x == x']
    where n = length xs - 1

In [31]:

posiciones 5 [1,5,3,5,5,7]

[1,3,4]

Comprensión de cadenas¶

Cadenas y listas

Las cadenas son listas de caracteres. Por ejemplo,

In [32]:

"abc" == ['a','b','c']

True

La expresión
"abc" :: String
es equivalente a
['a','b','c'] :: [Char]
Las funciones sobre listas se aplican a las cadenas:

In [33]:

length "abcde"

In [34]:

reverse "abcde"

"edcba"

In [35]:

"abcde" ++ "fg"

"abcdefg"

In [36]:

posiciones 'a' "Salamanca"

[1,3,5,8]

Definiciones sobre cadenas con comprensión

(minusculas c) es la cadena formada por las letras minúsculas de la cadena c. Por ejemplo,

sesion
minusculas "EstoEsUnaPrueba"  ==  "stosnarueba"

In [37]:

minusculas :: String -> String
minusculas xs = [x | x <- xs, elem x ['a'..'z']]

In [38]:

minusculas "EstoEsUnaPrueba"

"stosnarueba"

(ocurrencias x xs) es el número de veces que ocurre el carácter x en la cadena xs. Por ejemplo,

sesion
ocurrencias 'a' "Salamanca"  ==  4

In [39]:

ocurrencias :: Char -> String -> Int
ocurrencias x xs = length [x' | x' <- xs, x == x']

In [40]:

ocurrencias 'a' "Salamanca"

Cifrado César¶

En el cifrado César cada letra en el texto original es reemplazada por otra letra que se encuentra 3 posiciones más adelante en el alfabeto.
La codificación de
"en todo la medida"
es
"hq wrgr od phglgd"
Se puede generalizar desplazando cada letra n posiciones.
La codificación con un desplazamiento 5 de
"en todo la medida"
es
"js ytit qf rjinif"
La descodificación de un texto codificado con un desplazamiento n se obtiene codificándolo con un desplazamiento -n.

Codificación y descodificación¶

Las funciones ord y char

(ord c) es el código del carácter c. Por ejemplo,

In [41]:

ord 'a'

In [42]:

ord 'b'

In [43]:

ord 'A'

(char n) es el carácter de código n. Por ejemplo,

In [44]:

chr 97

'a'

In [45]:

chr 98

'b'

In [46]:

chr 65

'A'

Codificación y descodificación: Código de letra

Simplificación: Sólo se codificarán las letras minúsculas dejando los restantes caracteres sin modificar.
(let2int c) es el entero correspondiente a la letra minúscula c. Por ejemplo,

sesion
let2int 'a'  ==  0
let2int 'd'  ==  3
let2int 'z'  ==  25

In [47]:

let2int :: Char -> Int
let2int c = ord c - ord 'a'

In [48]:

let2int 'a'

In [49]:

let2int 'd'

In [50]:

let2int 'z'

Codificación y descodificación: Letra de código

(int2let n) es la letra minúscula correspondiente al entero n. Por ejemplo,

sesion
int2let 0   ==  'a'
int2let 3   ==  'd'
int2let 25  ==  'z'

In [51]:

int2let :: Int -> Char
int2let n = chr (ord 'a' + n)

In [52]:

int2let 0

'a'

In [53]:

int2let 3

'd'

In [54]:

int2let 25

'z'

Codificación y descodificación: Desplazamiento

(desplaza n c) es el carácter obtenido desplazando n caracteres el carácter c. Por ejemplo,

sesion
desplaza   3  'a'  ==  'd'
desplaza   3  'y'  ==  'b'
desplaza (-3) 'd'  ==  'a'
desplaza (-3) 'b'  ==  'y'

In [55]:

desplaza :: Int -> Char -> Char
desplaza n c 
    | elem c ['a'..'z'] = int2let ((let2int c+n) `mod` 26)
    | otherwise         = c

In [56]:

desplaza   3  'a'

'd'

In [57]:

desplaza   3  'y'

'b'

In [58]:

desplaza (-3) 'd'

'a'

In [59]:

desplaza (-3) 'b'

'y'

Codificación y descodificación

(codifica n xs) es el resultado de codificar el texto xs con un desplazamiento n.

In [60]:

codifica :: Int -> String -> String
codifica n xs = [desplaza n x | x <- xs]

In [61]:

codifica   3  "En todo la medida"

"Eq wrgr od phglgd"

In [62]:

codifica (-3) "Eq wrgr od phglgd"

"En todo la medida"

Propiedades de la codificación con QuickCheck

Propiedad: Al desplazar n un carácter desplazado n, se obtiene el carácter inicial.

In [63]:

prop_desplaza n xs = 
    desplaza (-n) (desplaza n xs) == xs

In [64]:

quickCheck prop_desplaza

+++ OK, passed 100 tests.

Propiedad: Al codificar con -n una cadena codificada con n, se obtiene la cadena inicial.

In [65]:

prop_codifica n xs = 
    codifica (-n) (codifica n xs) == xs

In [66]:

quickCheck prop_codifica

+++ OK, passed 100 tests.

Análisis de frecuencias¶

Tabla de frecuencias

Para descifrar mensajes se parte de la frecuencia de aparición de letras.
tabla es la lista de la frecuencias de las letras en castellano, Por ejemplo, la frecuencia de la 'a' es del 12.53%, la de la 'b' es 1.42%.

In [67]:

tabla :: [Float]
tabla = [12.53, 1.42, 4.68, 5.86, 13.68, 0.69, 1.01, 
          0.70, 6.25, 0.44, 0.01,  4.97, 3.15, 6.71, 
          8.68, 2.51, 0.88, 6.87,  7.98, 4.63, 3.93, 
          0.90, 0.02, 0.22, 0.90,  0.52]

Frecuencias

(porcentaje n m) es el porcentaje de n sobre m. Por ejemplo,

sesion
porcentaje 2 5  ==  40.0

In [68]:

porcentaje :: Int -> Int -> Float
porcentaje n m = (fromIntegral n / fromIntegral m) * 100

In [69]:

porcentaje 2 5

40.0

(frecuencias xs) es la frecuencia de cada una de las minúsculas de la cadena xs. Por ejemplo,

sesion
ghci> frecuencias "en todo la medida"
[14.3,0,0,21.4,14.3,0,0,0,7.1,0,0,7.1,
 7.1,7.1,14.3,0,0,0,0,7.1,0,0,0,0,0,0]

In [70]:

frecuencias :: String -> [Float]
frecuencias xs = 
    [porcentaje (ocurrencias x xs) n | x <- ['a'..'z']]
    where n = length (minusculas xs)

In [71]:

frecuencias "en todo la medida"

[14.285715,0.0,0.0,21.428572,14.285715,0.0,0.0,0.0,7.1428576,0.0,0.0,7.1428576,7.1428576,7.1428576,14.285715,0.0,0.0,0.0,0.0,7.1428576,0.0,0.0,0.0,0.0,0.0,0.0]

Descifrado¶

Descifrado: Ajuste chi cuadrado

Una medida de la discrepancia entre la distribución observada $os_i$ y la esperada $es_i$ es
$\chi^2 = \displaystyle \sum_{i=0}^{n-1}\frac{(os_i-es_i)^2}{es_i}$
Los menores valores corresponden a menores discrepancias.
(chiCuad os es) es la medida chi cuadrado de las distribuciones os y es. Por ejemplo,

sesion
chiCuad [3,5,6] [3,5,6]  ==  0.0
chiCuad [3,5,6] [5,6,3]  ==  3.9666667

In [72]:

chiCuad :: [Float] -> [Float] -> Float
chiCuad os es = 
    sum [((o-e)^2)/e | (o,e) <- zip os es]

In [73]:

chiCuad [3,5,6] [3,5,6]

0.0

In [74]:

chiCuad [3,5,6] [5,6,3]

3.9666667

Descifrado: Rotación

(rota n xs) es la lista obtenida rotando n posiciones los elementos de la lista xs. Por ejemplo,

sesion
rota 2 "manolo"  ==  "noloma"

In [75]:

rota :: Int -> [a] -> [a]
rota n xs = drop n xs ++ take n xs

In [76]:

rota 2 "manolo"

"noloma"

Descifrado

(descifra xs) es la cadena obtenida descodificando la cadena xs por el antidesplazamiento que produce una distribución de minúsculas con la menor desviación chi cuadrado respecto de la tabla de distribución de las letras en castellano. Por ejemplo,

sesion
codifica 5 "Todo para nada" ==  "Ttit ufwf sfif"
descifra "Ttit ufwf sfif"   ==  "Todo para nada"

In [77]:

descifra :: String -> String
descifra xs =  codifica (-factor) xs
 where
  factor = head (posiciones (minimum tabChi) tabChi)
  tabChi = [chiCuad (rota n tabla') tabla | n <- [0..25]]
  tabla' = frecuencias xs

In [78]:

codifica 5 "Todo para nada"

"Ttit ufwf sfif"

In [79]:

descifra "Ttit ufwf sfif"

"Todo para nada"

Bibliografía¶

R. Bird. Introducción a la programación funcional con Haskell. Prentice Hall, 2000.
- Cap. 4: Listas.
G. Hutton. Programming in Haskell. Cambridge University Press.
- Cap. 5: List comprehensions.
B. O'Sullivan, D. Stewart y J. Goerzen. Real World Haskell. O'Reilly, 2008.
- Cap. 12: Barcode Recognition.
B.C. Ruiz, F. Gutiérrez, P. Guerrero y J.E. Gallardo. Razonando con Haskell. Thompson, 2004.
- Cap. 6: Programación con listas.
S. Thompson. Haskell: The Craft of Functional Programming, Second Edition. Addison-Wesley, 1999.
- Cap. 5: Data types: tuples and lists.