19 mar 2023

Combinaciones sin repetición: algoritmo mejorado

Combinaciones sin repetición con algoritmo mejorado

Hay varias identidades relacionadas con los coeficientes binomiales. Una de ellas es la que vemos en la Figura, obtenida a partir de la denominada identidad Hockey-stick. Vemos que C(6, 3) = C(5, 2)+C(4, 2)+C(3, 2)+C(2, 2) = 10+6+3+1 = ∑_j=2..5 C(j, 2) = 20. Ese último sumatorio también lo podemos expresar como ∑_j=3..6 C(j-1, 3-1) = 20, de lo que obtenemos la fórmula general C(n, k) = ∑_j=k..n C(j-1, k-1). La denominación hockey stick proviene de la forma palo de hockey que se visualiza en el Triángulo de Pascal.

Se observa que es una expresión recurrente que podría servirnos para buscar una versión mejorada del problema de obtener los subconjuntos combinaciones de un conjunto que vimos en el tema anterior. Es importante entender que no buscamos el valor numérico de C(n, k), sino construir ese conjunto de combinaciones. Por ejemplo, las combinaciones sin repetición de la lista de letras {a, b, c, d} tomados en subconjuntos de dos elementos sería una lista con los subconjuntos {{a, b}, {a, c}, {a, d}, {b, c}, {b, d}, {c, d}}.

En la primera versión de este algoritmo del tema anterior habíamos usado la identidad básica del Triángulo de Pascal C(n, k) = C(n-1, k-1) + C(n-1, k), obteniendo el coste T(n, k) = 2 ( ∑_j=0..k C(n, j) ) - 1 en la versión básica que no tenía en cuenta el coste de la copia. Tomemos ahora la identidad siguiente para ver si nos conduce a una mejora de ese coste:

C(n, 0) = 1,
C(n, k) = ∑_j=k..n C(j-1, k-1)

Para demostrar que esta expresión es cierta desplegamos la serie:

∑_j=k..n C(j-1, k-1) = C(k-1, k-1) + C(k, k-1) + C(k+1, k-1) + ... + C(n-1, k-1)

Tomando el principio matemático C(n, k) = C(n-1, k-1) + C(n-1, k) que ya hemos usado repetidas veces antes, que podemos expresar como C(n-1, k-1) = C(n, k) - C(n-1, k), vemos que cada termino de la suma anterior empezando por el final es como cada una de las líneas siguientes:

C(n-1, k-1) = C(n, k) - C(n-1, k)

C(n-2, k-1) = C(n-1, k) - C(n-2, k)

C(n-3, k-1) = C(n-2, k) - C(n-3, k)

C(n-4, k-1) = C(n-3, k) - C(n-4, k)

...

C(k+1, k-1) = C(k+2, k) - C(k+1, k)

C(k, k-1) = C(k+1, k) - C(k, k)

C(k-1, k-1) = C(k, k) - C(k-1, k)

Observe que al sumar los términos en rojo en la primera y segunda línea se anulan. Y así todos los demás quedando sólo el primero y el último. Dado que cuando n < k ⇒ C(n, k) = 0 entonces como k-1 < k ⇒ C(k-1, k) = 0 obteniendo finalmente la demostración:

∑_j=k..n C(j-1, k-1) = C(n, k) - C(k-1, k) = C(n, k) - 0 = C(n, k)

Demostrando la fórmula del sumatorio con función generadora

Aunque en el apartado anterior demostramos la recurrencia vista para n≥k

C(n, 0) = 1,
C(n, k) = ∑_j=k..n C(j-1, k-1)

también podríamos generalizarla para cualquier caso así:

C(0, 0) = 1,
C(0, k) = 0 si k> 0
C(n, 0) = 1
C(n, k) = ∑_j=k..n C(j-1, k-1)

En este apartado vamos a obtener lo mismo usando la técnica de la función generadora. Esto nos servirá para aplicarlo al resto del tema y verlo desde otra perspectiva. Para ello partiremos de la siguiente recurrencia, donde X(n, k) es, supuestamente, una función combinatoria desconocida que al final hemos de identificar con C(n, k):

X(0, 0) = 1,
X(0, k) = 0 si k> 0
X(n, 0) = 1
X(n, k) = ∑_j=k..n X(j-1, k-1)

Usaremos la siguiente función generadora:

G(x, y) = ∑_n,k≥0 X(n, k) xⁿ y^k

Veamos las condiciones iniciales

G_0,0(x, y) = X(0, 0) = 1

G_0,k(x, y) = ∑_k≥0 X(0, k) y^k = X(0, 0) + ∑_k≥1 X(0, k) y^k = 1


G_n,0(x, y) = ∑_n≥0 X(n, 0) xⁿ =	1
	1-x

Como la recurrencia tiene un sumatorio, intentaremos evitarlo haciendo esto:

X(n+1, k+1) = ∑_j=k+1..n+1 X(j-1, k) =

= ∑_j=n+1..n+1 X(j-1, k) + ∑_j=k+1..n X(j-1, k) =

= X(n, k) + X(n, k+1)

Entonces obtenemos X(n+1, k+1) = X(n, k) + X(n, k+1) que es lo mismo que la identidad del Triángulo de Pascal C(n, k) = C(n-1, k-1) + C(n-1, k) si incrementamos un índice C(n+1, k+1) = C(n, k) + C(n, k+1) como era de esperar. Apliquemos la función generadora a la identidad obtenida:

∑_n,k≥0 X(n+1, k+1) xⁿ y^k = ∑_n,k≥0 X(n, k) xⁿ y^k + ∑_n,k≥0 X(n, k+1) xⁿ y^k

Expresemos X(n+1, k+1) en función de X(n, k)

G(x, y) = ∑_n,k≥0 X(n, k) xⁿ y^k =

= ∑_n≥0 X(n, 0) xⁿ + ∑_k≥0 X(0, k) y^k - X(0, 0) + ∑_n,k≥0 X(n+1, k+1) xⁿ⁺¹ y^k+1 =

= G_n,0(x, y) + G_0,k(x, y) - G_0,0(x, y) + ∑_n,k≥0 X(n+1, k+1) xⁿ⁺¹ y^k+1 =


=	1	+ 1 - 1 + ∑_n,k≥0 X(n+1, k+1) xⁿ⁺¹ y^k+1 =
	1-x


=	1	+ xy ∑_n,k≥0 X(n+1, k+1) xⁿ y^k
	1-x

De donde


∑_n,k≥0 X(n+1, k+1) xⁿ y^k =	1	( G(x, y) -	1	)
	xy		1-x

Expresemos X(n, k+1) en función de X(n, k)

G(x, y) = ∑_n,k≥0 X(n, k) xⁿ y^k =

= ∑_n≥0 X(n, 0) xⁿ + ∑_n,k≥0 X(n, k+1) xⁿ y^k+1 =

= G_n,0(x, y) + ∑_n,k≥0 X(n, k+1) xⁿ y^k+1 =


=	1	+ ∑_n,k≥0 X(n, k+1) xⁿ y^k+1 =
	1-x


=	1	+ y ∑_n,k≥0 X(n, k+1) xⁿ y^k
	1-x

De donde


∑_n,k≥0 X(n, k+1) xⁿ y^k =	1	( G(x, y) -	1	)
	y		1-x

Sustituyendo tenemos


1	( G(x, y) -	1	) = G(x, y) +	1	( G(x, y) -	1	)
xy		1-x		y		1-x

Despejando obtenemos la función generadora:


G(x, y) =	1
	1-x-xy

Multiplicamos y dividimos por 1-y:


G(x, y) =	1-y	=
	(1-y)(1-x-xy)


=	1	-	y
	(1-y)(1-x-xy)		(1-y)(1-x-xy)

El primer término ya lo conocimos en el tema anterior al ver los coeficientes binomiales con 1/(1-x-xy) = ∑_n≥0 (1+y)ⁿ xⁿ que con 1/(1-y) = ∑_k≥0 y^k nos queda:


1	= ∑_n,k≥0 (1+y)ⁿ xⁿ y^k
(1-y)(1-x-xy)

Para el segundo término hacemos lo mismo


y	= ∑_n,k≥0 y (1+y)ⁿ xⁿ y^k
(1-y)(1-x-xy)

Obviamente conocemos el Binomio de Newton (1+y)ⁿ = ∑_j≥0 C(n, j) y^j con lo que tenemos:

G(x, y) = ∑_n,k≥0 (1+y)ⁿ xⁿ y^k - ∑_n,k≥0 y (1+y)ⁿ xⁿ y^k =

= ∑_n,k≥0 ( ∑_j≥0 C(n, j) y^j ) xⁿ y^k - ∑_n,k≥0 ( y ∑_j≥0 C(n, j) y^j ) xⁿ y^k =

= ∑_n,k≥0 ( ∑_j≥0 C(n, j) y^j - y ∑_j≥0 C(n, j) y^j ) xⁿ y^k =

= ∑_n,k≥0 ( ∑_j≥0 C(n, j) y^j - ∑_j≥0 C(n, j) y^j+1 ) xⁿ y^k =

= ∑_n,k≥0 ( ∑_j≥0 C(n, j) y^j - ∑_j≥1 C(n, j-1) y^j ) xⁿ y^k

Nuestro término general es entonces:

X(n, k) = ∑_j≥0 C(n, j) - ∑_j≥1 C(n, j-1)

Como j≤k podemos ajustar los índices, teniendo en cuenta que

∑_j=1..k C(n, j-1) = ∑_j=1..k C(n, j-1) = C(n, 0) + C(n, 1) + ... + C(n, k-1) =

= ∑_j=0..k-1 C(n, j)

por lo que finalmente obtenemos:

X(n, k) = ∑_j=0..k C(n, j) - ∑_j=1..k C(n, j-1) =

= ∑_j=0..k C(n, j) - ∑_j=0..k-1 C(n, j) =

= C(n, k)

con lo que obtenemos el resultado esperado X(n, k) = C(n, k).

Implementando algoritmo para generar combinaciones

Implementemos eso en un algoritmo:

// C(n, k) = ∑j=k..n C(j-1, k-1)
function combine2(list=[], k=0, n=list.length, res=Array.from({length:k}, ()=>""), result=[], n0=list.length, k0=res.length){
    if (k===0){
        result.push(copy(res));
    } else {
        for (let j=n; j>=k; j--){
            res[k0-k] = list[n0-j];
            combine2(list, k-1, j-1, res, result);
        }
    }
    return result;
}

En este algoritmo n0 y k0 son los valores en la llamada inicial combine2(n0, k0). En el bucle he invertido el rango [k, n] con objeto de que el conjunto resultado salga con el mismo orden que el algoritmo que vimos en el tema anterior, pero a efectos de la definición de la recurrencia se considera ese rango [k, n] con la llamada interna combine2(list, k-1, j-1).

Antes de estudiar el coste haremos una prueba experimental. Consideremos los costes con el algoritmo del tema anterior que denominaremos T₁(n, k) y con este mejorado T₂(n, k), obteniendo los valores para n=6 con 0 ≤ k ≤ 6:

n=6
k    C(n,k)  T₁(n,k) T₂(n,k)  T₁(n,k)-T₂(n,k)
---------------------------------------------
0    1       1        1        0
1    6       13       13       0
2    15      43       41       2
3    20      83       69       14
4    15      113      69       44
5    6       125      41       84
6    1       127      13       114

T₁(n, k) - T₂(n, k) = T₁(n, k-2) + 1 =>
T₂(n, k) = T₁(n, k) - T₁(n, k-2) - 1

Se observa que en esta prueba se cumple:

T₂(n, k) = T₁(n, k) - T₁(n, k-2) - 1

Recordando el coste del algoritmo del tema anterior:

T₁(n, k) = 2 ( ∑_j=0..k C(n, j) ) - 1

Entonces

T₂(n, k) = T₁(n, k) - T₁(n, k-2) - 1 =

= 2 ( ∑_j=0..k C(n, j) ) -1 - ( 2 ( ∑_j=0..k-2 C(n, j) ) - 1 ) - 1 =

= 2 ( ∑_j=0..k C(n, j) - (∑_j=0..k C(n, j) - C(n, k) - C(n, k-1) ) ) - 1 =

= 2 ( C(n, k) + C(n, k-1) ) - 1 =

= 2 C(n+1, k) - 1

De forma experimental hemos llegado a obtener el coste para este algoritmo mejorado. La función generadora G(x, y) con ese término general es (wolframalpha):

G(x, y) = ∑_n,k≥0 T(n, k) xⁿy^k =

= ∑_n,k≥0 ( 2 C(n+1, k) - 1) xⁿy^k =


=	2xy²-2y²+1-x+xy
	(1-x)(1-y)(1-x-xy)

Si F(x, y) es la función generadora de T₁(n, k) del tema anterior que recordamos nuevamente:

F(x, y) = ∑_n,k≥0 (2 (1+y)ⁿ - 1) xⁿ y^k =

= ∑_n,k≥0 (2 ( ∑_j≥0 C(n, j) y^j ) - 1) xⁿ y^k =


=	1-x+xy
	(1-x)(1-y)(1-x-xy)

Vemos que relación hay entre G(x, y) y F(x, y)


G(x,y) =	2xy²-2y²+1-x+xy	=
	(1-x)(1-y)(1-x-xy)


=	1-x+xy	-	2y²(1-x)	=
	(1-x)(1-y)(1-x-xy)		(1-x)(1-y)(1-x-xy)


= F(x, y) -	2y²
	(1-y)(1-x-xy)

Denominemos el término de la derecha como H(x, y), ecuación que tiene el siguiente desarrollo en series (wolframalpha):


H(x, y) =	2y²	= ∑_n,k≥0 2y²(1+y)ⁿ xⁿy^k
	(1-y)(1-x-xy)

La resta F(x, y) - H(x, y) nos devuelve la serie que sustenta G(x, y) (wolframalpha):

G(x, y) = F(x, y) - H(x, y) =

= ∑_n,k≥0 (2(1+y)ⁿ-1) xⁿy^k - ∑_n,k≥0 2y²(1+y)ⁿ xⁿy^k =

= ∑_n,k≥0 (2 (1-y²) (1+y)ⁿ -1) xⁿy^k =


=	2xy²-2y²+1-x+xy
	(1-x)(1-y)(1-x-xy)

Vemos que este algoritmo mejorado resta el coste H(x, y) al primer algoritmo. Pero todo esto es una suposición experimental. Intentaré en los siguientes apartados que se sustente matemáticamente.

Desarrollo para resolver el coste del algoritmo mejorado (sin coste de copia)

Este algoritmo mejorado se basa en el principio matemático siguiente que ya demostramos en el apartado anterior:

C(n, k) = ∑_j=k..n C(j-1, k-1)

Con este principio se construye nuestro algoritmo, donde la serie equivale a un bucle for. Ya comentamos que es un bucle invertido, es decir, en lugar de ser [k, n] es [n, k]. Lo hacemos así con el único objetivo de que el resultado salga ordenado, pero realmente es indiferente para la ejecución del algoritmo. Sin embargo hay que tener cuidado cuando equiparamos un bucle de un algoritmo con una serie matemática, pues una serie con rango invertido tiene como resultado cero, el elemento neutro de la suma. Es decir, si en general j > k ⇒ ∑_i=j..k a_i = 0. Volveremos a incidir sobre esto porque es un aspecto clave.

Volvemos a repetir aquí el algoritmo que vamos a analizar:

function combine2(list=[], k=0, n=list.length, res=Array.from({length:k}, ()=>""), result=[], n0=list.length, k0=res.length){
    if (k===0){
        iter += 1;
        result.push(copy(res));
    } else {
        iter += 1;
        for (let j=n; j>=k; j--){
            iter += 1;
            res[k0-k] = list[n0-j];
            combine2(list, k-1, j-1, res, result);
        }
    }
    return result;
}

Esta es la definición planteada, donde ahora no contemplamos el coste de copiar cada resultado parcial:

T(n, k) = {	1	if k=0
T(n, k) = {	1 + ∑_j=k..n (1 + T(j-1, k-1))	if k>0

Lo llamamos básico pues en el desarrollo a continuación descubriremos las dudas con las condiciones iniciales. En las definiciones de algoritmo del tema anterior teníamos claro las condiciones iniciales:

T(n, 0) = T(0, k) = T(0, 0) = 1

T(n, k) = 1 + T(n-1, k-1) + T(n-1, k)

Pero en este segundo caso no está tan claro, pues no tienen porque ser las mismas:

T(n, 0) = ?, T(0, k) = ?, T(0, 0) = ?

T(n, k) = 1 + ∑_j=k..n 1+T(j-1, k-1)

Parece obvio que T(n, 0) = 1 puesto que vemos en el algoritmo que si k=0 se produce una única iteración, entrando en el condicional if (k===0) y por lo tanto T(n, 0) = 1. Obtenemos G_n,0(x, y):


G_n,0(x, y) = ∑_n≥0 T(n, 0) xⁿ = ∑_n≥0 xⁿ =	1
	1-x

Si queremos comprobar que T(n, 0) = 1 consideremos la solución general obtenida por experimentación T(n, k) = 2 C(n+1, k) - 1 y que luego demostraremos que es así, usándola de esta forma:


T(n, 0) = 2 C(n+1, 0) - 1 = 2	(n+1)!	- 1 = 2-1 = 1
	0! (n+1-0)!

Por otro lado también es obvio que T(0, 0) =1 pues es un caso particular con k=0, con lo que tenemos:

G_0,0(x, y) = T(0, 0) = 1

Veamos ahora T(0, k), que en el tema anterior era 1 y ahora no es exactamente eso. En el algoritmo vemos que si k>0 entra en el condicional donde está el bucle que itera en el rango [k, 0], pero es un rango inverso que supone que no se ejecute el bucle con k>0. El coste parece ser 1 para cualquier valor de k, pero en matemáticas este bucle con rango invertido si tiene sentido cuando intentamos expresar la recurrencia como una serie. Si el bucle equivale a una serie, entonces con m>n ⇒ ∑_j=m..n a_j = 0 resultando el elemento neutro de la suma.

Para aclarnos apliquemos la solución experimental T(n, k) = 2 C(n+1, k) - 1 a los primeros valores de k con n=0:


T(0, 0) = 2 C(1, 0) - 1 = 2	1!	- 1 = 2×1 - 1 = 1
	0! (1-0)!


T(0, 1) = 2 C(1, 1) - 1 = 2	1!	- 1 = 2×1 - 1 = 1
	1! (1-1)!


T(0, 2) = 2 C(1, 2) - 1 = 2	1!	- 1 = 2×0 - 1 = -1
	2! (1-2)!


T(0, 3) = 2 C(1, 3) - 1 = 2	1!	- 1 = 2×0 - 1 = -1
	3! (1-3)!

...


T(0, k) = 2 C(1, k) - 1 = 2	1!	- 1 = 2×0 - 1 = -1
	k! (1-k)!

En general si k≤1 ⇒ C(1, k) = 1 y si k>1 ⇒ C(1, k) = 0. Puede comprobarlo en WolframAlpha. Vease que tenemos un factorial negativo en el denominador con k>1. El factorial negativo no está definido, pero en series de potencias entendemos que el término (1-k)! → ∞ cuando k→∞, y dado que el numerador es uno entonces el cociente 1 / (k! ∞) → 0.

Ajustando funciones factorial y binomial

En la aplicación usamos unas funciones auxiliares para calcular el factorial(n) que usamos a su vez para calcular el binomial(n, k). Aunque la aplicación tiene por objeto extraer los subconjuntos combinación de un conjunto, también ofrece el valor numérico de C(n, k). En base a lo visto antes haremos unos ajustes en estas funciones recursivas para contemplar factoriales negativos y el caso de k>n.

Matemáticamente es cierto que k>n ⇒ C(n, k) = 0, forzándolo así en la implementación de esta función que denominamos binomial. Hace uso de la función factorial que también hemos ajustado para que permita números negativos, devolviendo 1:

function factorial(n){
    if (n<=0){
        return 1;
    } else {
        return n*factorial(n-1);
    }
}

function binomial(n, k) {
    if (n<k) {
        return 0;
    } else {
        return factorial(n) / (factorial(k)*factorial(n-k));
    }
}

Entonces tenemos que si k=0 ∨ k=1 ⇒ T(0, k) = 1 y si k≥2 ⇒ T(0, k) = -1. Vease además que con T(0, k) y T(n, 0) tenemos que si n=0 ∧ k=0 en ambos casos T(0, 0) =1. Con esto las condiciones iniciales son

n ≥ 0 ⇒ T(n, 0) = 1

0 ≤ k ≤ 1 ⇒ T(0, k) = 1

k > 1 ⇒ T(0, k) = -1

En un apartado más abajo incidiremos sobre estas condiciones iniciales y su implementación en el algoritmo. Veamos ahora G_0,k(x, y) usando estas condiciones iniciales:

G_0,k(x, y) = ∑_k≥0 T(0, k) y^k = T(0, 0) y⁰ + T(0, 1) y¹ + ∑_k≥2 T(0, k) y^k =

= 1 + y + ∑_k≥2 (-1) y^k = 1 + y - ∑_k≥0 y^k+2 = 1 + y - y² ∑_k≥0 y^k =


= 1 + y - y²	1	=	1-2y²
	1-y		1-y

Expresemos T(n, k) = 1 + ∑_j=k..n 1+T(j-1, k-1) en función de n+1 y k+1 como hicimos en el primer apartado

T(n+1, k+1) = 1 + ∑_j=k+1..n+1 1+T(j-1, k) = 1 + (1+T(n, k)) + ∑_j=k+1..n 1+T(j-1, k) =

= 1 + T(n, k) + 1 + ∑_j=k+1..n 1+T(j-1, k) = 1 + T(n, k) + T(n, k+1)

Por lo tanto nuestra recurrencia en términos de n+1 y k+1 queda así:

T(n+1, k+1) = 1 + T(n, k) + T(n, k+1)

Como hicimos en el primer apartado apliquemos series a esta expresión

∑_n,k≥0 T(n+1, k+1) xⁿy^k =

= ∑_n,k≥0 xⁿy^k + ∑_n,k≥0 T(n, k) xⁿy^k + ∑_n,k≥0 T(n, k+1) xⁿy^k

donde hemos de obtener G(x, y) = ∑_n,k≥0 T(n, k) xⁿy^k. Empezaremos por obtener el término general para T(n, k+1):

∑_n,k≥0 T(n, k) xⁿy^k = ∑_n≥0 T(n, 0) xⁿ + ∑_n,k≥0 T(n, k+1) xⁿy^k+1 =

∑_n≥0 T(n, 0) xⁿ + y ∑_n,k≥0 T(n, k+1) xⁿy^k

de donde


∑_n,k≥0 T(n, k+1) xⁿy^k =	1	( G(x, y) -	1	)
	y		1-x

Y ahora el término general para T(n+1, k+1):

∑_n,k≥0 T(n, k) xⁿy^k =

= ∑_n≥0 T(n, 0) xⁿ + ∑_k≥0 T(0, k) y^k - T(0, 0) + ∑_n,k≥0 T(n+1, k+1) xⁿ⁺¹y^k+1 =

= ∑_n≥0 T(n, 0) xⁿ + ∑_k≥0 T(0, k) y^k - T(0, 0) + xy ∑_n,k≥0 T(n+1, k+1) xⁿy^k

de donde


∑_n,k≥0 T(n+1, k+1) xⁿy^k =	1	( G(x, y) -	1	-	1-2y²	+ 1 )
	xy		1-x		1-y

Sustituimos en la expresión de series:


1	( G(x, y) -	1	-	1-2y²	+ 1 ) =
xy		1−x		1-y


1	+ G(x, y) +	1	( G(x, y) -	1	)
(1-x)(1-y)		y		1-x

De donde se deduce la función generadora de nuestro algoritmo mejorado:


G(x, y) =	2xy²-2y²+1-x+xy
	(1-x)(1-y)(1-x-xy)

Es la misma que obtuvimos de forma experimental y que puede comprobarse en wolframalpha. Teniendo la expresión G(x, y) hemos de buscar el término general. Para ello separemos en dos partes como hicimos en el apartado experimental:

G(x, y) = F(x, y) - H(x, y)

Entonces el término general es la siguiente resta, usando el término general de F(x, y) que obtuvimos en el primer apartado:

T_G (n, k) = T_F (n, k) - T_H (n, k) = 2 ( ∑_j=0..k C(n, j) ) - 1 - T_H (n, k)

El coste T_H resta y, por tanto, mejora al de T_F. Estas son las dos funciones generadoras:


F(x, y) =	1-x+xy
	(1-x)(1-y)(1-x-xy)


H(x, y) =	2y²-2xy²	=	2y²(1-x)	=	2y²
	(1-x)(1-y)(1-x-xy)		(1-x)(1-y)(1-x-xy)		(1-y)(1-x-xy)

Puede ver en wolframalpha la expresión en series de H(x, y), aunque en el desplegable siguiente puede ver el cálculo formal usando desarrollo de Taylor:


H(x, y) =	2y²	= ∑_n,k≥0 2y²(1+y)ⁿxⁿy^k
	(1-y)(1-x-xy)

Desarrollo de Tayor

Tenemos


H(x, y) =	2y²	=	1	× 2	y²	= ∑_k≥0 y^k × 2 ∑_n≥0 S xⁿ
	(1-y)(1-x-xy)		1-y		1-x-xy

Así que tenemos que buscar S de tal forma que


∑_n≥0 S xⁿ =	y²
	1-x-xy

Desarrollemos por Taylor la siguiente función, donde f_x ⁿ denota la derivada enésima respecto a x:


f(x, y) =	y²
	1-x-xy


f_x ¹(x, y) =	y²(1+y)
	(1-x-xy)²


f_x ²(x, y) =	2y²(1+y)²
	(1-x-xy)³


f_x ³(x, y) =	6y²(1+y)³
	(1-x-xy)⁴

Solo con estos tres términos particularizamos para (0, y)

f(0, y) = y²

f_x ¹(0, y) = y²(1+y) = 1! y²(1+y)

f_x ²(0, y) = 2y²(1+y)² = 2! y²(1+y)²

f_x ³(0, y) = 6y²(1+y)³ = 3! y²(1+y)³

...

f_x ⁿ(0, y) = n! y²(1+y)ⁿ

Por Taylor parece evidente que


f(x, y) = ∑_n≥0	f_x ⁿ(0, y)	xⁿ	= ∑_n≥0 y²(1+y)ⁿ xⁿ
	n!

Así que S = y²(1+y)ⁿ con lo que tenemos:

H(x, y) = ∑_k≥0 y^k × 2 ∑_n≥0 y²(1+y)ⁿ xⁿ = ∑_n,k≥0 2y²(1+y)ⁿ xⁿy^k

Por un lado ya conocemos la siguiente identidad binomial:

(1+y)ⁿ = ∑_j≥0 C(n, j) y^j

Y por otro haremos esto

H(x, y) = ∑_n,k≥0 2y²(1+y)ⁿxⁿy^k =

= 2 ∑_n,k≥0 ( y² ∑_j≥0 C(n, j) y^j ) xⁿy^k =

= 2 ∑_n,k≥0 ( ∑_j≥0 C(n, j) y^j+2 ) xⁿy^k =

= 2 ∑_n,k≥0 ( ∑_j≥2 C(n, j-2) y^j ) xⁿy^k

Como 2 ≤ j ≤ k entonces

∑_j≥2 C(n, j-2) = ∑_j=2..k C(n, j-2) = C(n, 0) + C(n, 1) + ... + C(n, k-2) =

= ∑_j=0..k-2 C(n, j)

entonces

H(x, y) = 2 ∑_n,k≥0 ( ∑_j=0..k-2 C(n, j) y^j ) xⁿy^k

siendo el término general el siguiente:

T_H (n, k) = 2 ∑_j=0..k-2 C(n, j)

Usando la igualdad C(n, k) + C(n, k-1) = C(n+1, k) tenemos finalmente la solución buscada:

T_G (n, k) = 2 ( ∑_j=0..k C(n, j) ) - 1 - 2 ∑_j=0..k-2 C(n, j) =

= 2 ( ∑_j=0..k C(n, j) - ( - C(n, k-1) - C(n, k) + ∑_j=0..k C(n, j) )) - 1 =

= 2 ( C(n, k) + C(n, k-1) ) - 1 = 2 C(n+1, k) - 1

En esta forma se visualiza que el coste final se reduce con respecto a la solución del primer apartado en k-2+1 términos de la serie:

T(n, k) = 2 ( ∑_j=0..k C(n, j) - ∑_j=0..k-2 C(n, j) ) - 1

En cualquier caso la solución es más cómoda de usar de esta forma:

T(n, k) = 2 C(n+1, k) - 1

Estas soluciones hay que ajustarlas como veremos en el siguiente apartado. Veáse que en la solución se observa el principio en que se basa este algoritmo mejorado:

C(n+1, k) = ∑_j=0..k C(n, j) - ∑_j=0..k-2 C(n, j)

Ajustar algoritmo mejorado para C(n, k) con k>n+1 e incoporar coste de argumentos

En un apartado anterior descubrimos las condiciones iniciales necesarias para representar la recurrencia como series:

n ≥ 0 ⇒ T(n, 0) = 1

0 ≤ k ≤ 1 ⇒ T(0, k) = 1

k > 1 ⇒ T(0, k) = -1

Hay que tener en cuenta que estas condiciones iniciales contemplan que pueda darse el caso k > n, cuando sabemos que las combinaciones C(n, k) en este caso no existen. O dicho de otra forma, existen pero supone un conjunto vacío, pues no se pueden combinar n elementos en subconjuntos de k elementos cuando k>n. Pero como necesitábamos expresar como series la posibilidad de que k>n, adaptaremos también el código del algoritmo en la implementación para contemplar esto.

Vease que con cualquier n>0 ∧ k>0 cuando n = k tenemos T(n, n+1) = 1, T(n, n+2) = -1, T(n, n+3) = -1, ... siendo -1 todos los valores a partir de k > n+1. Por ejemplo, consideremos n=3 y veamos los valores del coste calculado T(n, k) = 2 C(n+1, k) - 1 para valores de k=0, 1, 2, 3, ...

T(n, k) = 2 C(n+1, k) - 1
T(3, 0) = 2 C(4, 0) - 1 = 1
T(3, 1) = 2 C(4, 1) - 1 = 7
T(3, 2) = 2 C(4, 1) - 1 = 11
T(3, 3) = 2 C(4, 3) - 1 = 7
T(3, 4) = 2 C(4, 4) - 1 = 1
T(3, 5) = 2 C(4, 5) - 1 = -1
T(3, 6) = 2 C(4, 6) - 1 = -1
...
j>4 ⇒ T(3, j) = 2 C(4, j) - 1 = -1

Si vemos el algoritmo, cuando k>n+1 entra en la parte del else sumando un iter += 1 de la cabecera del bucle, aunque no entra en ese bucle y, por tanto, no produce nueva llamada recursiva, con lo que el coste final será 1.

function combine2(list=[], k=0, n=list.length, res=Array.from({length:k}, ()=>""),
result=[], n0=list.length, k0=res.length){
    if (k===0){
        iter += 1;
        result.push(copy(res));
    } else {
        iter += 1;
        for (let j=n; j>=k; j--){
            iter += 1;
            res[k0-k] = list[n0-j];
            combine2(list, k-1, j-1, res, result);
        }
    }
    return result;
}

Sin embargo en el coste calculado 2 C(n+1, k) - 1 = -1, por lo que limitamos el coste total con Max(1, -1) = 1 para contemplar el caso de k>n+1:

T(n, k) = Max(1, 2 C(n+1, k) - 1)

La expresión anterior se deducía de la siguiente que también nos conduce al mismo resultado:

T(n, k) = Max(1, 2 ( ∑_j=0..k C(n, j) - ∑_j=0..k-2 C(n, j) ) - 1 )

Estas dos expresiones son iguales, usando la primera en la aplicación.

Lo siguiente es una actualización de lo anterior detectada en marzo 2024.

Posteriormente a publicar este tema, detecto que a la hora de definir el coste del algoritmo no tuve en cuenta el coste de montar los argumentos de la llamada inicial que son directamente proporcionales al tamaño del problema. En este algoritmo vemos que tenemos que crear el Array res con k posiciones vacías. Para ello dotaremos de otro argumento start para, en la primera llamada, sumar k al coste total:

function combine2(list=[], k=0, n=list.length, res=Array.from({length:k}, ()=>""), 
result=[], start=true, n0=list.length, k0=res.length){
    if (start) {
        iter += k;
        start = false;
    }
    if (k===0){
        iter += 1;
        result.push(copy(res));
    } else {
        iter += 1;
        for (let j=n; j>=k; j--){
            iter += 1;
            res[k0-k] = list[n0-j];
            combine2(list, k-1, j-1, res, result, start);
        }
    }
    return result;
}

De este forma el coste final de combine2(list, k) es el siguiente, donde ahora no usamos la función Max() pues la incorporación de k devolverá un valor no negativo, pero lo ajustaremos para cuando n<k devuelva k+1.

n<k ⇒ T(n, k) = k+1
n≥k ⇒ T(n, k) = 2 C(n+1, k) - 1 + k

Algoritmo mejorado con coste de copia

El coste con copia para el algoritmo anterior le afectaba el caso cuando k=0, que en lugar de valorar en 1 el coste teníamos que valorarlo en 1+k₀, siendo k₀ el valor de k en la llamada inicial. En el tema anterior, apartado simplificando el coste con copia, obteníamos una solución que ahora denominamos como T_Fc, para aclarar con c que contiene el coste de copia:

T_Fc (n, k) = 2 ( ∑_j=0..k C(n, j) ) - 1 + k C(n, k)

29 Marzo 2023: Posteriormente a la publicación de este tema actualizo este apartado tras mejorar el apartado simplificando el coste con copia del tema anterior.

Por otro lado teníamos

T_H (n, k) = 2 ∑_j=0..k-2 C(n, j)

Vemos que cuando k=0 tenemos T_H (n, 0) = 2 ∑_j=0..-2 C(n, j) = 2×0 = 0, pues en el caso general en que m>n sucede que ∑_j=m..n a_i = 0, el elemento neutro de la suma. Esto quiere decir que no le afecta la longitud del resultado a devolver, así que podemos determinar que T_Hc = T_H y por tanto:

T_Gc = T_Fc - T_Hc = T_Fc - T_H

De donde finalmente obtenemos la solución incluyendo el coste de copiar cada resultado parcial:

T(n, k) = 2 ( ∑_j=0..k C(n, j) ) - 1 + k C(n, k) - 2 ∑_j=0..k-2 C(n, j) =

= 2 C(n+1, k) - 1 + k C(n, k)

Observe que, al igual que hicimos en el apartado anterior, en las dos sumas con rangos 0..k y 0..k-2 se anulan términos quedando una expresión más sencilla. Entonces el resultado final con coste de copia e incluyendo la limitación al máximo como hicimos en el apartado anterior es:

T(n, k) = Max(1, 2 C(n+1, k) - 1 + k C(n, k))

En definitiva es el mismo coste sin copia T(n, k) =2 C(n+1, k) - 1 más el coste de copiar R = C(n, k) resultados, cada uno con una longitud de k elementos, de tal forma que se suma el coste de copia k × R.

Lo siguiente es una actualización de lo anterior detectada en marzo 2024.

Tal como comentamos al final del apartado anterior, al publicar este tema omití el coste de montar el argumento res que es proporcional al tamaño del problema con longitud k, por lo que la fórmula anterior queda así:

n<k ⇒ T(n, k) = k+1
n≥k ⇒ T(n, k) = 2 C(n+1, k) - 1 + k + k C(n, k)

Comparando el coste de ambos algoritmos

En este tema hemos encontrado las soluciones sin considerar el coste de copia ni la limitación Max(1, T(n,k)) para el caso k>n+1. Los costes del algoritmo del tema anterior y de este tema son, ambos sin considerar el coste de copia, son:

T_F (n, k) = 2 ( ∑_j=0..k C(n, j) ) - 1

T_G (n, k) = 2 C(n+1, k) - 1

En la Figura vemos una representación gráfica del coste de T_F en rojo y de T_G en azul. El ejemplo presenta valores para n=6 y k tomando valores en el rango [0, 6]. Aunque las gráficas aparecen continuas, hemos de entender que son puntos sueltos en las intersecciones de los números enteros del eje k. He usado la aplicación Gráficas matemáticas usando esta entrada de texto con la definición de la gráfica.

Hasta la primera mitad de k la gráfica roja se comporta casi igual que la azul (tomando los enteros [0, 6] del eje k). A partir de ahí la azul aprovecha la ventaja de que las combinaciones hasta la mitad de n son las mismas en orden inverso que las del resto, como ya vimos en un apartado anterior con estos datos de ejemplo y que volvemos a replicar aquí. Se observa esa simetría en C(n, k) que se reproduce en T_G.

n=6
k    C(n,k)  T_F(n,k) T_G(n,k)
---------------------------------------------
0    1       1        1
1    6       13       13
2    15      43       41
3    20      83       69
4    15      113      69
5    6       125      41
6    1       127      13

En resumen podríamos decir que si k<n/2 cualquiera de los dos algoritmos son igual de eficientes. En otro caso el mejorado T_G se comporta mejor. Y más cuando k es o está muy cerca de n.

La cuestión que ahora se plantea es saber en que orden están estas funciones. Recordemos que una función f(n) está o se incluye en el orden de otra g(n) si se cumple lo siguiente:


lim_n→∞	f(n)	∈ ℝ+ ⇒ f(n) ∈ O(g(n)) ∧ g(n) ∈ O(f(n))
	g(n)

Supongamos que buscamos el orden en función de n de T_G, manteniendo k>0 constante. Vease que


C(n+1, k) =	(n+1)!	=	(n+1)n(n-1)...(n+1-k+1) (n+1-k)!	=
	k! (n+1-k)!		k! (n+1-k)!


=	(n+1)n(n-1)...(n+1-k+1)	=	P_k(n)	≃	n^k
	k!		k!		k!

P_k(n) significa un polinomio de orden (n+1) - (n+1-k+1) + 1= k, donde el término de mayor potencia es n^k, entonces asintóticamente equivale a n^k/k!. Para T_G tenemos que:


lim_n→∞	2 C(n+1, k) - 1	=
	n^k / k!


= lim_n→∞	2 (n^k / k!)	- lim_n→∞	k!	= 2-0 = 2 ∈ ℝ+
	n^k / k!		n^k

El límite del término de la derecha k!/n^k es cero, pues

k! = k×(k-1)×.._{k veces}..×2×1

n^k = n×n×.._{k veces}..×n×n

Y claramente si n≥k entonces n^k > k!.

Entonces T_G (n, k) ∈ O(n^k/k!) y n^k/k! ∈ O(T_G (n, k)) con lo que T_G ∈ O(n^k/k!).

En cuanto a T_F (n, k) = 2 ( ∑_j=0..k C(n, j) ) - 1 vemos que el peor de los casos es cuando k=n. En este caso tenemos que 2 ( ∑_j=0..n C(n, j) ) - 1 = 2ⁿ⁺¹ -1. Por lo tanto T_F ∈ O(2ⁿ⁺¹).

En la gráfica de la Figura se observa la representación de T_F (n, k) y T_G (n, k) en función de n y tomando k = n×0.8 para cada valor de n, observándose el mejor comportamiento del algoritmo mejorado. Observe como T_F está muy cerca, pero por debajo, de 2ⁿ⁺¹.

Puede verla en Gráficas matemáticas usando esta definición. Se puede probar con k = n×0.5 observándose que ambas gráficas siguen la misma tendencia, en cuyo caso estarán en el mismo orden. En cualquier caso 2ⁿ⁺¹ es un cota superior de ambas.