Ir al contenido principal

Android Stagefright Exploit / POC (III)

En la anterior entrada del blog comentaba que podíamos seguir principalmente dos vectores de búsqueda a la hora de localizar código vulnerable en el caso que nos ocupa (Android Stagefright).

Pues bien, en esta nueva entrada me voy a centrar en el vector de búsqueda por código fuente. Dado que tenemos acceso al código fuente, la manera más sencilla de localizar alguna vulnerabilidad, sin lugar a dudas será esta.

Son muchos los tipos de vulnerabilidades que puede tener un software y, una de ellas bien conocida y documentada son los "Integer Overflows" y los "Integer Underflows".

Parece bastante lógico pensar, que dada la complejidad del código de un sistema operativo (Android en este caso), no será difícil que algún programador cometa determinados tipos de errores y los desbordamientos de números, enteros en este caso, no son una excepción.

Como sabemos a día de hoy, desde la versión Android 2.2 hasta Android 5.1.1.r4 se han encontrado diversos fallos relacionados con los Integer overflows/underflows.

Para poder verlo de una manera más clara, nada mejor que echar un vistazo al código fuente de Android y en concreto al framework multimedia Stagefright que ha suscitado tanta polémica en los últimos días (y no es para menos,  según  dicen, más de 900 millones de dispositivos podrían ser vulnerables).

A continuación tenemos un pedazo de código fuente de Stagefrigtht en donde vamos a ver claramente uno de estos "Integer underflows", se trata de la función parseESDescriptor, cuya firma o prototipo tiene la siguiente forma:

status_t ESDS::parseESDescriptor(size_t offset, size_t size)

Rápidamente podemos observar que requiere de un par de parámetros de tipo size_t, que como sabremos se trata de un tipo entero sin signo (unsigned int), utilizado principalmente para devolver el tamaño en bytes de algún tipo de objeto, etc.

Esto significa que tanto "offset" como "size" debieran contener algún valor de tipo entero mayor o igual que cero, pero nunca menor, es decir, nunca debiera ser negativo.

Pues bien, aquí es donde han cometido el fallo, los chicos de Google cuando programaron esta función, cuyo cuerpo podemos ver a continuación, eso sí un poco abreviado para no mostraros código innecesario para la prueba de concepto:

1.  status_t ESDS::parseESDescriptor(size_t offset, size_t size) {
2.  
3.  if (size < 3) {
4.         return ERROR_MALFORMED;
5.  }
6.  
7.  offset += 2; // skip ES_ID
8.  size -= 2;
9.  
10. unsigned streamDependenceFlag = mData[offset] & 0x80;
11. unsigned URL_Flag = mData[offset] & 0x40;
12. unsigned OCRstreamFlag = mData[offset] & 0x20;
13. 
14. ++offset;
15. --size;
16. 
17. if (streamDependenceFlag) {
18.        offset += 2;
19.        size -= 2;
20. }
21. 
22. if (URL_Flag) {
23.        if (offset >= size) {
24.              return ERROR_MALFORMED;
25.        }
26.        unsigned URLlength = mData[offset];
27.        offset += URLlength + 1;
28.        size -= URLlength + 1;
29. }
30. ...
31. ... código eliminado intencionadamente
32. ...
33. }


Analicemos un poco este código para darnos cuenta donde está realmente el fallo encontrado. Si os fijáis en la primera sentencia de comparación, en caso de que size sea menor que 3 la función retornará con un error controlado y esto no supondrá a priori ningún problema (siempre que este sea tratado correctamente). Es decir, solo se seguirá ejecutando el código de la función cuando size sea mayor o igual que 3.

Supongamos que size vale 3, en la siguiente instrucción menos como se le resta 2 a size, con lo que pasaría a valer 1. Y en la siguiente instrucción que hace referencia a size, se le vuelve a restar 1, por lo tanto ahora size valdría 0.

Hasta aquí todo correcto, pero ahora viene la parte delicada, que provocará el desbordamiento de tipo entero (Integer overflow/underflow).


Se trata de la siguiente sentencia de comparación:


1.  if (streamDependenceFlag) {
2.         offset += 2;
3.         size -= 2;

4.  }


Recordad que en estos momentos size valdría 0, por lo tanto si se cumple la condición, es decir, si streamDependenceFlag es True, entonces se le restará nuevamente 2 al valor de size, dando como resultado "-2" y como hemos dicho anteriormente, el tipo de datos size_t es un tipo de datos entero sin signo, por lo tanto estaremos intentando almacenar un valor negativo en una variable que solo admite valores positivos, provocándose entonces el desbordamiento.


Ahora bien, ¿qué es lo que haría que se cumpla tal condición? pues si nos fijamos en la línea 10 del código:


1.  unsigned streamDependenceFlag = mData[offset] & 0x80;


Se hace una operación binaria entre mData[offset] y el valor 0x80, por lo tanto si en los datos almacenados en el array mData, y en el índice indicado por 'offset' almacenamos un valor tal que de como resultado TRUE, entonces la condición que provoca el desbordamiento se cumplirá.

La función completa tiene más código, pero es a partir de lo expuesto cuando se produce el verdadero desbordamiento y en las siguientes llamadas a funciones que se hacen en el resto de código, se pasa size como parámetro pero en esta ocasión con un valor del tipo 0xfffffffe

En el caso expuesto, hemos visto una función muy concreta del framework multimedia de Android (Stagefriht), que se encargaría de parsear o analizar archivos MPEG-4 en el caso de que el codec utilizado sea por ejemplo un 'mp4v'. Se trata de una extensión del formato de video MPEG-4 conocida como "Elementary Stream Descriptor" o ESDS para los amigos.


En todo caso, aquí tenéis un pequeño ejemplo con el que jugar para comprobar lo explicado:


unsigned datos[] = {0x01, 0x02, 0x98, 0x04, 0x45};


int Integer_Underflow(size_t offset, size_t size)
{
       if (size < 3)
            return -1;

       size -= 2;
       unsigned flag = datos[offset] & 0x80;
       --size;

       if (flag)
       {
             size -= 2;
       }

       return 0;
}



int main(int argc, char *argv[])
{
       return Integer_Underflow(2, 3);
}

Comentarios

Entradas populares de este blog

Como usar el TL431 (muy facil)

En este artículo, no vamos a entrar en el funcionamiento interno de este IC, ni tampoco en sus características técnicas, puesto que para esos fines ya existe su hoja de datos correspondiente. Más bien, lo que pretendo aquí es dejar constancia de como podemos utilizar este IC desde un punto de vista práctico, útil y sobre todo de una manera sencilla, con el objetivo de que cualquiera pueda utilizarlo. Si has llegado hasta aquí, probablemente ya sabes que por internet hay mucha información sobre este IC, pero también bastante confusa o excesivamente técnica, sin mostrar tan siquiera un ejemplo de funcionamiento, o como calcular sus pasivos. Pues se acabó, a partir de hoy y después de leer este post, ya te quedará claro como utilizar el TL431 para obtener una tensión de referencia estable y precisa. Vamos al grano y que mejor que empezar aclarando que el TL431 NO ES EXACTAMENTE UN ZENER como se empeñan en decir en muchos sitios, es verdad que se le conoce como el Zener Progra

Expresión Regular para números en Notación Científica (1.5e-10)

No cabe duda que las expresiones regulares tienen un potencial de mucho valor a la hora de analizar textos, ya sea para marcado, búsqueda de patrones, o incluso la programación de un compilador, un analizador de frases, de expresiones matemáticas, etc.   En esta ocasión he tenido que echar mano de ellas para el análisis de textos matemáticos en los cuales aparecen números en Notación Científica (con exponentes del tipo 1.5E-10). Pues bien, una expresión regular que me está funcionando bastante bien es la siguiente:   [-+]?[0-9]*\.?[0-9]+([eE][-+]?[0-9]+)?    Esta expresión regular se puede descomponer en los siguientes bloques, para poder interpretarla con mayor facilidad:  El primer bloque [-+]? está indicando que el número podría estar precedido opcionalmente de un signo - o un signo + El segundo bloque [0-9]* indica que podría aparecer un número de 0 o más dígitos del 0 al 9  El tercer bloque indica que también de manera opcional podría aparecer un pun

Programadores de Malware ¿Malas prácticas?

Cuando uno se enfrenta al análisis de un nuevo malware, son muchos los frentes que podemos abrir y los enfoques que podemos darle. Como es lógico, un primer paso será identificar que es un malware de aquello que no lo es, y en ocasiones esto es preciso hacerlo con la mayor rapidez posible. Muchas veces no contamos con el tiempo necesario para hacer un análisis completo a priori, y lo único que necesitamos es tomar decisiones tempranas para iniciar todos los protocolos oportunos ante una nueva muestra "maléfica". Parece lógico pensar, que un código que inicialmente está ofuscado, empaquetado, o que hace uso de determinadas APIs del sistema, ya tiene una cierta probabilidad de ser malware y por lo tanto empezar a tratarlo de manera especial. Durante estos días he estado analizando un nuevo malware, posiblemente una variante de tantas que andan circulando en estos días por internet. En concreto, lo que tengo entre manos es un Ransomware, si compañeros, un especimen