Ir al contenido principal

¡ ARANGE ! ¿Qué haces? (numpy, python, matlab)

Si hay algo que me saca de mis casillas y a la vez me encanta, es encontrar un comportamiento anómalo en algo y no saber - a priori- porque sucede.

Me saca de mis casillas, porque muchas veces necesitas hacer algo rápido y lo último que quieres son problemas, complicaciones y pérdidas de tiempo. Pero a la vez me encanta, porque todo el proceso de búsqueda, investigación y depuración que implica dar con la solución, es apasionante y enriquecedor, siempre se aprenden cosas nuevas o rememoran otras olvidadas.

Voy al grano. Resulta que necesitaba generar unas gráficas sobre una operación de muestreo de señales FSK con el fin de analizar el comportamiento de unos filtros digitales. Y como de costumbre, termino utilizando alguno de los paquetes "matemáticos" al uso, ya sea tipo Matlab o bien, con algún lenguaje de programación.

En este caso, decidí utilizar python y su paquete científico y para generar el espacio de tiempo necesario para representar las gráficas, pues decidí utilizar ARANGE del paquete Numpy, en lugar de utilizar por ejemplo LINSPACE.

Hasta aquí aparentemente es todo correcto, y creedme que al final todo resultó ser una auténtica chorrada por culpa de un detalle que olvidé, pero amigo, cuando no lo ves, no lo ves.

Pues bien, voy todo decidido y creo un primer array:

Como podemos apreciar, se genera un array compuesto de 20 valores que en este caso tienen un paso de 0.05 exacto. Pero cual es el problema, pues que a la hora de generar la gráfica, resulta que no se incluía la última muestra. Si os fijáis, el rango indicado en la función va desde '0' hasta '1', sin embargo el array generado contiene valores comprendidos entre '0' y '0.95'. No se incluye el valor máximo del rango, es decir, el '1'

Resulta que en la documentación de la función 'arange' se indica claramente que esta función no genera el último valor, o valor de Stop, pero si el valor inicial o Start. Sin embargo, esto tampoco es del todo cierto, puesto que el último valor, si que puede llegar a incluirse, como podemos ver en este otro ejemplo, con una pequeña "trampa":



Si nos fijamos en la imagen superior, ahora si que se incluye el último valor correspondiente al '1' y en este caso, el array contiene 21 valores. Pero, ¿Qué ha sucedido? Bueno, se ve claramente, que el valor máximo del rango o valor de 'stop' que he pasado a la función np.arange(), ahora no es '1', sino que le estoy pasando '1.000000000000001'. Muchos pensarían que con esa cantidad de ceros a la derecha del punto decimal, poco podría afectar al resultado, pero no es así exactamente.

Si miramos nuevamente la imagen, justo debajo de los valores del array, aparece una suma de dos valores en decimales o en coma flotante. Estos son el 1.000000000000001 y 0.05. Para cualquiera, lo lógico sería pensar que el resultado de sumar 1.000000000000001 + 0.05 debería ser 1.050000000000001. Resulta que como se ve en la imagen, para python 1.000000000000001  + 0.05 es igual a 1.0500000000000012 Ojo! y no solo para python, para otros lenguajes de programación y calculadoras también, aunque muchos de ellos "truquen" los resultados o las representaciones en pantalla para "camuflar" esa "imprecisión" de cálculo, que por otro lado es algo inherente al propio sistema utilizado para procesar los valores en coma flotante y en un entorno binario.

En definitiva, en cuanto hice esa comprobación, enseguida me di cuenta de que es lo que tenía entre manos y la razón por la cual estaba obteniendo muestras de la señal incompletas, es decir, sin la última muestra. Os dejo una última imagen, donde se ve claramente la diferencia entre las dos gráficas, la de la izquierda incompleta, es decir, sin la última muestra y, la de la derecha completa.



Ya en el pasado, el famoso problema de "imprecisión en coma flotante" que es como se le conoce a este problema, me hizo dar alguna que otra vuelta a la cabeza.

No obstante, para aquellos a los que os interese este tema, escribiré un post al respecto, dando algunos detalles más técnicos de porque sucede esto.

Hasta entonces, ¡un saludo a todos los lectores!



Comentarios

Entradas populares de este blog

Como usar el TL431 (muy facil)

En este artículo, no vamos a entrar en el funcionamiento interno de este IC, ni tampoco en sus características técnicas, puesto que para esos fines ya existe su hoja de datos correspondiente. Más bien, lo que pretendo aquí es dejar constancia de como podemos utilizar este IC desde un punto de vista práctico, útil y sobre todo de una manera sencilla, con el objetivo de que cualquiera pueda utilizarlo. Si has llegado hasta aquí, probablemente ya sabes que por internet hay mucha información sobre este IC, pero también bastante confusa o excesivamente técnica, sin mostrar tan siquiera un ejemplo de funcionamiento, o como calcular sus pasivos. Pues se acabó, a partir de hoy y después de leer este post, ya te quedará claro como utilizar el TL431 para obtener una tensión de referencia estable y precisa. Vamos al grano y que mejor que empezar aclarando que el TL431 NO ES EXACTAMENTE UN ZENER como se empeñan en decir en muchos sitios, es verdad que se le conoce como el Zener Progra

Expresión Regular para números en Notación Científica (1.5e-10)

No cabe duda que las expresiones regulares tienen un potencial de mucho valor a la hora de analizar textos, ya sea para marcado, búsqueda de patrones, o incluso la programación de un compilador, un analizador de frases, de expresiones matemáticas, etc.   En esta ocasión he tenido que echar mano de ellas para el análisis de textos matemáticos en los cuales aparecen números en Notación Científica (con exponentes del tipo 1.5E-10). Pues bien, una expresión regular que me está funcionando bastante bien es la siguiente:   [-+]?[0-9]*\.?[0-9]+([eE][-+]?[0-9]+)?    Esta expresión regular se puede descomponer en los siguientes bloques, para poder interpretarla con mayor facilidad:  El primer bloque [-+]? está indicando que el número podría estar precedido opcionalmente de un signo - o un signo + El segundo bloque [0-9]* indica que podría aparecer un número de 0 o más dígitos del 0 al 9  El tercer bloque indica que también de manera opcional podría aparecer un pun

Programadores de Malware ¿Malas prácticas?

Cuando uno se enfrenta al análisis de un nuevo malware, son muchos los frentes que podemos abrir y los enfoques que podemos darle. Como es lógico, un primer paso será identificar que es un malware de aquello que no lo es, y en ocasiones esto es preciso hacerlo con la mayor rapidez posible. Muchas veces no contamos con el tiempo necesario para hacer un análisis completo a priori, y lo único que necesitamos es tomar decisiones tempranas para iniciar todos los protocolos oportunos ante una nueva muestra "maléfica". Parece lógico pensar, que un código que inicialmente está ofuscado, empaquetado, o que hace uso de determinadas APIs del sistema, ya tiene una cierta probabilidad de ser malware y por lo tanto empezar a tratarlo de manera especial. Durante estos días he estado analizando un nuevo malware, posiblemente una variante de tantas que andan circulando en estos días por internet. En concreto, lo que tengo entre manos es un Ransomware, si compañeros, un especimen