Aritmetica del punto flotante

Solo disponible en BuenasTareas
  • Páginas : 8 (1921 palabras )
  • Descarga(s) : 0
  • Publicado : 13 de febrero de 2012
Leer documento completo
Vista previa del texto
Aritmética del punto flotante
El sistema numérico que se usa cotidianamente se llama sistema decimal. La base del sistema numérico decimal es 10 . Sin embargo, las computadoras no usan el sistema decimal en los cálculos ni en la memoria, sino que usan el sistema binario (base 2 ). La base de un número se denota por medio de un subíndice; por ejemplo: 3 22410 , es 3 224 en base 10 ó 1001 112 , es1001 11 en base 2 . Un esquema de almacenamiento ampliamente usado para la forma binaria es el estándar de la IEEE Standard for Binary Floating-Point Arithmetic. Esta forma fue definida por el Institute of Electrical and Electronic Engineers, IEEE (Instituto de Ingenieros Eléctricos y Electrónicos). En general los fabricantes de las microcomputadoras utilizan este estándar para el hardware depunto flotante. Para almacenar un número en forma binaria, primero se normaliza; es decir, se vuelve a escribir el número, en un equivalente binario de notación científica convencional, desplazando el punto decimal inmediatamente a la derecha del primer bit significativo del número (es decir después del primer 1 de izquierda a derecha). Luego el resultado se multiplica por 2 n , si el punto sedesplazó n posiciones a la izquierda, o por 2 n si el punto se desplazó n posiciones a la derecha; la multiplicación es necesaria para recuperar el valor original del número. Un número de punto flotante se puede escribir en la forma normalizada general, de la siguiente manera:

V

( 1)s (1 f )2 (2t )10

(1.7)

donde V es el número de punto flotante, s es el bit de signo, cuyo valor puede ser 0 ó1 (si s 1 indica un número negativo, si s 0 indica un número positivo). Los bits significativos del número están contenidos en la cantidad (1 f ) , que se denomina mantisa. La potencia t al final de la representación es la característica ó exponente. El valor binario del exponente t no se almacena directamente; en vez de ello, se almacena en forma sesgada o equivalente como un valor binario nonegativo c . La relación del exponente real t en términos del valor almacenado c y el sesgo b es:

t

c b c t b

(1.8) (1.9)

donde b , toma un valor 127 para precisión simple ( 32 bits) y 1023 para precisión doble ( 64 bits). El formato de precisión simple usa 32 bits, de los cuales el primer bit (llamado bit más significativo), está reservado para el bit del signo s ; los 8 bits siguientesse usan para almacenar un patrón de bits que representan el exponente t en forma sesgada (c) y los 23 bits restantes se usan para la mantisa f . Sólo se almacena la parte de la mantisa denotada por f porque el dígito principal siempre es igual a 1 y se entiende que forma parte del número.

El formato de precisión doble usa 64 bits, de los cuales el primer bit, está reservado

para el bit delsigno s ; los 11 bits siguientes se usan para almacenar un patrón de bits que representan el exponente t en forma sesgada (c) y los 52 bits restantes se usan para la mantisa f . Sólo se almacena la parte de la mantisa denotada por f porque el dígito principal siempre es igual a 1 y se entiende que forma parte del número.

El exponente es desplazado antes de ser almacenado, ajustando su valorpara ponerlo dentro de un rango sin signo adaptable a una comparación. Así, para un número en precisión simple, un exponente en el rango 126 ( 1111110 2 ) a 127 (11111112 ) es desplazado mediante la suma de 127 para obtener un valor en el rango 1 a 254 ( 0 y 255 tienen valores especiales descritos más adelante). Para un número en precisión doble, un exponente en el rango 1022 ( 11111111102 ) a 1023(11111111112 ) es desplazado mediante la suma de 1023 para obtener un valor en el rango 1 a 2046 ( 0 y 2047 tienen valores especiales descritos más adelante). Antes de ver como se almacena un número en una computadora en una palabra de 32 y 64 bits, es necesario saber como realizar las conversiones del sistema decimal al binario y viceversa; tanto para números enteros, como para fraccionarios....
tracking img