Que hay

Solo disponible en BuenasTareas
  • Páginas : 6 (1498 palabras )
  • Descarga(s) : 0
  • Publicado : 10 de marzo de 2011
Leer documento completo
Vista previa del texto
2.1.- Lenguajes y Expresiones Regulares.
El analizador léxico es la primera fase de un compilador. Su primer función consiste en leer los caracteres de entrada y elaborar como salida una secuencia de componentes léxicos que utiliza el analizador sintáctico para hacer el análisis. Hay varias razones para dividir la fase de análisis de la compilación en análisis léxico y análisis sintáctico:
1.Un diseño sencillo es quizá la consideración más importante.
2. Se mejora la eficiencia del compilador. Las peculiaridades del alfabeto de entrada y otras anomalías propias de los dispositivos pueden limitarse al analizador léxico.

Las expresiones regulares son una notación importante para especificar patrones. Cada patrón concuerda con una serie de cadenas, de modo que las expresionesregulares servirán como nombres para conjuntos de cadenas.
El término alfabeto o clase de carácter denota cualquier conjunto finito de símbolos. Ejemplos típicos de símbolos son las letras y los caracteres. El conjunto {0,1} es el alfabeto binario.
Una cadena sobre algún alfabeto es una secuencia finita de símbolos tomados de ese alfabeto. En teoría del lenguaje, los términos frase y palabra a menudo seutilizan como sinónimos del término “cadena”. Por ejemplo: camino es una cadena de longitud seis. La cadena vacía, representada por £, es una cadena especial de longitud cero.
El término lenguaje se refiere a cualquier conjunto de cadenas de un alfabeto fijo. Para el análisis léxico, interesan principalmente la unión, la concatenación y la cerradura. La cadena vacía es el elemento identidad quese concatena. L como el alfabeto que contiene el conjunto de letras mayúsculas y minúsculas, y D como el alfabeto que contiene el conjunto de los 10 dígitos decimales.
b) LD es el conjunto de cadenas que consta de una letra seguida de un dígito (concatenación).
c) L4 es el conjunto de todas las cadenas de cuatro letras. (cerradura de kleene)
d) L* es el conjunto de todas las cadenas de letras,incluyendo £, la cadena vacía. (cerradura positiva)
e) L(LUD)* es el conjunto de todas las cadenas de letras y dígitos que comienzan con una letra.
f) D* es el conjunto de todas las cadenas de uno o más dígitos.
Expresiones Regulares
Letra (letra|dígito)*
La barra vertical aquí significa “o”, los paréntesis se usan para agrupar subexpresiones, el asterisco significa “cero o más casos de” laexpresión entre paréntesis, y la yuxtaposición de letra con el resto de la expresión significa concatenación.
Una expresión regular se construye a partir de expresiones regulares más simples utilizando un conjunto de reglas definitorias. Cada expresión regular r representa un lenguaje L(r) combinando de varias maneras los lenguajes representados por las subexpresiones de r.
Las siguientes son lasreglas que definen las expresiones regulares del alfabeto Σ. Asociada a cada regla hay una especificación del lenguaje representado por la expresión regular que se está definiendo.
1. £ es una expresión regular designada por {£}; es decir, el conjunto que contiene la cadena vacía.
2. Si a es un símbolo de Σ, entonces a es una expresión regular designada por {a}; por ejemplo, el conjunto quecontiene la cadena a. aunque se usa la misma notación para las tres, técnicamente, la expresión regular a es distinta de la cadena a o del símbolo a. el contexto aclarará si se habla de a como expresión regular, cadena o símbolo. (r) (s) es una expresión regular representada por L(r)L(s). (r)* es una expresión regular representada por (L(r))*. (r) es una expresión regular representada por L(r)2.Se dice que un lenguaje designado por una expresión regular es un conjunto regular. La especificación regular es un ejemplo de definición recursiva. Las reglas 1 y 2 son la base de la definición recursiva. Las reglas 1 y2 son la base de la definición; se usa el término símbolo básico para referirse a £ o a un símbolo de Σ que aparezcan en una expresión regular.
Se pueden evitar los paréntesis...
tracking img