Las abreviaturas regex y regexp denotan expresiones regulares que se utilizan en la informática teórica, programación, desarrollo de software, procesamiento de textos y optimización de motores de búsqueda. Las expresiones regulares se pueden utilizar para describir cadenas y números de cadenas en una forma lógica general con el fin de buscarlas, sustituirlas, manipularlas o procesarlas en documentos, código fuente o una base de datos.
Ejemplo: En un editor de texto habilitado para regex, se supone que se muestran todos los enlaces contenidos en un archivo HTML. Si se introduce la expresión [^”]*”[^>]*> en la función de búsqueda del editor, se mostrarán todos los enlaces que tengan el formato habitual para enlaces HTML. El término [.* realiza la misma tarea.]
El lógico y matemático Stephen Kleene es considerado el fundador de regex. En 1956 utilizó anotaciones de cantidades regulares en un ensayo sobre la representación de eventos en redes neuronales y autómatas finitos. Este y otros trabajos son hoy fundamentos fundamentales en la informática teórica. Las expresiones regulares se utilizan ahora en varios campos para simplificar las operaciones, que de otro modo requerirían mucho trabajo y mucho tiempo.
Regex puede ser utilizado en función de su implementación en varios lenguajes de programación, entornos y editores de texto, por ejemplo, en Perl, PHP,.NET o JavaScript como elementos de una librería[1]. O en EditPad, Emacs y Notepad ++ como una función de búsqueda y reemplazo en editores de texto. En Google Analytics, las expresiones regulares también se utilizan para filtrar las fuentes de tráfico, definir segmentos y separar los datos detallados del informe de otros datos.
Los usos de regex son extremadamente diversos. Las posibles expresiones regulares dependen de la notación. Hay diferentes notaciones en diferentes lenguajes de programación. Estas anotaciones se denominan shell pattern name, BRE (Basic Regular Expressions, Expresiones Regulares Básicas) y ERE (Extended Regular Expressions, Expresiones regulares extendidas). Las diferencias se deben a veces al hecho de que se utilizan caracteres individuales y especialmente metacaracteres (caracteres de control) en un lenguaje de programación.
Generalmente, se distinguen los caracteres (terminales) y los metacaracteres. Los caracteres se registran en el juego de caracteres (el alfabeto) que contiene, por ejemplo, números, letras y comas. Los metacaracteres son operaciones especificadas como alternancia |, vinculación () y y se repiten con *, + y ?. Con ^ las cantidades se pueden negar. Los metacaracteres son instrucciones para el software de procesamiento. Los caracteres regulares pueden estar delante o detrás de los metacaracteres, su significado formal será diferente. La mayoría de las implementaciones trabajan con un motor especial de regex que analiza e interpreta las expresiones regulares listadas y verifica los recursos por instancias.
[] () {} | ? + - * ^ $ \
Con una barra invertida colocada antes, se puede cancelar un metacaracter.
Los siguientes métodos pueden implementarse con expresiones regulares:
Regex puede ser muy útil para algunos trabajos en el área de la optimización de motores de búsqueda[4] . Las herramientas de seguimiento y análisis como Google Analytics tienen una aplicación para regex.[5]
En Google Analytics, las expresiones regulares sirven para establecer filtros para las direcciones IP. Los filtros individuales se pueden definir en la configuración del perfil excluyendo las direcciones IP de uno o más visitantes. Por lo tanto, el tráfico de un rango de direcciones IP no se incluirá en los informes. Esto es útil si desea excluir visitas irrelevantes de las estadísticas de visitas, como sus propios empleados.
También se pueden procesar diferentes segmentos en Google Analytics utilizando regex. Por ejemplo, se pueden excluir las búsquedas que contengan un nombre de marca. Para este propósito, se definiría un segmento, que incluye sólo tráfico orgánico y no el nombre de marca que ha sido definido de antemano usando regex: “[mm] ejemplo de compañía” para deletreos con letras mayúsculas y minúsculas. También se pueden excluir diferentes tipos de palabras clave para averiguar cuánto tráfico se genera con dos o tres palabras clave específicas. Lo mismo se aplica al tráfico de otras fuentes como boletines de noticias, correos electrónicos y asociaciones de enlaces de sitios web externos.
Una táctica similar puede ser útil para el monitoreo de los canales de los medios sociales. Una fuente se definiría en este caso especificando las posibles fuentes con la expresión regular. Por ejemplo, “facebook|twitter|youtube|LinkedIn.” Google Analytics no es lo único que ofrece una serie de opciones que pueden ser explotadas con expresiones regulares[6]. Los weblogs y los entornos de servidor también pueden interpretar y procesar regex. Así, los sitios web pueden ser redirigidos y etiquetados como canónicos a través de ciertos patrones que son descritos por regex.[7]
Referencias
Breadcrumb es una navegación secundaria dentro de una web (también llamada navegación de miga de…
Google Mobile hace referencia a todos los productos y servicios ofrecidos por Google Inc. con…
El término valor añadido (added value en inglés), tiene su origen en la administración de…
RankBrain es un nuevo subsistema de algoritmos que Google utiliza en la entrega de resultados…
El término ad exchange (intercambio de anuncios) se refiere a los mercados online, en los…
Esta web usa cookies.