real time web analytics

Comando Uniq de Linux

Una aplicación de texto de Linux llamada Uniq busca las líneas duplicadas en un archivo. En términos más simples, uniq es una herramienta que ayuda a identificar y eliminar todas las líneas duplicadas de un archivo. El comando uniq nos da acceso a varios indicadores distintos, incluidos “-c”, “-u”, “-d”, “-D” y “-i”, entre otros, para realizar varias operaciones. Al emplear estas opciones de comando uniq, podemos mostrar la cantidad de palabras en cualquier línea, imprimir solo las líneas que se repiten o mostrar el contenido único del archivo. Hablaremos sobre algunas de las banderas de comando uniq en este artículo.

Ejemplo: utilizar el comando Uniq de Linux

En este ejemplo, usamos el comando “uniq” del sistema operativo Linux. Este comando se utiliza para condensar o resumir la información. El comando “Uniq” se utiliza para localizar las líneas repetitivas que se suceden. Comencemos con la ejecución del comando uniq. Sin embargo, antes de hacerlo en la terminal, primero debemos crear un archivo de texto. Dado que el archivo de texto ya existe en nuestro escritorio, lo usaremos. El “Archivo de texto.txt” es el nombre del archivo que ya está en nuestro escritorio. La extensión del archivo de texto debe ser “.txt”.

El comando “cat”, que se usa a menudo en Linux, se usa para abrir este archivo de texto en la terminal que contiene algunos datos. Se extraen los datos del archivo y se envía su contenido. Facilita la fusión, lectura y creación de archivos. Por lo tanto, escribimos primero “cat”, seguido del nombre del archivo que es “textfile.txt”.

omar@omar-VirtualBox:~/Desktop$ gato archivo de texto.txt

Ahora, como puede ver, cuando ejecutamos este comando, los datos del archivo existente actualmente en el archivo de texto llamado “textfile.txt” se muestran en la ventana de la terminal. Este archivo tiene nueve líneas. Los dos primeros son idénticos y llevan la información “A Alex le gusta programar con varias tecnologías”. La siguiente línea está vacía, y las líneas cuarta y quinta incluyen la misma información, incluido “Me interesa trabajar con lenguajes de secuencias de comandos”. Las últimas dos líneas tienen dos líneas separadas que son “Algunos de los lenguajes de programación son “java”, “oop”, “php”, “c++”, “python”, etc. y “El lenguaje utilizado para crear programas de computadora se llama un lenguaje de programación.” Ahora bien, es evidente que las dos primeras líneas son idénticas y repetidas, como las dos siguientes. Si bien las dos últimas líneas tienen un contenido diferente, usamos el comando “uniq” para eliminar las líneas duplicadas del archivo.

A Alex le gusta programar con varias tecnologías.

A Alex le gusta programar con varias tecnologías.
Me interesa trabajar con lenguajes de scripting.
Me interesa trabajar con lenguajes de scripting.
Algunos de los lenguajes de programación son Javavaya, php, c++pitón, etc
El lenguaje utilizado para crear programas de computadora se llama lenguaje de programación.

Ahora, usemos el comando uniq para eliminar la línea duplicada del archivo. Para hacer esto, ejecute el siguiente comando en la terminal. Luego, ingrese la palabra clave “uniq” seguida del nombre del archivo “textfile.txt”.

omar@omar-VirtualBox:~/Desktop$ único archivo de texto.txt

Como se ve a continuación, cuando ejecutamos este comando, no muestra las líneas duplicadas en la salida de la ventana del terminal. Hay nueve líneas en el archivo original. Pero después de aplicar el comando uniq, solo hay seis. Esto se debe a que la primera línea, “A Alex le gusta programar con varias tecnologías”, aparece dos veces en el archivo original, pero solo una vez después de aplicar el comando uniq. La segunda línea aparece dos veces en el archivo original pero solo una vez después de aplicar el comando uniq. Las dos últimas líneas se presentan exactamente como están porque no se repiten en el archivo.

A Alex le gusta programar con varias tecnologías.
Me interesa trabajar con lenguajes de scripting.
Algunos de los lenguajes de programación son Javavaya, php, c++pitón, etc.
El lenguaje utilizado para crear programas de computadora se llama lenguaje de programación.

Uso de las opciones del comando Uniq

El comando uniq nos brinda algunas opciones diferentes como “-c”, “-d”, “-u”, etc. para llevar a cabo las diversas tareas. Podemos contar el número de líneas repetidas que están contenidas en los archivos usando las opciones del comando uniq. Solo podemos mostrar las líneas repetidas de los archivos en la salida, etc. Utilicemos algunas de las siguientes banderas del comando uniq:

Contando el Número de Líneas con la Bandera “-C”

El número de líneas en el archivo se cuenta usando el indicador “-c” de la función uniq. Cuenta las líneas repetidas así como las líneas individuales y muestra la aparición de cada línea mostrando un número como prefijo con la línea. Para lograr esto, usamos el comando en el que primero ingresamos la palabra “uniq”, luego la opción “-c”, y luego el nombre del archivo, “textfile.txt”.

omar@omar-VirtualBox:~/Desktop$ único -C archivo de texto.txt

La salida de este comando muestra la repetición de líneas mostrando el número como su prefijo. Por ejemplo, la línea “A Alex le gusta programar con varias tecnologías” aparece dos veces en el archivo. Entonces, el número “2” se muestra delante de él. De manera similar, la línea “Me interesa trabajar con lenguajes de secuencias de comandos” también aparece dos veces en el archivo. Las líneas restantes solo se usan una vez y se muestra “1” como prefijo.

2 A Alex le gusta programar con varias tecnologías.
1
2 Me interesa trabajar con lenguajes de scripting.
1
1 Algunos de los lenguajes de programación son Javavaya, php, c++pitón, etc.
1
1 El lenguaje utilizado para crear programas de computadora se llama lenguaje de programación.

Uso de la bandera “-D” para imprimir las líneas repetidas

En esta parte, las líneas repetidas en el archivo se muestran usando la opción “-d” del comando uniq. Para esto, usamos el comando en el que primero ingresamos la palabra “uniq”, luego la opción “-d”, y luego el nombre de archivo “textfile.txt”.

omar@omar-VirtualBox:~/Desktop$ único -d archivo de texto.txt

Solo las líneas que se repiten se presentan en la salida que sigue a la ejecución de este comando. Las otras líneas, que solo se usan una vez, no se muestran.

A Alex le gusta programar con varias tecnologías.
A Alex le gusta programar con varias tecnologías.
Me interesa trabajar con lenguajes de scripting.
Me interesa trabajar con lenguajes de scripting.

Uso de la bandera -U del comando Uniq

La opción “-u” del comando uniq ahora se usa para imprimir el contenido único del archivo directamente usando esta opción. Muestra las líneas o el contenido del archivo en la salida que solo se usa una vez. El texto repetido en el archivo no se muestra en la salida; se elimina Solo se usa el indicador “-u” en lugar de la siguiente opción. De lo contrario, el comando es el mismo que se usa en el ejemplo anterior.

omar@omar-VirtualBox:~/Desktop$ único –u archivo de texto.txt

Cuando ejecutamos este comando, la salida es la siguiente. Las líneas repetidas de los archivos se eliminan y se revela el contenido único del archivo. Esta salida incluye las dos líneas que se muestran en la siguiente demostración; ambas líneas se usan solo una vez en el archivo, por lo que aparecen.

Algunos de los lenguajes de programación son Javavaya, php, c++pitón, etc.
El lenguaje utilizado para crear programas de computadora se llama lenguaje de programación.

Conclusión

El comando Linux Uniq que se usa para eliminar el contenido duplicado de los archivos y solo lo muestra una vez en la salida usando la palabra clave “uniq” con el archivo de texto dado se trata en este artículo. En los ejemplos dados, usamos los indicadores de comando uniq que son “-c”, “-u” y “-d”. Estas banderas nos permitieron realizar las distintas operaciones con el comando uniq. En este artículo, demostramos repetidamente que una línea se repite anteponiendo un número a la línea. Además, examinamos cómo utilizar estos marcadores para imprimir solo las líneas repetidas y el contenido único.

Leave a Comment