Filtres de text: diferència entre les revisions

De WikiMar
Salta a la navegació Salta a la cerca
Cap resum de modificació
 
(Hi ha una revisió intermèdia del mateix usuari que no es mostren)
Línia 1: Línia 1:
A nice summary can be found at: http://lpi.aluzina.org/wiki/101_103-guion
A nice summary of commands to filter text using Pipes can be found at: http://lpi.aluzina.org/wiki/101_103-guion
 


Here a copy of one part of it:
Here a copy of one part of it:
Línia 23: Línia 24:


* sed: permet moltes opcions per filtrar. També buscar expressions regulars.
* sed: permet moltes opcions per filtrar. També buscar expressions regulars.
* '''sed'''. Editor de flujo, una expresión está formada por 4 campos:
** ''direccionamiento'': línea (3), conjunto de líneas: (2,5), intervalo (1~2), última ($), líneas que coincidan (/expr/)
** ''posible negación'': '''!'''
** ''comando'': borrar (b) o reemplazar (s/ / /)
** ''argumentos'': global (g), primera ocurrencia (1), imprime si sustituye (p)


* sort: ordena líneas.
* sort: ordena líneas.
Línia 39: Línia 33:
* uniq: quita líneas repetidas. Útil junto a "sort".
* uniq: quita líneas repetidas. Útil junto a "sort".
* wc: cuenta las palabras, líneas, bytes...
* wc: cuenta las palabras, líneas, bytes...
From another page: http://lpi.aluzina.org/wiki/Plantilla:1.103.2
== Procesar flujos de texto usando filtros ==
Comandos que '''deben''' saberse de memoria:
* '''cat / more / less / tac'''
* '''cut -b -c -d -f'''
* '''expand'''. Pasa tabuladores a espacios
* '''fmt -u -w'''. Pasa un archivo de texto a justificación completa
* '''head -c -l / tail'''.
* '''paste f1 f2'''. Concatena columnas
* '''join -j1 f1 f2'''. (hace el típico ''join'' de una base de datos)
* '''nl'''
* '''od -t A'''. El tipo puede ser: A (carácter), C (ascii), O (octal), x (hex).
** Más moderno es '''hexdump'''
* '''pr'''. Paginar
* '''uniq'''. Para controlar repeticiones
* '''sort'''. Ordenar
* '''split [-l lineas] [-b bytes] f1 f2'''
* '''tr a-z A-Z'''
* '''wc -c -w -l'''. -c (carácteres), -w (palabras), -l (líneas)
* '''xargs -n1 cmd'''
* '''sed'''. Editor de flujo, una expresión está formada por 4 campos:
** ''direccionamiento'': línea (3), conjunto de líneas: (2,5), intervalo (1~2), última ($), líneas que coincidan (/expr/)
** ''posible negación'': '''!'''
** ''comando'': borrar (b) o reemplazar (s/ / /)
** ''argumentos'': global (g), primera ocurrencia (1), imprime si sustituye (p)

Revisió de 14:24, 15 oct 2008

A nice summary of commands to filter text using Pipes can be found at: http://lpi.aluzina.org/wiki/101_103-guion


Here a copy of one part of it:

Process text streams using filters

  • Valor de retorno
  • Canales POSIX:
    • Entrada
    • Salida
    • Error
    • Ficheros, dispositivos, todo dispositivo abierto!
  • Parámetros
  • Para programadores: similitudes con return, standar output, open, dup, args....
  • cat
  • cut: elimina de las lineas de la entrada estándar los caracteres que le digamos.
  • expand: convierte tabuladores a espacios.
  • fmt: formatear párrafos (ancho, sangría, saltos de línea).
  • head: principio de un stream.
  • join: junta dos ficheros con campos de unión iguales.
  • nl: añade números de línea.
  • paste: convierte los ficheros de entrada en un solo fichero donde los ficheros ocupan una columna.
  • pr: formatea para imprimir un texto.
  • sed: permet moltes opcions per filtrar. També buscar expressions regulars.
  • sort: ordena líneas.
  • split: parte un fichero cada X líneas.
  • tac: como cat pero revierte las líneas.
  • tail: como head pero por la cola.
  • tr: convierte/elimina caracteres de un tipo especificado.
  • unexpand: contrario que expand.
  • uniq: quita líneas repetidas. Útil junto a "sort".
  • wc: cuenta las palabras, líneas, bytes...


From another page: http://lpi.aluzina.org/wiki/Plantilla:1.103.2


Procesar flujos de texto usando filtros

Comandos que deben saberse de memoria:

  • cat / more / less / tac
  • cut -b -c -d -f
  • expand. Pasa tabuladores a espacios
  • fmt -u -w. Pasa un archivo de texto a justificación completa
  • head -c -l / tail.
  • paste f1 f2. Concatena columnas
  • join -j1 f1 f2. (hace el típico join de una base de datos)
  • nl
  • od -t A. El tipo puede ser: A (carácter), C (ascii), O (octal), x (hex).
    • Más moderno es hexdump
  • pr. Paginar
  • uniq. Para controlar repeticiones
  • sort. Ordenar
  • split [-l lineas] [-b bytes] f1 f2
  • tr a-z A-Z
  • wc -c -w -l. -c (carácteres), -w (palabras), -l (líneas)
  • xargs -n1 cmd
  • sed. Editor de flujo, una expresión está formada por 4 campos:
    • direccionamiento: línea (3), conjunto de líneas: (2,5), intervalo (1~2), última ($), líneas que coincidan (/expr/)
    • posible negación: !
    • comando: borrar (b) o reemplazar (s/ / /)
    • argumentos: global (g), primera ocurrencia (1), imprime si sustituye (p)