Startseite LUG Untermain

Startseite
 
Über uns
Stammtisch
 
Über Linux
SW-Patente
Rezensionen
 
Mailingliste
Online-Mail-Archiv
 
LUG-IRC Channel
LUG-IRC Statistik-NEU-
 
Gästebuch
 
Arbeitsgruppen
Softwaredownloads
Vorträge
FAQ & Hints
HOWTOs
Doku-Wiki -NEU-
 
LUG-Kalender
Links
 
Blog
LUGUM-Planet


hosted by
logo

User-Bereich
(passwortgeschützt)
Passwort vergessen?
148 Mitglieder

Anmelden - HIER -






Re: Teilstrings aus Textdatei extrahieren?

Re: Teilstrings aus Textdatei extrahieren?

Autor: Jörg Schütter <joerg_at_schuetter.org>
Datum: Fr 08 Jan 2010 - 09:06:20 CET

Hallo Sebastian,

On Thu, 07 Jan 2010 22:28:10 +0100
Sebastian Suchanek <sebastian.suchanek@gmx.de> wrote:

> Hallo Liste!
>
> Haben wir zufällig (Shell|AWK|...)-Skript-Götter unter uns? :-)
> Ich hätte da folgende Problemstellung: Gegeben sei eine Textdatei, in
> der zigfach der Teilstring "[img]$URL[/img]" (statt "$URL" steht da
> natürlich eine "richtige" URL...) vorkommt. Das Vorkommen kann keinmal,
> einmal oder evtl. auch mehrfach pro Zeile sein.

grep -o '\[img\][^\[]*\[/img\]' QUELLDATEI | \
sed -e 's#\[img\]##' -e 's#\[/img\]##' | \
sort -u

Die sed-Zeile ist noch stark verbesserungswürdig.
>
> Was ich haben möchte, sind alle URLs, am liebsten in einer zweiten
> Textdatei, mit einer URL pro Zeile. Mehrfachnennungen ein- und derselben
> URL wäre nicht dramatisch. Auch das Mehrfachvorkommen pro Zeile in der
> Ursprungsdatei ist extrem unwahrscheinlich, müsste also nicht unbedingt
> berücksichtigt werden. (Wäre nur schön, wenn.)
>
> Also: Wer hat konkrete Lösungsvorschläge, wie man das am besten löst? :-)

Viele Wege führen nach Rom ;-)

Joerg
Received on Fri Jan 8 09:06:21 2010

Nächster Stammtisch
Sa 7.8.10
Ernst-Klug-Haus, Goldbach


Disclaimer
Impressum


News
- Brüsseler Datenbank-Bestandsaufnahme lobt Vorratsdatenspeicherung
 
- FBI soll leichter auf Nutzerspuren im Netz zugreifen dürfen
 
- Apps telefonieren nach Hause
 
- IETF will Standardisierung beschleunigen
 
- France Telecom meldet Umsatz- und Gewinnrückgang
 
- Software AG mit Umsatz- und Gewinnsprung
 
- Bundesnetzagentur greift gegen Telefonwerber durch
 
- Nintendo schreibt rote Zahlen
 
- Geldautomaten schlecht gesichert
 
- &quot;Mehr IPv4-Adressen, bitte!&quot;