Hallo Sebastian,
On Thu, 07 Jan 2010 22:28:10 +0100
Sebastian Suchanek <sebastian.suchanek@gmx.de> wrote:
> Hallo Liste!
>
> Haben wir zufällig (Shell|AWK|...)-Skript-Götter unter uns? :-)
> Ich hätte da folgende Problemstellung: Gegeben sei eine Textdatei, in
> der zigfach der Teilstring "[img]$URL[/img]" (statt "$URL" steht da
> natürlich eine "richtige" URL...) vorkommt. Das Vorkommen kann keinmal,
> einmal oder evtl. auch mehrfach pro Zeile sein.
grep -o '\[img\][^\[]*\[/img\]' QUELLDATEI | \
sed -e 's#\[img\]##' -e 's#\[/img\]##' | \
sort -u
Die sed-Zeile ist noch stark verbesserungswürdig.
>
> Was ich haben möchte, sind alle URLs, am liebsten in einer zweiten
> Textdatei, mit einer URL pro Zeile. Mehrfachnennungen ein- und derselben
> URL wäre nicht dramatisch. Auch das Mehrfachvorkommen pro Zeile in der
> Ursprungsdatei ist extrem unwahrscheinlich, müsste also nicht unbedingt
> berücksichtigt werden. (Wäre nur schön, wenn.)
>
> Also: Wer hat konkrete Lösungsvorschläge, wie man das am besten löst? :-)
Viele Wege führen nach Rom ;-)
Joerg
Received on Fri Jan 8 09:06:21 2010