<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:dc="http://purl.org/dc/elements/1.1/" version="2.0">
  <channel>
    <title>HTML parsen</title>
    <link>http://forum.geizhals.at/feed.jsp?id=598122</link>
    <description>Geizhals-Forum</description>
    <item>
      <title>Re(4): HTML parsen</title>
      <link>http://forum.geizhals.at/t598122,5069055.html#5069055</link>
      <description>Es kommen im relevanten Text keine HTML-Tags vor.&lt;br&gt;Die überflüssigen Whitespaces hab ich mit&lt;br&gt;&lt;br&gt;tr -s ' '&lt;br&gt;&lt;br&gt;entfernt. Danke für die Hilfe!&lt;br/&gt;</description>
      <pubDate>Fri, 10 Oct 2008 13:21:03 GMT</pubDate>
      <guid>http://forum.geizhals.at/t598122,5069055.html#5069055</guid>
      <dc:creator>grizzerl</dc:creator>
      <dc:date>2008-10-10T13:21:03Z</dc:date>
    </item>
    <item>
      <title>Re(3): HTML parsen</title>
      <link>http://forum.geizhals.at/t598122,5069021.html#5069021</link>
      <description>Mach einfach ein Leerzeichen noch vor dem /g am Ende.&amp;nbsp;&amp;nbsp;Es ist s/suchstring/ersetzstring/g (g heisst alle Vorkommnisse ersetzen, ohne g wird nur das erste).&lt;br&gt;&lt;br&gt;Du hast dann aber vermutlich viel zu viele Leerzeichen in deinem Text, für jedes Tag halt eines. Du kannst ja noch sein 's/ +/ /g' hinterherschicken um doppelte Leerzeichen durch einzelne Leerzeichen zu ersetzen.&lt;br/&gt;</description>
      <pubDate>Fri, 10 Oct 2008 13:12:26 GMT</pubDate>
      <guid>http://forum.geizhals.at/t598122,5069021.html#5069021</guid>
      <dc:creator>juwb</dc:creator>
      <dc:date>2008-10-10T13:12:26Z</dc:date>
    </item>
    <item>
      <title>Re(3): HTML parsen</title>
      <link>http://forum.geizhals.at/t598122,5069027.html#5069027</link>
      <description>Mach einfach ein Leerzeichen noch vor dem /g am Ende.&amp;nbsp;&amp;nbsp;Es ist s/suchstring/ersetzstring/g (g heisst alle Vorkommnisse ersetzen, ohne g wird nur das erste).&lt;br&gt;&lt;br&gt;Du hast dann aber vermutlich viel zu viele Leerzeichen in deinem Text, für jedes Tag halt eines. Du kannst ja noch sein 's/ +/ /g' hinterherschicken um doppelte Leerzeichen durch einzelne Leerzeichen zu ersetzen.&lt;br&gt;&lt;br&gt;Normal gehören die Leerzeichen da auch nicht rein, also wenn du z.B. nur einen T&lt;b&gt;ei&lt;/b&gt;l von einem W&lt;b&gt;or&lt;/b&gt;t mit irgendwlechen Tags hervorhebst dann hättest du später statt Teil oder Wort, eben T ei l oder W or t.&lt;br/&gt;</description>
      <pubDate>Fri, 10 Oct 2008 13:12:26 GMT</pubDate>
      <guid>http://forum.geizhals.at/t598122,5069027.html#5069027</guid>
      <dc:creator>juwb</dc:creator>
      <dc:date>2008-10-10T13:12:26Z</dc:date>
    </item>
    <item>
      <title>Re(2): HTML parsen</title>
      <link>http://forum.geizhals.at/t598122,5068972.html#5068972</link>
      <description>Perfekt! Genau so. Danke!&lt;br&gt;&lt;br&gt;Jetzt noch jedes entfernte HTML-Tag gegen ein Leerzeichen austauschen, please &lt;img src="smile.gif" width="16" height="19" align="absmiddle" alt=":)"/&gt;&lt;br/&gt;</description>
      <pubDate>Fri, 10 Oct 2008 12:56:29 GMT</pubDate>
      <guid>http://forum.geizhals.at/t598122,5068972.html#5068972</guid>
      <dc:creator>grizzerl</dc:creator>
      <dc:date>2008-10-10T12:56:29Z</dc:date>
    </item>
    <item>
      <title>Re: HTML parsen</title>
      <link>http://forum.geizhals.at/t598122,5068958.html#5068958</link>
      <description>Beispiel mit Eingabe und gewünschter Ausgabe?&lt;br&gt;&lt;br&gt;&lt;br&gt;&lt;pre&gt;$ echo '&lt;foo&gt;foo&lt;/foo&gt;&lt;bar&gt;bar&lt;/bar&gt;' | sed 's/&lt;[^&gt;]*&gt;//g'&lt;br&gt;foobar&lt;/pre&gt;&lt;br&gt;&lt;br/&gt;</description>
      <pubDate>Fri, 10 Oct 2008 12:51:37 GMT</pubDate>
      <guid>http://forum.geizhals.at/t598122,5068958.html#5068958</guid>
      <dc:creator>juwb</dc:creator>
      <dc:date>2008-10-10T12:51:37Z</dc:date>
    </item>
    <item>
      <title>Re: HTML parsen</title>
      <link>http://forum.geizhals.at/t598122,5068964.html#5068964</link>
      <description>Beispiel mit Eingabe und gewünschter Ausgabe?&lt;br&gt;&lt;br&gt;&lt;br&gt;&lt;pre&gt;$ echo '&lt;foo&gt;foo&lt;/foo&gt;&lt;bar&gt;bar&lt;/bar&gt;' | sed 's/&lt;[^&gt;]*&gt;//g'&lt;br&gt;foobar&lt;/pre&gt;&lt;br&gt;&lt;br/&gt;</description>
      <pubDate>Fri, 10 Oct 2008 12:51:37 GMT</pubDate>
      <guid>http://forum.geizhals.at/t598122,5068964.html#5068964</guid>
      <dc:creator>juwb</dc:creator>
      <dc:date>2008-10-10T12:51:37Z</dc:date>
    </item>
    <item>
      <title>HTML parsen</title>
      <link>http://forum.geizhals.at/t598122,5068938.html#5068938</link>
      <description>Mittel eines Scripts bekomm ich eine HTML-Seite aus einem HTTP POST.&lt;br&gt;&lt;br&gt;Die Information, die ich brauche steht in dieser 25kb HTML-Datei. Mittels grep hab ich schon alles bis auf die Zeile, in der meine Information drinsteht, heruntergebrochen.&lt;br&gt;Leider ist diese 425 Zeichen lange Zeile voll mit HTML-Tags; meine gewünschte Information ist nur rund 40 Zeichen lang.&lt;br&gt;&lt;br&gt;Wie krieg ich die HTML-Tags da raus. Ich will ja nur den Text haben.&lt;br&gt;Ich kämpfe schon seit 2 Stunden mit sed und awk, aber ich krieg das einfach nicht zamm.&lt;br&gt;&lt;br&gt;Hat wer einen Tipp für mich?&lt;br/&gt;</description>
      <pubDate>Fri, 10 Oct 2008 12:42:11 GMT</pubDate>
      <guid>http://forum.geizhals.at/t598122,5068938.html#5068938</guid>
      <dc:creator>grizzerl</dc:creator>
      <dc:date>2008-10-10T12:42:11Z</dc:date>
    </item>
  </channel>
</rss>
