<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:dc="http://purl.org/dc/elements/1.1/" version="2.0">
  <channel>
    <title>Womit zwei Elemente aus Webseite auslesen?</title>
    <link>http://forum.geizhals.at/feed.jsp?id=808141</link>
    <description>Geizhals-Forum</description>
    <item>
      <title>Re(2): Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6941261.html#6941261</link>
      <description>also wenn das wie versprochen geht, dann voll super.&lt;br/&gt;</description>
      <pubDate>Mon, 12 Nov 2012 21:33:36 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6941261.html#6941261</guid>
      <dc:creator>j.</dc:creator>
      <dc:date>2012-11-12T21:33:36Z</dc:date>
    </item>
    <item>
      <title>Re(3): XPath - Basis</title>
      <link>http://forum.geizhals.at/t808141,6932625.html#6932625</link>
      <description>Ich komm eher aus der JAVA-Welt und da kenne ich keinen gängigen XML-Parser der nicht valides XML parsed. (Das von dir oben verlinkte libxml für C kannte ich nicht) Bei einem SAX-Parser kann ich mir das noch vorstellen. Bei einem DOM-Modell stell ich mir das halt spannend vor.&lt;br&gt;&lt;br&gt;zB&lt;blockquote&gt;&lt;em&gt; ....&lt;br&gt;&lt;span&gt;....&lt;/span&gt;&lt;br&gt;&lt;p/&gt;&lt;br&gt;&lt;span&gt;....&lt;/span&gt;&lt;br&gt;&lt;p/&gt;&lt;br&gt;&lt;span&gt;....&lt;/span&gt;&lt;br&gt;...&lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;&lt;br&gt;Ist jetzt das 2. "p" ein Child-Element vom 1. od nicht, usw.&lt;br/&gt;</description>
      <pubDate>Wed, 31 Oct 2012 14:16:32 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6932625.html#6932625</guid>
      <dc:creator>dss</dc:creator>
      <dc:date>2012-10-31T14:16:32Z</dc:date>
    </item>
    <item>
      <title>Re(3): XPath - Basis</title>
      <link>http://forum.geizhals.at/t808141,6932623.html#6932623</link>
      <description>Ich komm eher aus der JAVA-Welt und da kenne ich keinen gängigen XML-Parser der nicht valides XML parsed. (Das von dir oben verlinkte libxml für C kannte ich nicht) Bei einem SAX-Parser kann ich mir das noch vorstellen. Bei einem DOM-Modell stell ich mir das halt spannend vor.&lt;br&gt;&lt;br&gt;zB&lt;blockquote&gt;&lt;em&gt; ....&lt;br&gt;&lt;div&gt;....&lt;/div&gt;&lt;br&gt;&lt;p/&gt;&lt;br&gt;...&lt;br&gt;&lt;p/&gt;&lt;br&gt;...&lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;&lt;br&gt;Ist jetzt das 2. "p" ein Child-Element vom 1. od nicht, usw.&lt;br/&gt;</description>
      <pubDate>Wed, 31 Oct 2012 14:16:32 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6932623.html#6932623</guid>
      <dc:creator>dss</dc:creator>
      <dc:date>2012-10-31T14:16:32Z</dc:date>
    </item>
    <item>
      <title>Re(3): XPath - Basis</title>
      <link>http://forum.geizhals.at/t808141,6932624.html#6932624</link>
      <description>Ich komm eher aus der JAVA-Welt und da kenne ich keinen gängigen XML-Parser der nicht valides XML parsed. (Das von dir oben verlinkte libxml für C kannte ich nicht) Bei einem SAX-Parser kann ich mir das noch vorstellen. Bei einem DOM-Modell stell ich mir das halt spannend vor.&lt;br&gt;&lt;br&gt;zB&lt;blockquote&gt;&lt;em&gt; ....&lt;br&gt;&lt;div&gt;....&lt;/div&gt;&lt;br&gt;&lt;p/&gt;&lt;br&gt;...&lt;br&gt;&lt;p/&gt;&lt;br&gt;...&lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;&lt;br&gt;Ist jetzt das 2. "p" ein Child-Element vom 1. od nicht, usw.&lt;br/&gt;</description>
      <pubDate>Wed, 31 Oct 2012 14:16:32 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6932624.html#6932624</guid>
      <dc:creator>dss</dc:creator>
      <dc:date>2012-10-31T14:16:32Z</dc:date>
    </item>
    <item>
      <title>Re(5): XPath - Basis</title>
      <link>http://forum.geizhals.at/t808141,6931979.html#6931979</link>
      <description>&lt;blockquote&gt;&lt;em&gt; einen Versuch ist es wert - ich bild mir ein, auch von XML-Parsern mit einer&lt;br&gt;gewissen HTML-Toleranz gelesen zu haben.&lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;&lt;br&gt;Richtig. zB. Libxml:&lt;br&gt;&lt;br&gt;&lt;a href="http://www.xmlsoft.org/" rel="noopener" target="_blank"&gt;http:/&lt;wbr/&gt;/&lt;wbr/&gt;www.xmlsoft.org/&lt;wbr/&gt;&lt;/a&gt; &lt;br/&gt;</description>
      <pubDate>Tue, 30 Oct 2012 17:44:03 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6931979.html#6931979</guid>
      <dc:creator>hellbringer</dc:creator>
      <dc:date>2012-10-30T17:44:03Z</dc:date>
    </item>
    <item>
      <title>Re(2): XPath - Basis</title>
      <link>http://forum.geizhals.at/t808141,6931977.html#6931977</link>
      <description>&lt;blockquote&gt;&lt;em&gt; &lt;br&gt;				XPath hat halt den Nachteil dass es nur bei XML-konformen XHTML&lt;br&gt;funktioniert. &lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;&lt;br&gt;Jetzt vermischt du aber XML-Parser mit XPath. Wenn der XML-Parser auch invaliden Code akzeptiert, dann kann auch hier XPath angewendet werden.&lt;br/&gt;</description>
      <pubDate>Tue, 30 Oct 2012 17:39:55 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6931977.html#6931977</guid>
      <dc:creator>hellbringer</dc:creator>
      <dc:date>2012-10-30T17:39:55Z</dc:date>
    </item>
    <item>
      <title>Re(4): XPath - Basis</title>
      <link>http://forum.geizhals.at/t808141,6931952.html#6931952</link>
      <description>&lt;blockquote&gt;&lt;em&gt; &lt;br&gt;				Naja. Ein schön strukturiertes HTML muss noch lange nicht valides XML&lt;br&gt;sein.  Gerade wenn ich fremden HTML-Code parse würde ich jetzt nicht davon&lt;br&gt;ausgehen.&amp;nbsp;&amp;nbsp;&lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;einen Versuch ist es wert - ich bild mir ein, auch von XML-Parsern mit einer gewissen HTML-Toleranz gelesen zu haben.&lt;br/&gt;</description>
      <pubDate>Tue, 30 Oct 2012 16:32:08 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6931952.html#6931952</guid>
      <dc:creator>user86060</dc:creator>
      <dc:date>2012-10-30T16:32:08Z</dc:date>
    </item>
    <item>
      <title>Re(3): XPath - Basis</title>
      <link>http://forum.geizhals.at/t808141,6931951.html#6931951</link>
      <description>Naja. Ein schön strukturiertes HTML muss noch lange nicht valides XML sein.&amp;nbsp;&amp;nbsp;Gerade wenn ich fremden HTML-Code parse würde ich jetzt nicht davon ausgehen.&lt;br/&gt;</description>
      <pubDate>Tue, 30 Oct 2012 16:29:52 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6931951.html#6931951</guid>
      <dc:creator>dss</dc:creator>
      <dc:date>2012-10-30T16:29:52Z</dc:date>
    </item>
    <item>
      <title>Re(2): XPath - Basis</title>
      <link>http://forum.geizhals.at/t808141,6931947.html#6931947</link>
      <description>&lt;blockquote&gt;&lt;em&gt; &lt;br&gt;				XPath hat halt den Nachteil dass es nur bei XML-konformen XHTML&lt;br&gt;funktioniert.&amp;nbsp;&amp;nbsp; &lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;sicher - hatte ich oben schon geschrieben.&lt;br&gt;&lt;br&gt;Aber man will doch hoffen, daß, wenn man schon Code mit Attributen wie "class=" u.ä. vor sich hat, der als ganzes "valid" ist - sonst würde sich der damals eh schon zu späte Normierungsdrang in dem Bereich ad absurdum führen.&lt;br/&gt;</description>
      <pubDate>Tue, 30 Oct 2012 16:16:40 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6931947.html#6931947</guid>
      <dc:creator>user86060</dc:creator>
      <dc:date>2012-10-30T16:16:40Z</dc:date>
    </item>
    <item>
      <title>Re: XPath - Basis</title>
      <link>http://forum.geizhals.at/t808141,6931943.html#6931943</link>
      <description>XPath hat halt den Nachteil dass es nur bei XML-konformen XHTML funktioniert. &lt;br/&gt;</description>
      <pubDate>Tue, 30 Oct 2012 16:11:31 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6931943.html#6931943</guid>
      <dc:creator>dss</dc:creator>
      <dc:date>2012-10-30T16:11:31Z</dc:date>
    </item>
    <item>
      <title>Re: Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6929970.html#6929970</link>
      <description>Ganz ohne Programmierkenntnisse gehen so einfache Sachen eigentlich mit Yahoo Pipes:&lt;br&gt;&lt;br&gt;&lt;a href="http://pipes.yahoo.com/" rel="noopener" target="_blank"&gt;http:/&lt;wbr/&gt;/&lt;wbr/&gt;pipes.yahoo.com/&lt;wbr/&gt;&lt;/a&gt; &lt;br&gt;&lt;br&gt;Für PHP gibt es auch diverse Libraries mit der gängigen CSS-Selektor-Syntax um solche HTML-Sachen auszulesen:&lt;br&gt;&lt;br&gt;&lt;a href="http://code.google.com/p/phpquery/" rel="noopener" target="_blank"&gt;http:/&lt;wbr/&gt;/&lt;wbr/&gt;code.google.com/&lt;wbr/&gt;p/&lt;wbr/&gt;phpquery/&lt;wbr/&gt;&lt;/a&gt; &lt;br&gt;&lt;br&gt;&lt;a href="http://simplehtmldom.sourceforge.net/" rel="noopener" target="_blank"&gt;http:/&lt;wbr/&gt;/&lt;wbr/&gt;simplehtmldom.sourceforge.net/&lt;wbr/&gt;&lt;/a&gt; &lt;br&gt;&lt;br&gt;&lt;a href="http://querypath.org/" rel="noopener" target="_blank"&gt;http:/&lt;wbr/&gt;/&lt;wbr/&gt;querypath.org/&lt;wbr/&gt;&lt;/a&gt; &lt;br&gt;&lt;br&gt;&lt;a href="http://pqlite.com/" rel="noopener" target="_blank"&gt;http:/&lt;wbr/&gt;/&lt;wbr/&gt;pqlite.com/&lt;wbr/&gt;&lt;/a&gt; &lt;br&gt;&lt;br&gt;&lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 20:56:18 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929970.html#6929970</guid>
      <dc:creator>mjy@geizhals.at</dc:creator>
      <dc:date>2012-10-27T20:56:18Z</dc:date>
    </item>
    <item>
      <title>Re: Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6929874.html#6929874</link>
      <description>Such dir was aus:&lt;br&gt;bash, php, etc.&lt;br&gt;&lt;br&gt;&lt;br&gt;Ich persönlich würde bash sagen ...&lt;br&gt;Solte sinch in 10-20 Zeilen ausgehen.&lt;br&gt;&lt;br&gt;Bitte keine Meldungen, dass es in einer Zeile auch möglich ist ... wir wollen ja eine Übersicht behalten *gG*&lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 17:40:49 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929874.html#6929874</guid>
      <dc:creator>ZombyKillah</dc:creator>
      <dc:date>2012-10-27T17:40:49Z</dc:date>
    </item>
    <item>
      <title>Re(11): Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6929846.html#6929846</link>
      <description>&lt;blockquote&gt;&lt;em&gt; &lt;br&gt;Ich könnte dir ein Beispiel geben, wo du mit Regex deutlich mehr zu tun hast&lt;br&gt;als mit XPath. Die Frage ist halt ob du gewillt bist dieses zu lösen&lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;der Knackpunkt ist wohl: wer beides einigermassen beherrscht, würde nie auf die Idee kommen, das regexp/glob-patterns oder ähnliches für xml/html zu benutzen (es sei denn, er hätte xpath partout nicht zur Verfügung)&lt;br&gt;&lt;br&gt;Natürlich kann man alles mit regexp/flex erschlagen, aber jeder, der die ernsthaft benutzt hat, weiß, wie fehlerhaft die Patterns da sein können und wie schwierig das Debuggen.&lt;br&gt;Da ist die Abstraktion durch die Grundstruktur von XML eine große Sorge weniger.&lt;br&gt; &lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 16:39:40 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929846.html#6929846</guid>
      <dc:creator>user86060</dc:creator>
      <dc:date>2012-10-27T16:39:40Z</dc:date>
    </item>
    <item>
      <title>Re(10): Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6929836.html#6929836</link>
      <description>&lt;blockquote&gt;&lt;em&gt; Seit wann gibt es beim Programmieren nur einen richtigen Weg?&lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;&lt;br&gt;Nur weil es mehrere richtige gibt, ist der falsche nicht auch gleich richtig &lt;img src="smile.gif" width="16" height="19" align="absmiddle" alt=":)"/&gt;&lt;br&gt;&lt;br&gt;&lt;blockquote&gt;&lt;em&gt; Es ging um ein Beispiel von vielen. &lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;&lt;br&gt;Ich könnte dir ein Beispiel geben, wo du mit Regex deutlich mehr zu tun hast als mit XPath. Die Frage ist halt ob du gewillt bist dieses zu lösen &lt;img src="smile.gif" width="16" height="19" align="absmiddle" alt=":)"/&gt;&lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 16:34:33 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929836.html#6929836</guid>
      <dc:creator>hellbringer</dc:creator>
      <dc:date>2012-10-27T16:34:33Z</dc:date>
    </item>
    <item>
      <title>Re(10): Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6929829.html#6929829</link>
      <description>Das ist es. Anscheinend braucht er etwas das schnell und einfach funktioniert.&lt;br&gt;&lt;br&gt;Tjo, bei 1600 Webseiten geh ich eben damit durch, das geht auch schnell, Entwicklungsaufwand (kommt drauf an wo die 1600 Webseiten stehen) um die 5-7 Minuten.&lt;br&gt;&lt;br&gt;&lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 16:25:09 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929829.html#6929829</guid>
      <dc:creator>dizo</dc:creator>
      <dc:date>2012-10-27T16:25:09Z</dc:date>
    </item>
    <item>
      <title>Re(9): Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6929827.html#6929827</link>
      <description>&lt;blockquote&gt;&lt;em&gt; Nur weil man etwas oft falsch macht, wird es nicht richtiger &lt;img src="smile.gif" width="16" height="19" align="absmiddle" alt=":)"/&gt;&lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;&lt;br&gt;Seit wann gibt es beim Programmieren nur einen richtigen Weg?&lt;br&gt;&lt;br&gt;&lt;br&gt;&lt;blockquote&gt;&lt;em&gt; Bin nur am Handy online - aber in etwa so:&lt;br&gt;&lt;br&gt;&lt;a href="http://stackoverflow.com/questions/3602251/php-regex-find-text-between-custom-added-html-tags" rel="noopener" target="_blank"&gt;http:/&lt;wbr/&gt;/&lt;wbr/&gt;stackoverflow.com/&lt;wbr/&gt;questions/&lt;wbr/&gt;3602251/&lt;wbr/&gt;php-regex-find-text-between-custom-added-html-tags&lt;/a&gt; &lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;&lt;br&gt;Es ging um ein Beispiel von vielen. &lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 16:22:17 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929827.html#6929827</guid>
      <dc:creator>dizo</dc:creator>
      <dc:date>2012-10-27T16:22:17Z</dc:date>
    </item>
    <item>
      <title>Re(9): Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6929787.html#6929787</link>
      <description>&lt;blockquote&gt;&lt;em&gt; Nur weil man etwas oft falsch macht, wird es nicht richtiger &lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;&lt;br&gt;&lt;img src="teeth.gif" width="16" height="19" align="absmiddle" alt="|-D"/&gt;&lt;img src="teeth.gif" width="16" height="19" align="absmiddle" alt="|-D"/&gt;&lt;img src="teeth.gif" width="16" height="19" align="absmiddle" alt="|-D"/&gt;&lt;br&gt;&lt;br&gt;Ist halt leider oft so: Wenn man nur einen Hammer hat, schaut alles aus wie ein Nagel.&lt;br&gt;&lt;br&gt;Für hie + da was zusammenbasteln ... was soll's ... für wiederholte + wartbare Tätigkeiten und Ergebnisse muß man eben ein passendes Werkzeug suchen + erlernen, oder im schlimmsten Fall selbst eine passende domain specific language + Parser erstellen. Spätestens dort trennt sich bei Programmierern die Spreu vom Weizen.&lt;br&gt; &lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 14:28:42 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929787.html#6929787</guid>
      <dc:creator>user86060</dc:creator>
      <dc:date>2012-10-27T14:28:42Z</dc:date>
    </item>
    <item>
      <title>XPath - Basis</title>
      <link>http://forum.geizhals.at/t808141,6929782.html#6929782</link>
      <description>hat etwas gedauert ... mein firebug spinnt ... &lt;br&gt;ausgehend von einer leicht korrigierten .xml-Datei + dem gängigen Perl-Commandline-xpath-Tool:&lt;br&gt; &lt;br&gt;&lt;blockquote&gt;&lt;br&gt;&lt;ul class="list"&gt;&lt;br&gt;&lt;li&gt;&lt;br&gt;	&lt;div class="price"&gt;55,33&lt;/div&gt;&lt;br&gt;&lt;/li&gt;&lt;br&gt;&lt;li&gt;&lt;br&gt;	&lt;div id="title" class="intro "&gt;&lt;br&gt;	bla&lt;br&gt;	&lt;/div&gt;&lt;br&gt;	&lt;div class="left"&gt;&lt;br&gt;		&lt;h1&gt;Mein Titel&lt;/h1&gt;&lt;br&gt;		&lt;h2&gt;anderes Zeugs&lt;/h2&gt;&lt;br&gt;	&lt;/div&gt;&lt;br&gt;&lt;/li&gt;&lt;br&gt;&lt;/ul&gt;&lt;br&gt;&lt;/blockquote&gt;&lt;br&gt;&lt;br&gt;&lt;pre&gt;&lt;br&gt;xpath test.xml "//div[@class=\"price\"]" &lt;br&gt;&lt;br&gt;xpath test.xml "//div[@id=\"title\"]"&lt;br&gt;&lt;/pre&gt;&lt;br&gt;&lt;br&gt;liefern:&lt;br&gt;&lt;br&gt;&lt;pre&gt;&lt;br&gt;Found 1 nodes:&lt;br&gt;-- NODE --&lt;br&gt;&lt;div id="title" class="intro "&gt;&lt;br&gt;	bla&lt;br&gt;	&lt;/div&gt;&lt;br&gt;&lt;br&gt;---------&lt;br&gt;Found 1 nodes:&lt;br&gt;-- NODE --&lt;br&gt;&lt;div class="price"&gt;55,33&lt;/div&gt;&lt;br&gt;&lt;/pre&gt;&lt;br&gt;&lt;br&gt;anzupassen ist der Basis-Pfad der Verschachtelung, ev. nur per *&lt;br&gt;&lt;br&gt;um den Value zu bekommen:&amp;nbsp;&amp;nbsp;/text()&amp;nbsp;&amp;nbsp;(für den Zahlenwert müßt ich nachschauen)&lt;br&gt;&lt;br&gt;&lt;pre&gt;&lt;br&gt;//div[@class=\"price\"]/text()&lt;br&gt;&lt;br&gt;//div[@id=\"title\"]/text()&lt;br&gt;&lt;/pre&gt;&lt;br&gt;&lt;br&gt;-------&lt;br&gt;mehr dazu &lt;a href="http://www.w3schools.com/xpath/xpath_syntax.asp" rel="noopener" target="_blank"&gt;http:/&lt;wbr/&gt;/&lt;wbr/&gt;www.w3schools.com/&lt;wbr/&gt;xpath/&lt;wbr/&gt;xpath_syntax.asp&lt;/a&gt;&amp;nbsp;&amp;nbsp;und eben die Tutorials auf zvon.org&amp;nbsp;&amp;nbsp;&lt;br&gt;&lt;br&gt;hier ein Beispiel, wie man damit unter Unix + bash arbeiten kann: &lt;a href="http://www.ibm.com/developerworks/xml/library/x-tipclp/index.html" rel="noopener" target="_blank"&gt;http:/&lt;wbr/&gt;/&lt;wbr/&gt;www.ibm.com/&lt;wbr/&gt;developerworks/&lt;wbr/&gt;xml/&lt;wbr/&gt;library/&lt;wbr/&gt;x-tipclp/&lt;wbr/&gt;index.html&lt;/a&gt; &lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 14:24:02 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929782.html#6929782</guid>
      <dc:creator>user86060</dc:creator>
      <dc:date>2012-10-27T14:24:02Z</dc:date>
    </item>
    <item>
      <title>XPath - Basis</title>
      <link>http://forum.geizhals.at/t808141,6929783.html#6929783</link>
      <description>hat etwas gedauert ... mein firebug spinnt ... &lt;br&gt;ausgehend von einer leicht korrigierten .xml-Datei + dem gängigen Perl-Commandline-xpath-Tool:&lt;br&gt; &lt;br&gt;&lt;pre&gt;&lt;br&gt;&lt;ul class="list"&gt;&lt;br&gt;&lt;li&gt;&lt;br&gt;	&lt;div class="price"&gt;55,33&lt;/div&gt;&lt;br&gt;&lt;/li&gt;&lt;br&gt;&lt;li&gt;&lt;br&gt;	&lt;div id="title" class="intro "&gt;&lt;br&gt;	bla&lt;br&gt;	&lt;/div&gt;&lt;br&gt;	&lt;div class="left"&gt;&lt;br&gt;		&lt;h1&gt;Mein Titel&lt;/h1&gt;&lt;br&gt;		&lt;h2&gt;anderes Zeugs&lt;/h2&gt;&lt;br&gt;	&lt;/div&gt;&lt;br&gt;&lt;/li&gt;&lt;br&gt;&lt;/ul&gt;&lt;br&gt;&lt;/pre&gt;&lt;br&gt;&lt;br&gt;-----------&lt;br&gt;&lt;br&gt;&lt;pre&gt;&lt;br&gt;xpath test.xml "//div[@class=\"price\"]" &lt;br&gt;&lt;br&gt;xpath test.xml "//div[@id=\"title\"]"&lt;br&gt;&lt;/pre&gt;&lt;br&gt;&lt;br&gt;liefern:&lt;br&gt;&lt;br&gt;&lt;pre&gt;&lt;br&gt;Found 1 nodes:&lt;br&gt;-- NODE --&lt;br&gt;&lt;div id="title" class="intro "&gt;&lt;br&gt;	bla&lt;br&gt;	&lt;/div&gt;&lt;br&gt;&lt;br&gt;---------&lt;br&gt;Found 1 nodes:&lt;br&gt;-- NODE --&lt;br&gt;&lt;div class="price"&gt;55,33&lt;/div&gt;&lt;br&gt;&lt;/pre&gt;&lt;br&gt;&lt;br&gt;anzupassen ist der Basis-Pfad der Verschachtelung, ev. nur per *&lt;br&gt;&lt;br&gt;um den Value zu bekommen:&amp;nbsp;&amp;nbsp;/text()&amp;nbsp;&amp;nbsp;(für den Zahlenwert müßt ich nachschauen)&lt;br&gt;&lt;br&gt;&lt;pre&gt;&lt;br&gt;//div[@class=\"price\"]/text()&lt;br&gt;&lt;br&gt;//div[@id=\"title\"]/text()&lt;br&gt;&lt;/pre&gt;&lt;br&gt;&lt;br&gt;-------&lt;br&gt;mehr dazu &lt;a href="http://www.w3schools.com/xpath/xpath_syntax.asp" rel="noopener" target="_blank"&gt;http:/&lt;wbr/&gt;/&lt;wbr/&gt;www.w3schools.com/&lt;wbr/&gt;xpath/&lt;wbr/&gt;xpath_syntax.asp&lt;/a&gt;&amp;nbsp;&amp;nbsp;und eben die Tutorials auf zvon.org&amp;nbsp;&amp;nbsp;&lt;br&gt;&lt;br&gt;hier ein Beispiel, wie man damit unter Unix + bash arbeiten kann: &lt;a href="http://www.ibm.com/developerworks/xml/library/x-tipclp/index.html" rel="noopener" target="_blank"&gt;http:/&lt;wbr/&gt;/&lt;wbr/&gt;www.ibm.com/&lt;wbr/&gt;developerworks/&lt;wbr/&gt;xml/&lt;wbr/&gt;library/&lt;wbr/&gt;x-tipclp/&lt;wbr/&gt;index.html&lt;/a&gt; &lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 14:24:02 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929783.html#6929783</guid>
      <dc:creator>user86060</dc:creator>
      <dc:date>2012-10-27T14:24:02Z</dc:date>
    </item>
    <item>
      <title>XPath - Basis</title>
      <link>http://forum.geizhals.at/t808141,6929784.html#6929784</link>
      <description>hat etwas gedauert ... mein firebug spinnt ... &lt;br&gt;ausgehend von einer leicht korrigierten .xml-Datei + dem gängigen Perl-Commandline-xpath-Tool:&lt;br&gt; &lt;br&gt;&lt;pre&gt;&lt;br&gt;xpath test.xml "//div[@class=\"price\"]" &lt;br&gt;&lt;br&gt;xpath test.xml "//div[@id=\"title\"]"&lt;br&gt;&lt;/pre&gt;&lt;br&gt;&lt;br&gt;liefern:&lt;br&gt;&lt;br&gt;&lt;pre&gt;&lt;br&gt;Found 1 nodes:&lt;br&gt;-- NODE --&lt;br&gt;&lt;div id="title" class="intro "&gt;&lt;br&gt;	bla&lt;br&gt;	&lt;/div&gt;&lt;br&gt;&lt;br&gt;---------&lt;br&gt;Found 1 nodes:&lt;br&gt;-- NODE --&lt;br&gt;&lt;div class="price"&gt;55,33&lt;/div&gt;&lt;br&gt;&lt;/pre&gt;&lt;br&gt;&lt;br&gt;anzupassen ist der Basis-Pfad der Verschachtelung, ev. nur per *&lt;br&gt;&lt;br&gt;um den Value zu bekommen:&amp;nbsp;&amp;nbsp;/text()&amp;nbsp;&amp;nbsp;(für den Zahlenwert müßt ich nachschauen)&lt;br&gt;&lt;br&gt;&lt;pre&gt;&lt;br&gt;//div[@class=\"price\"]/text()&lt;br&gt;&lt;br&gt;//div[@id=\"title\"]/text()&lt;br&gt;&lt;/pre&gt;&lt;br&gt;&lt;br&gt;-------&lt;br&gt;mehr dazu &lt;a href="http://www.w3schools.com/xpath/xpath_syntax.asp" rel="noopener" target="_blank"&gt;http:/&lt;wbr/&gt;/&lt;wbr/&gt;www.w3schools.com/&lt;wbr/&gt;xpath/&lt;wbr/&gt;xpath_syntax.asp&lt;/a&gt;&amp;nbsp;&amp;nbsp;und eben die Tutorials auf zvon.org&amp;nbsp;&amp;nbsp;&lt;br&gt;&lt;br&gt;hier ein Beispiel, wie man damit unter Unix + bash arbeiten kann: &lt;a href="http://www.ibm.com/developerworks/xml/library/x-tipclp/index.html" rel="noopener" target="_blank"&gt;http:/&lt;wbr/&gt;/&lt;wbr/&gt;www.ibm.com/&lt;wbr/&gt;developerworks/&lt;wbr/&gt;xml/&lt;wbr/&gt;library/&lt;wbr/&gt;x-tipclp/&lt;wbr/&gt;index.html&lt;/a&gt; &lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 14:24:02 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929784.html#6929784</guid>
      <dc:creator>user86060</dc:creator>
      <dc:date>2012-10-27T14:24:02Z</dc:date>
    </item>
    <item>
      <title>Re(8): Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6929767.html#6929767</link>
      <description>&lt;blockquote&gt;&lt;em&gt;&amp;nbsp;&amp;nbsp;Doch, schon oft verwendet &lt;img src="zwinker.gif" width="16" height="19" align="absmiddle" alt=";)"/&gt; &lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;&lt;br&gt;Nur weil man etwas oft falsch macht, wird es nicht richtiger &lt;img src="smile.gif" width="16" height="19" align="absmiddle" alt=":)"/&gt;&lt;br&gt;&lt;br&gt;&lt;blockquote&gt;&lt;em&gt; Bin nur am Handy online - aber in etwa so:&lt;br&gt;&lt;br&gt;&lt;a href="http://stackoverflow.com/questions/3602251/php-regex-find-text-between-custom-added-html-tags" rel="noopener" target="_blank"&gt;http:/&lt;wbr/&gt;/&lt;wbr/&gt;stackoverflow.com/&lt;wbr/&gt;questions/&lt;wbr/&gt;3602251/&lt;wbr/&gt;php-regex-find-text-between-custom-added-html-tags&lt;/a&gt; &lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;&lt;br&gt;Das ist ein ganz spezieller Sonderfall und außerdem kein gültiger HTML-Code.&lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 13:36:25 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929767.html#6929767</guid>
      <dc:creator>hellbringer</dc:creator>
      <dc:date>2012-10-27T13:36:25Z</dc:date>
    </item>
    <item>
      <title>Re(7): Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6929763.html#6929763</link>
      <description>Doch, schon oft verwendet &lt;img src="zwinker.gif" width="16" height="19" align="absmiddle" alt=";)"/&gt; &lt;br&gt;&lt;br&gt;Bin nur am Handy online - aber in etwa so: &lt;br&gt;&lt;br&gt;&lt;a href="http://stackoverflow.com/questions/3602251/php-regex-find-text-between-custom-added-html-tags" rel="noopener" target="_blank"&gt;http:/&lt;wbr/&gt;/&lt;wbr/&gt;stackoverflow.com/&lt;wbr/&gt;questions/&lt;wbr/&gt;3602251/&lt;wbr/&gt;php-regex-find-text-between-custom-added-html-tags&lt;/a&gt; &lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 13:28:25 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929763.html#6929763</guid>
      <dc:creator>dizo</dc:creator>
      <dc:date>2012-10-27T13:28:25Z</dc:date>
    </item>
    <item>
      <title>Re(6): Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6929760.html#6929760</link>
      <description>&lt;blockquote&gt;&lt;em&gt;&amp;nbsp;&amp;nbsp;Warum? Ich suche nach dem String der genau zwischen der klasse und dem Ende&lt;br&gt;des Elementes liegt. &lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;&lt;br&gt;Einfach gesagt, aber nicht einfach gemacht.&lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 13:23:49 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929760.html#6929760</guid>
      <dc:creator>hellbringer</dc:creator>
      <dc:date>2012-10-27T13:23:49Z</dc:date>
    </item>
    <item>
      <title>Re(5): Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6929758.html#6929758</link>
      <description>Warum? Ich suche nach dem String der genau zwischen der klasse und dem Ende des Elementes liegt. &lt;br&gt;&lt;br&gt;Ist ein Aufwand von 3 Minuten &lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 13:20:25 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929758.html#6929758</guid>
      <dc:creator>dizo</dc:creator>
      <dc:date>2012-10-27T13:20:25Z</dc:date>
    </item>
    <item>
      <title>Re(9): Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6929753.html#6929753</link>
      <description>&lt;blockquote&gt;&lt;em&gt; Fragt sich, ob das überhaupt legal ist, was er vor hat. Am Ende leistet man&lt;br&gt;noch Beihilfe...&lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;ich hab nicht vor, auch noch paranoid zu werden, weil dann müsste man über kurz oder lang jedes technische Support-Forum schliessen.... &lt;img src="zwinker.gif" width="16" height="19" align="absmiddle" alt=";-)"/&gt;&lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 13:13:42 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929753.html#6929753</guid>
      <dc:creator>user86060</dc:creator>
      <dc:date>2012-10-27T13:13:42Z</dc:date>
    </item>
    <item>
      <title>Re(8): Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6929752.html#6929752</link>
      <description>&lt;blockquote&gt;&lt;em&gt; &lt;br&gt;				Ich suche eine Sprache, wo ich mir anhand von Codeschnipseln und Internet&lt;br&gt;Beispielen schnell was zusammen zimmern kann, und kein Lebensprojekt!&amp;nbsp;&amp;nbsp;&lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;gib mir eine Viertelstunde ...&lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 13:12:25 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929752.html#6929752</guid>
      <dc:creator>user86060</dc:creator>
      <dc:date>2012-10-27T13:12:25Z</dc:date>
    </item>
    <item>
      <title>Re(8): Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6929751.html#6929751</link>
      <description>&lt;blockquote&gt;&lt;em&gt; &lt;br&gt;				in diesem Fall könnte man es dabei belassen, ihm die 2 XQueries&lt;br&gt;zusammenzustellen und dann in einem Shell/cmd-Script zu kombinieren.Wenn dann&lt;br&gt;noch mehr damit gewurschtelt werden soll, kommt er um das Erlernen einer&lt;br&gt;Sprache eh nicht herum.&lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;&lt;br&gt;Fragt sich, ob das überhaupt legal ist, was er vor hat. Am Ende leistet man noch Beihilfe...&lt;br&gt;&lt;br&gt;Denn er könnte ja auch den Webseitenbetreiber fragen, ob er ihm die Rohdaten direkt zur Verfügung stellt, was deutlich einfacher wäre.&lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 13:10:51 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929751.html#6929751</guid>
      <dc:creator>hellbringer</dc:creator>
      <dc:date>2012-10-27T13:10:51Z</dc:date>
    </item>
    <item>
      <title>Re(8): Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6929750.html#6929750</link>
      <description>&lt;blockquote&gt;&lt;em&gt; &lt;br&gt;				in diesem Fall könnte man es dabei belassen, ihm die 2 XQueries&lt;br&gt;zusammenzustellen und dann in einem Shell/cmd-Script zu kombinieren.Wenn dann&lt;br&gt;noch mehr damit gewurschtelt werden soll, kommt er um das Erlernen einer&lt;br&gt;Sprache eh nicht herum.&lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;&lt;br&gt;Fragt sich, ob das überhaupt legal ist, was er vor hat. Am Ende leistet man noch Beihilfe...&lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 13:10:51 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929750.html#6929750</guid>
      <dc:creator>hellbringer</dc:creator>
      <dc:date>2012-10-27T13:10:51Z</dc:date>
    </item>
    <item>
      <title>Re(7): Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6929749.html#6929749</link>
      <description>Ich suche eine Sprache, wo ich mir anhand von Codeschnipseln und Internet Beispielen schnell was zusammen zimmern kann, und kein Lebensprojekt!&lt;br&gt;&lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 13:10:06 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929749.html#6929749</guid>
      <dc:creator>waltkers</dc:creator>
      <dc:date>2012-10-27T13:10:06Z</dc:date>
    </item>
    <item>
      <title>Re(7): Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6929746.html#6929746</link>
      <description>&lt;blockquote&gt;&lt;em&gt; Du willst also, dass dir jemand sagt, welche Sprache du lernen sollst?&lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;&lt;br&gt;in diesem Fall könnte man es dabei belassen, ihm die 2 XQueries zusammenzustellen und dann in einem Shell/cmd-Script zu kombinieren.&lt;br&gt;Wenn dann noch mehr damit gewurschtelt werden soll, kommt er um das Erlernen einer Sprache eh nicht herum.&lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 13:07:16 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929746.html#6929746</guid>
      <dc:creator>user86060</dc:creator>
      <dc:date>2012-10-27T13:07:16Z</dc:date>
    </item>
    <item>
      <title>Re(6): Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6929742.html#6929742</link>
      <description>&lt;blockquote&gt;&lt;em&gt; Ja toll, ich habe auch voll die Zeit mich jetzt nicht nur in eine, sondern&lt;br&gt;gleich mindestens zwei! neue Programmiersprachen einzuarbeiten, Programmier&lt;br&gt;Erfahrung darin zu sammeln und dann auch noch zu lernen wie die zwei Sprache&lt;br&gt;zusammen arbeiten könnten.&lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;1. ist XPath nur eine Syntax, keine Sprache (denn es passiert auf dieser Ebene nichts prozedurales, das wäre erst XSLT&lt;br&gt;&lt;br&gt;2. die Art und Weise wie Scriptsprachen dann mit XPath/DOM interagieren, ist idR sehr geradlinig und kaum komplexer, als SQL-Anbindungen.&lt;br&gt;&lt;br&gt;3. XPath / Xquery / DOM ist punkto Internet"programmierung" einfach Handwerkszeug und eh schon sauber abstrahiert - da gibt es (wenn wir schon bei Alternativen wie regexp/flex sind) ganz andere Levels von Komplexität, Stichwort LALR-Parser, kontextfreie Grammatiken, rückbezügliche Expressions (worin sich zB Perl von all seinen Vorgängern unterscheidet) &lt;br&gt;&lt;br&gt;also: wenn dir das genannte zu kompliziert ist, dann solltest du *gehässiger*modus*an* vielleicht besser die Finger von dem lassen, was du als Programmieren betrachtest&lt;br&gt;&lt;br&gt;Nichts für ungut.&lt;br&gt;&lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 13:01:52 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929742.html#6929742</guid>
      <dc:creator>user86060</dc:creator>
      <dc:date>2012-10-27T13:01:52Z</dc:date>
    </item>
    <item>
      <title>Re(6): Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6929741.html#6929741</link>
      <description>&lt;blockquote&gt;&lt;em&gt;&amp;nbsp;&amp;nbsp;JA XPath&amp;nbsp;&amp;nbsp;ist sehr bekannt, ich habe glaube ich erst gerade im Jahr 2001 das&lt;br&gt;letzte mal davon gehört, als ich mal was mit XML gemacht habe.&lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;&lt;br&gt;Was hat das eine mit dem anderen zu tun?&lt;br&gt;&lt;br&gt;&lt;blockquote&gt;&lt;em&gt; "jeder x-beliebigen Skriptsprache"&lt;br&gt;LOL, ich kann aber eigentlich noch keine einzige Skriptsprache, was glaubst&lt;br&gt;warum ich hier frage?&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;&lt;br&gt;Du willst also, dass dir jemand sagt, welche Sprache du lernen sollst?&lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 13:00:15 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929741.html#6929741</guid>
      <dc:creator>hellbringer</dc:creator>
      <dc:date>2012-10-27T13:00:15Z</dc:date>
    </item>
    <item>
      <title>Re(5): Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6929740.html#6929740</link>
      <description>JA XPath&amp;nbsp;&amp;nbsp;ist sehr bekannt, ich habe glaube ich erst gerade im Jahr 2001 das letzte mal davon gehört, als ich mal was mit XML gemacht habe.&lt;br&gt;&lt;br&gt;&lt;br&gt;"jeder x-beliebigen Skriptsprache" &lt;br&gt;LOL, ich kann aber eigentlich noch keine einzige Skriptsprache, was glaubst warum ich hier frage?&lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 12:57:47 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929740.html#6929740</guid>
      <dc:creator>waltkers</dc:creator>
      <dc:date>2012-10-27T12:57:47Z</dc:date>
    </item>
    <item>
      <title>Re(6): Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6929738.html#6929738</link>
      <description>Also du willst gar nicht wissen, wie es funktioniert, sondern suchst jemanden, der die Arbeit für dich erledigt?&lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 12:55:55 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929738.html#6929738</guid>
      <dc:creator>hellbringer</dc:creator>
      <dc:date>2012-10-27T12:55:55Z</dc:date>
    </item>
    <item>
      <title>Re(4): Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6929735.html#6929735</link>
      <description>&lt;blockquote&gt;&lt;em&gt; &lt;br&gt;				Warum ungeeignet? Geht genauso und ist Null Aufwand.&lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;&lt;br&gt;Es ist eben ein deutlich höherer Aufwand. Man muss zig zusätzliche Fälle berücksichtigen.&lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 12:54:57 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929735.html#6929735</guid>
      <dc:creator>hellbringer</dc:creator>
      <dc:date>2012-10-27T12:54:57Z</dc:date>
    </item>
    <item>
      <title>Re(5): Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6929732.html#6929732</link>
      <description>Ja toll, ich habe auch voll die Zeit mich jetzt nicht nur in eine, sondern gleich mindestens zwei! neue Programmiersprachen einzuarbeiten, Programmier Erfahrung darin zu sammeln und dann auch noch zu lernen wie die zwei Sprache zusammen arbeiten könnten.&lt;br&gt;&lt;br&gt;Ein Profi irgendeiner der großen Internet Skriptsprachen, könnte den Code in einer Sprache, und wahrscheinlich in ner Minute und so kaum 20 Zeilen, hier aus dem Stand herunter rattern.&lt;br&gt;&lt;br&gt;&lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 12:50:15 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929732.html#6929732</guid>
      <dc:creator>waltkers</dc:creator>
      <dc:date>2012-10-27T12:50:15Z</dc:date>
    </item>
    <item>
      <title>Re(3): Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6929726.html#6929726</link>
      <description>Warum ungeeignet? Geht genauso und ist Null Aufwand.&lt;br&gt;&lt;br&gt;&lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 12:47:10 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929726.html#6929726</guid>
      <dc:creator>dizo</dc:creator>
      <dc:date>2012-10-27T12:47:10Z</dc:date>
    </item>
    <item>
      <title>Re(4): Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6929719.html#6929719</link>
      <description>&lt;blockquote&gt;&lt;em&gt;&amp;nbsp;&amp;nbsp;Naja das sind aber alles ziemlich ausgefallene und unbekannte Lösungen?&lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;&lt;br&gt;Ehmmm... nein?!&lt;br&gt;&lt;br&gt;&lt;blockquote&gt;&lt;em&gt; Kann man das nicht auch mit bekannteren Sprachen realisieren? &lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;&lt;br&gt;XPath ist sehr bekannt.&lt;br&gt;&lt;br&gt;&lt;blockquote&gt;&lt;em&gt; Irgendwie schein es mir, als versteift ihr euch zu sehr nur auf das Auslesen&lt;br&gt;von Unterelementen.&lt;br&gt;Ich muss mit der benutzen Sprache aber auch noch Textdateien auslesen und&lt;br&gt;schreiben, Formatierungen durchführen usw..&lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;&lt;br&gt;Das geht mit jeder x-beliebigen Skriptsprache. Nimm das, mit dem du am besten zurecht kommst.&lt;br&gt;&lt;br&gt;&lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 12:25:28 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929719.html#6929719</guid>
      <dc:creator>hellbringer</dc:creator>
      <dc:date>2012-10-27T12:25:28Z</dc:date>
    </item>
    <item>
      <title>Re(4): Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6929715.html#6929715</link>
      <description>&lt;blockquote&gt;&lt;em&gt; Naja das sind aber alles ziemlich ausgefallene und unbekannte Lösungen?&lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;nein - eigentlich ist XPath als Teil des XML-Universums (solange der HTML-Code keine gröberen Syntaxverletzungen enthält) das Um und Auf für solche Verarbeitungsschritte und sämtliche bekannten Sprachen/Bibliotheken (PHP -&gt; DOM-Tools, Java -&gt; Saxon,....) setzen darauf auf.&lt;br&gt;&lt;br&gt;Regexp oder flex/bison wären im Prinzip möglich, aber ein Schuß über das Ziel hinaus, sobald sich die Patterns ändern.&lt;br&gt;&lt;br&gt;&lt;blockquote&gt;&lt;em&gt; Ich muss mit der benutzen Sprache aber auch noch Textdateien auslesen und&lt;br&gt;schreiben, Formatierungen durchführen usw..&lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;wie gesagt: sobald du die XPath-Queries zusammen hast, kannst du sie in jeder üblichen Web-Programmierumgebung einfügen und mit der dir bekannten Sprache weiterarbeiten.&lt;br&gt;Zum Erlernen und Experimentieren sind die Firefox-Plugins ideal, weil du keinen Overhead hast (erst Hello-World drumherum programmieren usw.) und sie auch Syntax-Highlighting u.ä. bieten.&lt;br&gt;&lt;br&gt;Du kannst unserer Einschätzung vertrauen &lt;img src="zwinker.gif" width="16" height="19" align="absmiddle" alt=";-)"/&gt;&lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 12:20:57 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929715.html#6929715</guid>
      <dc:creator>user86060</dc:creator>
      <dc:date>2012-10-27T12:20:57Z</dc:date>
    </item>
    <item>
      <title>Re(3): Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6929706.html#6929706</link>
      <description>Naja das sind aber alles ziemlich ausgefallene und unbekannte Lösungen?&lt;br&gt;Kann man das nicht auch mit bekannteren Sprachen realisieren? &lt;br&gt;&lt;br&gt;Irgendwie schein es mir, als versteift ihr euch zu sehr nur auf das Auslesen von Unterelementen.&lt;br&gt;Ich muss mit der benutzen Sprache aber auch noch Textdateien auslesen und schreiben, Formatierungen durchführen usw..&lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 12:06:24 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929706.html#6929706</guid>
      <dc:creator>waltkers</dc:creator>
      <dc:date>2012-10-27T12:06:24Z</dc:date>
    </item>
    <item>
      <title>Re(3): Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6929707.html#6929707</link>
      <description>Naja das sind aber alles ziemlich ausgefallene und unbekannte Lösungen?&lt;br&gt;Kann man das nicht auch mit bekannteren Sprachen realisieren? &lt;br&gt;&lt;br&gt;Irgendwie schein es mir, als versteift ihr euch zu sehr nur auf das Auslesen von Unterelementen.&lt;br&gt;Ich muss mit der benutzen Sprache aber auch noch Textdateien auslesen und schreiben, Formatierungen durchführen usw..&lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 12:05:40 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929707.html#6929707</guid>
      <dc:creator>waltkers</dc:creator>
      <dc:date>2012-10-27T12:05:40Z</dc:date>
    </item>
    <item>
      <title>Re(2): Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6929682.html#6929682</link>
      <description>xpath (als commandline-Tool) alleine sollte schon reichen, zumindest für einen Wert, kann aber sein, daß man zum Ausgeben beider gleichzeitig eine Scriptsprache dazu nehmen muß.&lt;br&gt;&lt;br&gt;idealerweise fängt man hier an, die Syntax zu lernen:&lt;br&gt;&lt;br&gt;&lt;a href="http://zvon.org/xxl/XPathTutorial/Output_ger/example1.html" rel="noopener" target="_blank"&gt;http:/&lt;wbr/&gt;/&lt;wbr/&gt;zvon.org/&lt;wbr/&gt;xxl/&lt;wbr/&gt;XPathTutorial/&lt;wbr/&gt;Output_ger/&lt;wbr/&gt;example1.html&lt;/a&gt; &lt;br&gt;&lt;br&gt;wobei einige Firefox-Plugins (xpath finder / xpath checker, firebug u.ä.) sehr hilfreich und brauchbar sind, um mit der Syntax interaktiv zu experimentieren.&lt;br&gt;&lt;br&gt;Wenn man ein Vorkenntnisse bzgl. abstrakter Sprachen hat, ist die Lernkurve mit den Zvon-Tutorials sehr steil.&lt;br&gt;&lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 11:19:54 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929682.html#6929682</guid>
      <dc:creator>user86060</dc:creator>
      <dc:date>2012-10-27T11:19:54Z</dc:date>
    </item>
    <item>
      <title>Re: Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6929680.html#6929680</link>
      <description>Die Sprache, die du suchst, nennt sich XPath:&lt;br&gt;&lt;br&gt;&lt;a href="http://de.wikipedia.org/wiki/XPath" rel="noopener" target="_blank"&gt;http:/&lt;wbr/&gt;/&lt;wbr/&gt;de.wikipedia.org/&lt;wbr/&gt;wiki/&lt;wbr/&gt;XPath&lt;/a&gt; &lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 11:11:21 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929680.html#6929680</guid>
      <dc:creator>hellbringer</dc:creator>
      <dc:date>2012-10-27T11:11:21Z</dc:date>
    </item>
    <item>
      <title>Re(2): Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6929672.html#6929672</link>
      <description>&lt;blockquote&gt;&lt;em&gt;&amp;nbsp;&amp;nbsp;Php + regex. &lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;&lt;br&gt;Regex ist dafür ungeeignet.&lt;br&gt;&lt;br&gt;Ein HTML-Parser wäre sinnvoller.&lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 11:08:44 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929672.html#6929672</guid>
      <dc:creator>hellbringer</dc:creator>
      <dc:date>2012-10-27T11:08:44Z</dc:date>
    </item>
    <item>
      <title>Re(2): Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6929681.html#6929681</link>
      <description>&lt;blockquote&gt;&lt;em&gt;&amp;nbsp;&amp;nbsp;Php + regex. &lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;&lt;br&gt;Regex ist dafür ungeeignet.&lt;br&gt;&lt;br&gt;Ein HTML-Parser zusammen mit XPath wäre sinnvoller.&lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 11:08:44 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929681.html#6929681</guid>
      <dc:creator>hellbringer</dc:creator>
      <dc:date>2012-10-27T11:08:44Z</dc:date>
    </item>
    <item>
      <title>Re: Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6929670.html#6929670</link>
      <description>Php + regex. &lt;br&gt;&lt;br&gt;Kommt drauf an wie du die Daten verarbeiten möchtest. &lt;br&gt;&lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 11:04:38 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6929670.html#6929670</guid>
      <dc:creator>dizo</dc:creator>
      <dc:date>2012-10-27T11:04:38Z</dc:date>
    </item>
    <item>
      <title>Womit zwei Elemente aus Webseite auslesen?</title>
      <link>http://forum.geizhals.at/t808141,6930045.html#6930045</link>
      <description>Mit welcher Scriptsprache(PHP, Perl, VBScript,JavaScript,Python,...) könnte ich bitte ALLE gleich wichtigen, folgenden Aufgaben schnell lösen?&lt;br&gt;&lt;br&gt;Ich brauche Sprachvorschläge und Codeschnipsel, damit ich mir schnell was HALBWEGS LAUFFÄHIGES zusammen bauen kann!&lt;br&gt;Desto bekannter die Sprache desto besser, weil so kann ich selber auch besser Codeschnipsel im Internet finden probieren.&lt;br&gt;&lt;br&gt;&lt;br&gt;1. Ich habe eine Textdatei&amp;nbsp;&amp;nbsp;aus der 1600 Links AUSGELESEN werden sollen.&lt;br&gt;Alle Links haben dieselbe Domain und die gleiche Struktur des HTML Codes.&lt;br&gt;&lt;br&gt;2. Zur LAUFZEIT alle 1600 Webseiten nacheinander AUFRUFEN und aus ihrem HTML Code zwei Elemente AUSLESEN.&lt;br&gt;Es handelt sich dabei um den Titel und eine Zahl.&lt;br&gt;&lt;div class=code&gt;&lt;pre&gt;Die Zahl "55,33" steht in folgendem Code:&#xD;
&amp;lt;ul class="list"&amp;gt; &amp;lt;li&amp;gt; &amp;lt;div class="price"&amp;gt;55,33&amp;lt;/div&amp;gt; &amp;lt;/li&amp;gt;&amp;lt;li ...&#xD;
&#xD;
Der Titel "Mein Titel" steht in folgendem Element:&#xD;
&amp;lt;div id="title" class="intro "&amp;gt; &amp;lt;div class="left"&amp;gt; &amp;lt;h1&amp;gt;Mein Titel&amp;lt;/h1&amp;gt;&#xD;
&amp;lt;h2&amp;gt;anderes Zeugs&amp;lt;/h2&amp;gt; &amp;lt;/div&amp;gt;&amp;lt;div... &lt;/pre&gt;&lt;/div&gt;&lt;br&gt;Sowohl class="price"&amp;nbsp;&amp;nbsp;als auch id="title" sind im Code einmalig vorkommende Elemente.&lt;br&gt;Wie springe ich die nun an und lese ihre Unter-Elemente aus? &lt;br&gt;&lt;br&gt;&lt;br&gt;3.Alle Links, Zahlen, Titel sollen zum Schluss in eine lokale html- oder Text-Datei GESCHRIEBEN werden als endlose Liste.&lt;br&gt;&lt;br&gt;&lt;br&gt;&lt;br&gt;Edit:&lt;br&gt;Ich probiers noch mal neu, denn die bisherigen Vorschläge wären leider kaum keine Hilfe oder haben sich nur auf einen winzigen Bruchteil meiner Probleme(Muster auslesen) konzentriert.&lt;br&gt;Wenn ich mir erst wochenlang selbstständig eine Sprache komplett erarbeiten muss, bin ich mit dem händischen Aufruf aller 1600 Webseiten wohl schneller!&lt;br/&gt;</description>
      <pubDate>Sat, 27 Oct 2012 10:55:56 GMT</pubDate>
      <guid>http://forum.geizhals.at/t808141,6930045.html#6930045</guid>
      <dc:creator>waltkers</dc:creator>
      <dc:date>2012-10-27T10:55:56Z</dc:date>
    </item>
  </channel>
</rss>
