<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:dc="http://purl.org/dc/elements/1.1/" version="2.0">
  <channel>
    <title>php + file_get_contents + getElementsByTagName</title>
    <link>http://forum.geizhals.at/feed.jsp?id=874560</link>
    <description>Geizhals-Forum</description>
    <item>
      <title>Re(3): php + file_get_contents + getElementsByTagName</title>
      <link>http://forum.geizhals.at/t874560,7589192.html#7589192</link>
      <description>Danke, werd ich mir durchgoogeln.&lt;br&gt;Eventuell komm ich nochmal mit was &lt;img src="smile.gif" width="16" height="19" align="absmiddle" alt=":)"/&gt;&lt;br/&gt;</description>
      <pubDate>Mon, 01 Feb 2016 12:09:34 GMT</pubDate>
      <guid>http://forum.geizhals.at/t874560,7589192.html#7589192</guid>
      <dc:creator>j.</dc:creator>
      <dc:date>2016-02-01T12:09:34Z</dc:date>
    </item>
    <item>
      <title>Re(2): php + file_get_contents + getElementsByTagName</title>
      <link>http://forum.geizhals.at/t874560,7589144.html#7589144</link>
      <description>Stichworte für Google: curl, php, post&lt;br&gt;&lt;br&gt;Beispiel: &lt;a href="http://stackoverflow.com/questions/2138527/php-curl-http-post-sample-code" rel="noopener" target="_blank"&gt;http:/&lt;wbr/&gt;/&lt;wbr/&gt;stackoverflow.com/&lt;wbr/&gt;questions/&lt;wbr/&gt;2138527/&lt;wbr/&gt;php-curl-http-post-sample-code&lt;/a&gt; &lt;br&gt;&lt;br&gt;Und damit das Login funktioniert: curl, php, cookie&lt;br&gt;&lt;br&gt;Beispiel: &lt;a href="http://stackoverflow.com/questions/12885538/php-curl-and-cookies" rel="noopener" target="_blank"&gt;http:/&lt;wbr/&gt;/&lt;wbr/&gt;stackoverflow.com/&lt;wbr/&gt;questions/&lt;wbr/&gt;12885538/&lt;wbr/&gt;php-curl-and-cookies&lt;/a&gt; &lt;br&gt;&lt;br&gt;&lt;br&gt;Setzt unbedingt den USER_AGENT auf was gütliges, das ist ein 08/15 grund um logins abzulehnen ..&lt;br/&gt;</description>
      <pubDate>Mon, 01 Feb 2016 10:49:02 GMT</pubDate>
      <guid>http://forum.geizhals.at/t874560,7589144.html#7589144</guid>
      <dc:creator>weisnet</dc:creator>
      <dc:date>2016-02-01T10:49:02Z</dc:date>
    </item>
    <item>
      <title>Re(2): php + file_get_contents + getElementsByTagName</title>
      <link>http://forum.geizhals.at/t874560,7589073.html#7589073</link>
      <description>Hm... nope, in Wetterstationen hab ich mich (noch) nicht gehackt &lt;img src="zwinker.gif" width="16" height="19" align="absmiddle" alt=";)"/&gt;&lt;br/&gt;</description>
      <pubDate>Mon, 01 Feb 2016 08:47:09 GMT</pubDate>
      <guid>http://forum.geizhals.at/t874560,7589073.html#7589073</guid>
      <dc:creator>Kackwiesel</dc:creator>
      <dc:date>2016-02-01T08:47:09Z</dc:date>
    </item>
    <item>
      <title>Re(4): php + file_get_contents + getElementsByTagName</title>
      <link>http://forum.geizhals.at/t874560,7589072.html#7589072</link>
      <description>Schätze das liegt an einer Memory Begrenzung meines Hosters.... aber danke für den link, cooles Teil!&lt;br/&gt;</description>
      <pubDate>Mon, 01 Feb 2016 08:45:13 GMT</pubDate>
      <guid>http://forum.geizhals.at/t874560,7589072.html#7589072</guid>
      <dc:creator>Kackwiesel</dc:creator>
      <dc:date>2016-02-01T08:45:13Z</dc:date>
    </item>
    <item>
      <title>Re(3): php + file_get_contents + getElementsByTagName</title>
      <link>http://forum.geizhals.at/t874560,7589063.html#7589063</link>
      <description>Auf phpfiddle.org funktionieren auch beide von hellbringers Beispielen.&lt;br/&gt;</description>
      <pubDate>Mon, 01 Feb 2016 08:13:57 GMT</pubDate>
      <guid>http://forum.geizhals.at/t874560,7589063.html#7589063</guid>
      <dc:creator>mko</dc:creator>
      <dc:date>2016-02-01T08:13:57Z</dc:date>
    </item>
    <item>
      <title>Re: php + file_get_contents + getElementsByTagName</title>
      <link>http://forum.geizhals.at/t874560,7589049.html#7589049</link>
      <description>Ich muß den Thread ein klein wenig hijacken:&lt;br&gt;&lt;br&gt;Ich wollte mir schon seit Jahren etwas basteln um die Werte meiner Wetterstation 2x täglich auszulesen und wohin zu schreiben, aber dazu müsste ich mich einloggen können und dann ein paar Links aufrufen (inklusive Wartezeiteit bis die Daten da sind).&lt;br&gt;&lt;br&gt;Wär dir sowas in dem Zusammenhang schon untergekommen?&lt;br/&gt;</description>
      <pubDate>Mon, 01 Feb 2016 07:29:41 GMT</pubDate>
      <guid>http://forum.geizhals.at/t874560,7589049.html#7589049</guid>
      <dc:creator>j.</dc:creator>
      <dc:date>2016-02-01T07:29:41Z</dc:date>
    </item>
    <item>
      <title>Re(2): php + file_get_contents + getElementsByTagName</title>
      <link>http://forum.geizhals.at/t874560,7588011.html#7588011</link>
      <description>Wenn ich dein oberes Beispiel 1:1 kopiere und ausführe bekomme ich nur &lt;br&gt;=&gt; string(0) "" &amp;lt;= zurück.&lt;br&gt;&lt;br&gt;hm... sehr spannend. Aber danke schon mal fürs Hinweisen auf die Fehlerunterdrückung!&lt;br&gt;&lt;br/&gt;</description>
      <pubDate>Fri, 29 Jan 2016 15:57:51 GMT</pubDate>
      <guid>http://forum.geizhals.at/t874560,7588011.html#7588011</guid>
      <dc:creator>Kackwiesel</dc:creator>
      <dc:date>2016-01-29T15:57:51Z</dc:date>
    </item>
    <item>
      <title>Re: php + file_get_contents + getElementsByTagName</title>
      <link>http://forum.geizhals.at/t874560,7588002.html#7588002</link>
      <description>Naja, wenn du nach Fehlern suchst, ist die Fehlerunterdrücken mit @ nicht besonders hilfreich.&lt;br&gt;&lt;br&gt;Außerdem kannst du dir das file_get_contents() sparen und die Seite direkt mit loadHTMLFile() laden.&lt;br/&gt;</description>
      <pubDate>Fri, 29 Jan 2016 15:43:21 GMT</pubDate>
      <guid>http://forum.geizhals.at/t874560,7588002.html#7588002</guid>
      <dc:creator>hellbringer</dc:creator>
      <dc:date>2016-01-29T15:43:21Z</dc:date>
    </item>
    <item>
      <title>Re: php + file_get_contents + getElementsByTagName</title>
      <link>http://forum.geizhals.at/t874560,7588004.html#7588004</link>
      <description>Naja, wenn du nach Fehlern suchst, ist die Fehlerunterdrücken mit @ nicht besonders hilfreich.&lt;br&gt;&lt;br&gt;Außerdem kannst du dir das file_get_contents() sparen und die Seite direkt mit loadHTMLFile() laden.&lt;br&gt;&lt;br&gt;Edit:&lt;br&gt;&lt;br&gt;Folgender Code funktioniert bei mir übrigens:&lt;br&gt;&lt;br&gt;&lt;pre&gt;$dom = new DOMDocument();&lt;br&gt;$dom-&gt;loadHTMLFile('http://www.univie.ac.at/USI-Wien/ueb/e-mailadressen.htm');&lt;br&gt;$links = $dom-&gt;getElementsByTagName('a');&lt;br&gt;&lt;br&gt;foreach ($links as $link) {&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;var_dump($link-&gt;getAttribute('href'));&lt;br&gt;}&lt;/pre&gt;&lt;br/&gt;</description>
      <pubDate>Fri, 29 Jan 2016 15:43:21 GMT</pubDate>
      <guid>http://forum.geizhals.at/t874560,7588004.html#7588004</guid>
      <dc:creator>hellbringer</dc:creator>
      <dc:date>2016-01-29T15:43:21Z</dc:date>
    </item>
    <item>
      <title>Re: php + file_get_contents + getElementsByTagName</title>
      <link>http://forum.geizhals.at/t874560,7588005.html#7588005</link>
      <description>Naja, wenn du nach Fehlern suchst, ist die Fehlerunterdrücken mit @ nicht besonders hilfreich.&lt;br&gt;&lt;br&gt;Außerdem kannst du dir das file_get_contents() sparen und die Seite direkt mit loadHTMLFile() laden.&lt;br&gt;&lt;br&gt;Edit:&lt;br&gt;&lt;br&gt;Folgender Code funktioniert bei mir übrigens:&lt;br&gt;&lt;br&gt;&lt;pre&gt;$dom = new DOMDocument();&lt;br&gt;$dom-&gt;loadHTMLFile('http://www.univie.ac.at/USI-Wien/ueb/e-mailadressen.htm');&lt;br&gt;$links = $dom-&gt;getElementsByTagName('a');&lt;br&gt;&lt;br&gt;foreach ($links as $link) {&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;var_dump($link-&gt;getAttribute('href'));&lt;br&gt;}&lt;/pre&gt;&lt;br&gt;&lt;br&gt;Und wenn du die HTML-Fehler ignorieren möchtest:&lt;br&gt;&lt;br&gt;&lt;pre&gt;$dom = new DOMDocument();&lt;br&gt;&lt;br&gt;libxml_use_internal_errors(true);&lt;br&gt;$dom-&gt;loadHTMLFile('http://www.univie.ac.at/USI-Wien/ueb/e-mailadressen.htm');&lt;br&gt;libxml_clear_errors();&lt;br&gt;&lt;br&gt;$links = $dom-&gt;getElementsByTagName('a');&lt;br&gt;&lt;br&gt;foreach ($links as $link) {&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;var_dump($link-&gt;getAttribute('href'));&lt;br&gt;}&lt;/pre&gt;&lt;br/&gt;</description>
      <pubDate>Fri, 29 Jan 2016 15:43:21 GMT</pubDate>
      <guid>http://forum.geizhals.at/t874560,7588005.html#7588005</guid>
      <dc:creator>hellbringer</dc:creator>
      <dc:date>2016-01-29T15:43:21Z</dc:date>
    </item>
    <item>
      <title>Re: php + file_get_contents + getElementsByTagName</title>
      <link>http://forum.geizhals.at/t874560,7588006.html#7588006</link>
      <description>Naja, wenn du nach Fehlern suchst, ist die Fehlerunterdrückung mit @ nicht besonders hilfreich.&lt;br&gt;&lt;br&gt;Außerdem kannst du dir das file_get_contents() sparen und die Seite direkt mit loadHTMLFile() laden.&lt;br&gt;&lt;br&gt;Edit:&lt;br&gt;&lt;br&gt;Folgender Code funktioniert bei mir übrigens:&lt;br&gt;&lt;br&gt;&lt;pre&gt;$dom = new DOMDocument();&lt;br&gt;$dom-&gt;loadHTMLFile('http://www.univie.ac.at/USI-Wien/ueb/e-mailadressen.htm');&lt;br&gt;$links = $dom-&gt;getElementsByTagName('a');&lt;br&gt;&lt;br&gt;foreach ($links as $link) {&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;var_dump($link-&gt;getAttribute('href'));&lt;br&gt;}&lt;/pre&gt;&lt;br&gt;&lt;br&gt;Und wenn du die HTML-Fehler ignorieren möchtest:&lt;br&gt;&lt;br&gt;&lt;pre&gt;$dom = new DOMDocument();&lt;br&gt;&lt;br&gt;libxml_use_internal_errors(true);&lt;br&gt;$dom-&gt;loadHTMLFile('http://www.univie.ac.at/USI-Wien/ueb/e-mailadressen.htm');&lt;br&gt;libxml_clear_errors();&lt;br&gt;&lt;br&gt;$links = $dom-&gt;getElementsByTagName('a');&lt;br&gt;&lt;br&gt;foreach ($links as $link) {&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;var_dump($link-&gt;getAttribute('href'));&lt;br&gt;}&lt;/pre&gt;&lt;br/&gt;</description>
      <pubDate>Fri, 29 Jan 2016 15:43:21 GMT</pubDate>
      <guid>http://forum.geizhals.at/t874560,7588006.html#7588006</guid>
      <dc:creator>hellbringer</dc:creator>
      <dc:date>2016-01-29T15:43:21Z</dc:date>
    </item>
    <item>
      <title>Re(2): php + file_get_contents + getElementsByTagName</title>
      <link>http://forum.geizhals.at/t874560,7587963.html#7587963</link>
      <description>Ja, im Quelltext steht alles drinn, aber gute Idee!&lt;br/&gt;</description>
      <pubDate>Fri, 29 Jan 2016 14:33:15 GMT</pubDate>
      <guid>http://forum.geizhals.at/t874560,7587963.html#7587963</guid>
      <dc:creator>Kackwiesel</dc:creator>
      <dc:date>2016-01-29T14:33:15Z</dc:date>
    </item>
    <item>
      <title>Re: php + file_get_contents + getElementsByTagName</title>
      <link>http://forum.geizhals.at/t874560,7587956.html#7587956</link>
      <description>siehst Du die Links im Sourcecode?&lt;br&gt;Es kann sein, dass die Seite per JS aufgebaut wird. Dann brauchst zB phantomjs&lt;br/&gt;</description>
      <pubDate>Fri, 29 Jan 2016 14:27:31 GMT</pubDate>
      <guid>http://forum.geizhals.at/t874560,7587956.html#7587956</guid>
      <dc:creator>TuxTux</dc:creator>
      <dc:date>2016-01-29T14:27:31Z</dc:date>
    </item>
    <item>
      <title>php + file_get_contents + getElementsByTagName</title>
      <link>http://forum.geizhals.at/t874560,7587965.html#7587965</link>
      <description>Hey, ich bin auf ein Problem gestoßen und wäre für hilfreichen Input dankbar... &lt;br&gt;&lt;br&gt;Ich versuche eine Website einzulesen und alle Links auszugeben. Prinzipiell funktioniert es, aber dann gibts Seiten, da enthält $links nur ein leeres Element.&lt;br&gt;&lt;br&gt;Gutes Beispiel ist eine der USI-Seiten, dort klappts nicht. Die Standard.at Seite klappt hingegen problemlos und wirft alle Links aus.&lt;br&gt;&lt;br&gt;$html = file_get_contents('http://www.univie.ac.at/USI-Wien/ueb/e-mailadressen.htm');&lt;br&gt;$dom = new DOMDocument;&lt;br&gt;@$dom-&gt;loadHTML($html);&lt;br&gt;$links = $dom-&gt;getElementsByTagName('a');&lt;br&gt;&lt;br&gt;Irgendwer eine Idee worans liegen könnte? Thx!!&lt;br&gt;&lt;br&gt;Edit: was mit einfällt - zu viele Daten im Speicher (die USI Seite ist recht fett) oder Invalides HTML? &lt;br/&gt;</description>
      <pubDate>Fri, 29 Jan 2016 14:24:20 GMT</pubDate>
      <guid>http://forum.geizhals.at/t874560,7587965.html#7587965</guid>
      <dc:creator>Kackwiesel</dc:creator>
      <dc:date>2016-01-29T14:24:20Z</dc:date>
    </item>
    <item>
      <title>php + file_get_contents + getElementsByTagName</title>
      <link>http://forum.geizhals.at/t874560,7587953.html#7587953</link>
      <description>Hey, ich bin auf ein Problem gestoßen und wäre für hilfreichen Input dankbar... &lt;br&gt;&lt;br&gt;Ich versuche eine Website einzulesen und alle Links auszugeben. Prinzipiell funktioniert es, aber dann gibts Seiten, da enthält $links nur ein leeres Element.&lt;br&gt;&lt;br&gt;Gutes Beispiel ist eine der USI-Seiten, dort klappts nicht. Die Standard.at Seite klappt hingegen problemlos und wirft alle Links aus.&lt;br&gt;&lt;br&gt;$html = file_get_contents('http://www.univie.ac.at/USI-Wien/ueb/e-mailadressen.htm');&lt;br&gt;$dom = new DOMDocument;&lt;br&gt;@$dom-&gt;loadHTML($html);&lt;br&gt;$links = $dom-&gt;getElementsByTagName('a');&lt;br&gt;&lt;br&gt;Irgendwer eine Idee worans liegen könnte? Thx!!&lt;br/&gt;</description>
      <pubDate>Fri, 29 Jan 2016 14:24:20 GMT</pubDate>
      <guid>http://forum.geizhals.at/t874560,7587953.html#7587953</guid>
      <dc:creator>Kackwiesel</dc:creator>
      <dc:date>2016-01-29T14:24:20Z</dc:date>
    </item>
  </channel>
</rss>
