Re: Womit zwei Elemente aus Webseite auslesen?
Geizhals » Forum » Programmierung » Womit zwei Elemente aus Webseite auslesen? (55 Beiträge, 970 Mal gelesen) Top-100 | Fresh-100
Du bist nicht angemeldet. [ Login/Registrieren ]
Womit zwei Elemente aus Webseite auslesen?
27.10.2012, 12:55:56
Mit welcher Scriptsprache(PHP, Perl, VBScript,JavaScript,Python,...) könnte ich bitte ALLE gleich wichtigen, folgenden Aufgaben schnell lösen?

Ich brauche Sprachvorschläge und Codeschnipsel, damit ich mir schnell was HALBWEGS LAUFFÄHIGES zusammen bauen kann!
Desto bekannter die Sprache desto besser, weil so kann ich selber auch besser Codeschnipsel im Internet finden probieren.


1. Ich habe eine Textdatei  aus der 1600 Links AUSGELESEN werden sollen.
Alle Links haben dieselbe Domain und die gleiche Struktur des HTML Codes.

2. Zur LAUFZEIT alle 1600 Webseiten nacheinander AUFRUFEN und aus ihrem HTML Code zwei Elemente AUSLESEN.
Es handelt sich dabei um den Titel und eine Zahl.
Die Zahl "55,33" steht in folgendem Code:
<ul class="list"> <li> <div class="price">55,33</div> </li><li ...

Der Titel "Mein Titel" steht in folgendem Element:
<div id="title" class="intro "> <div class="left"> <h1>Mein Titel</h1>
<h2>anderes Zeugs</h2> </div><div... 

Sowohl class="price"  als auch id="title" sind im Code einmalig vorkommende Elemente.
Wie springe ich die nun an und lese ihre Unter-Elemente aus?


3.Alle Links, Zahlen, Titel sollen zum Schluss in eine lokale html- oder Text-Datei GESCHRIEBEN werden als endlose Liste.



Edit:
Ich probiers noch mal neu, denn die bisherigen Vorschläge wären leider kaum keine Hilfe oder haben sich nur auf einen winzigen Bruchteil meiner Probleme(Muster auslesen) konzentriert.
Wenn ich mir erst wochenlang selbstständig eine Sprache komplett erarbeiten muss, bin ich mit dem händischen Aufruf aller 1600 Webseiten wohl schneller!

28.10.2012, 08:32 Uhr - Editiert von waltkers, alte Version: hier
Antworten PM Alle Chronologisch
 
Melden nicht möglich
.  XPath - Basis
 (user86060 am 27.10.2012, 16:24:02)
..  Re: XPath - Basis  (dss am 30.10.2012, 17:11:31)
...  Re(2): XPath - Basis  (user86060 am 30.10.2012, 17:16:40)
....  Re(3): XPath - Basis  (dss am 30.10.2012, 17:29:52)
.....  Re(4): XPath - Basis  (user86060 am 30.10.2012, 17:32:08)
......  Re(5): XPath - Basis  (hellbringer am 30.10.2012, 18:44:03)
...  Re(2): XPath - Basis  (hellbringer am 30.10.2012, 18:39:55)
....  Re(3): XPath - Basis  (dss am 31.10.2012, 15:16:32)
 

Dieses Forum ist eine frei zugängliche Diskussionsplattform.
Der Betreiber übernimmt keine Verantwortung für den Inhalt der Beiträge und behält sich das Recht vor, Beiträge mit rechtswidrigem oder anstößigem Inhalt zu löschen.
Datenschutzerklärung