<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:dc="http://purl.org/dc/elements/1.1/" version="2.0">
  <channel>
    <title>Seitenzahl aus PDF-Datei auslesen usw.</title>
    <link>http://forum.geizhals.at/feed.jsp?id=543187</link>
    <description>Geizhals-Forum</description>
    <item>
      <title>Re(2): Seitenzahl aus PDF-Datei auslesen usw.</title>
      <link>http://forum.geizhals.at/t543187,4540032.html#4540032</link>
      <description>Vielen Dank für den Tipp!&lt;br&gt;&lt;br&gt;Ich probier jetzt mal aus, was mit den Bordmitteln von Acrobat geht und schau mir mal das "Acrobat JavaScript Scripting Guide" durch.&lt;br&gt;&lt;br&gt;&lt;br&gt;&lt;br/&gt;</description>
      <pubDate>Thu, 03 Jan 2008 06:48:23 GMT</pubDate>
      <guid>http://forum.geizhals.at/t543187,4540032.html#4540032</guid>
      <dc:creator>redbull1970</dc:creator>
      <dc:date>2008-01-03T06:48:23Z</dc:date>
    </item>
    <item>
      <title>Re: Seitenzahl aus PDF-Datei auslesen usw.</title>
      <link>http://forum.geizhals.at/t543187,4539917.html#4539917</link>
      <description>Seeeeh Umständlicher Weg unter Linux:&lt;br&gt;&lt;br&gt;Du könntest pdftotext verwenden.&lt;br&gt;Auszug aus der Manpage:&lt;br&gt;&lt;br&gt;&lt;br&gt;&lt;div class=code&gt;&lt;pre&gt;&#xD;
       Pdftotext converts Portable Document Format (PDF) files to plain  text.&#xD;
&#xD;
...&#xD;
und&#xD;
...&#xD;
      -f number&#xD;
              Specifies the first page to convert.&#xD;
&#xD;
       -l number&#xD;
              Specifies the last page to convert.&#xD;
&#xD;
&lt;/pre&gt;&lt;/div&gt;&lt;br&gt;&lt;br&gt;Daraus sollte sich schnell ein Perlscript bauen lassen, das&lt;br&gt; - sich die 15.000 Begriffe in einem Hash merkt&lt;br&gt; - immer eine Seite mit pdftotext generiert&lt;br&gt; - dort tokenized&lt;br&gt; - und jedes Wort mit der Liste matcht.&lt;br&gt;&lt;br&gt;Ein Problem wären nur abgetrennte Worte wie "Pro-blem" am Zeilenende - und noch mehr wohl Begriffe, die über 2 Seiten abgeteilt werden.&lt;br&gt;&lt;br&gt;Ansonsten wäre es wohl eine unelegante aber praktikable Variante.&lt;br/&gt;</description>
      <pubDate>Thu, 03 Jan 2008 00:02:28 GMT</pubDate>
      <guid>http://forum.geizhals.at/t543187,4539917.html#4539917</guid>
      <dc:creator>kombipaket</dc:creator>
      <dc:date>2008-01-03T00:02:28Z</dc:date>
    </item>
    <item>
      <title>Re: Seitenzahl aus PDF-Datei auslesen usw.</title>
      <link>http://forum.geizhals.at/t543187,4538505.html#4538505</link>
      <description>PDF kann verschlüsselt und komprimiert sein, wird also etwas komplizierter werden ...&lt;br&gt;&lt;br&gt;&lt;br/&gt;</description>
      <pubDate>Wed, 02 Jan 2008 15:02:37 GMT</pubDate>
      <guid>http://forum.geizhals.at/t543187,4538505.html#4538505</guid>
      <dc:creator>mjy@geizhals.at</dc:creator>
      <dc:date>2008-01-02T15:02:37Z</dc:date>
    </item>
    <item>
      <title>Seitenzahl aus PDF-Datei auslesen usw.</title>
      <link>http://forum.geizhals.at/t543187,4538454.html#4538454</link>
      <description>Ich habe &lt;br&gt;1. eine Liste mit 15.000 Begriffen als Word-Datei und&lt;br&gt;2. einige PDF-Dateien.&lt;br&gt;&lt;br&gt;Jetzt soll - möglichst automatisch - in den PDF-Dateien nach diesen Begriffen gesucht werden, und die Seitenzahlen der Fundstellen in die Word-Datei eingetragen werden.&lt;br&gt;&lt;br&gt;Gibt es vielleicht doch eine Möglichkeit? &lt;br&gt;(Scriptprogrammierung?, VB?)&lt;br&gt;&lt;br/&gt;</description>
      <pubDate>Wed, 02 Jan 2008 14:42:33 GMT</pubDate>
      <guid>http://forum.geizhals.at/t543187,4538454.html#4538454</guid>
      <dc:creator>redbull1970</dc:creator>
      <dc:date>2008-01-02T14:42:33Z</dc:date>
    </item>
  </channel>
</rss>
