<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:dc="http://purl.org/dc/elements/1.1/" version="2.0">
  <channel>
    <title>Schnittmenge zweier Textdateien</title>
    <link>http://forum.geizhals.at/feed.jsp?id=31313</link>
    <description>Geizhals-Forum</description>
    <item>
      <title>Re(8): Schnittmenge zweier Textdateien</title>
      <link>http://forum.geizhals.at/t31313,140950.html#140950</link>
      <description>aber zum glück hat er die angabe erweitert: es gibt günstigerweise keine doppelten einträge. dann ist mein vorschlag ja nur mehr ineffizient &lt;img src="smile.gif" width="16" height="19" align="absmiddle" alt=":)"/&gt;&lt;br/&gt;&lt;br/&gt;&lt;br&gt;&lt;em&gt;................&lt;br/&gt;&lt;br&gt;"Ideally, &lt;u&gt;hyperthreading&lt;/u&gt;, which has been under development for four and a half years, will show meatier benefits. An individual could &lt;u&gt;play games while simultaneously downloading multimedia files&lt;/u&gt; from the Internet with a computer containing the technology"&lt;br&gt;&lt;div align="right"/&gt; - intel.com&lt;br&gt;&lt;/em&gt;&lt;br&gt;&lt;br&gt;</description>
      <pubDate>Fri, 31 Aug 2001 08:23:26 GMT</pubDate>
      <guid>http://forum.geizhals.at/t31313,140950.html#140950</guid>
      <dc:creator>Simon Oberhammer</dc:creator>
      <dc:date>2001-08-31T08:23:26Z</dc:date>
    </item>
    <item>
      <title>Re(3): Schnittmenge zweier Textdateien</title>
      <link>http://forum.geizhals.at/t31313,140572.html#140572</link>
      <description>Perl ist gerade für solche Aufgaben mit seinen assoc. arrays extrem schnell. Ausserdem kannst du die arrays leicht auf dbm - files mappen, falls dir doch der Hauptspeicher zu eng wird. &lt;br/&gt;&lt;HR/&gt;&lt;B&gt;&lt;center&gt;Cats make purrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrfect friends.&lt;/center&gt;&lt;/B&gt;&lt;br&gt;&lt;br&gt;</description>
      <pubDate>Thu, 30 Aug 2001 18:09:08 GMT</pubDate>
      <guid>http://forum.geizhals.at/t31313,140572.html#140572</guid>
      <dc:creator>TomCat</dc:creator>
      <dc:date>2001-08-30T18:09:08Z</dc:date>
    </item>
    <item>
      <title>Re(3): Schnittmenge zweier Textdateien</title>
      <link>http://forum.geizhals.at/t31313,140541.html#140541</link>
      <description>Passiert automatisch nach dieser Methode.&lt;br&gt;&lt;br&gt;Läuft im Wesentlichen so ab:&lt;br&gt;&lt;br&gt;Zuerst die erste Liste einlesen und bei der Gelegenheit gleich sortiert im Hashtable eintragen (ich hab mir zuerst überlegt es in einem sorttree unterzubringen, aber nachdem wir's ja nicht "wirklich" sortieren sondern nur wiederfinden müssen ist's mit'm Hash wesentlich effizienter. Wie gross soll's denn nur sein?)&lt;br&gt;&lt;br&gt;Dann jedes Element der zweiten Liste in der ersten suchen. Wird's gefunden, in die Ergebnisliste ausgeben und Eintrag im Table löschen.&lt;br&gt;&lt;br&gt;Wenn's nochmal vorkommt wird's eh nicht mehr gefunden.&lt;br&gt;&lt;br&gt;Wenn Mehrfacheinträge sehr häufig sind, ist es ggf. vielleicht sogar effizienter, die Ergebnismenge ebenfalls wieder zu hashen und zuerst in dieser (kleineren) Menge zu suchen.&lt;br/&gt;&lt;br/&gt;&lt;br&gt;Shadows can be made real&lt;br&gt;if you kill in their name.&lt;br&gt;&lt;br&gt;</description>
      <pubDate>Thu, 30 Aug 2001 17:44:21 GMT</pubDate>
      <guid>http://forum.geizhals.at/t31313,140541.html#140541</guid>
      <dc:creator>Fly</dc:creator>
      <dc:date>2001-08-30T17:44:21Z</dc:date>
    </item>
    <item>
      <title>Re(8): Schnittmenge zweier Textdateien</title>
      <link>http://forum.geizhals.at/t31313,140351.html#140351</link>
      <description>Ich hab damals nicht ganz genau aufgepasst. Ist die Schnittmenge zweier Multimengen wieder eine Multimenge?&lt;br/&gt;&lt;p/&gt;&lt;br&gt;&lt;br&gt;&lt;br&gt;</description>
      <pubDate>Thu, 30 Aug 2001 13:49:17 GMT</pubDate>
      <guid>http://forum.geizhals.at/t31313,140351.html#140351</guid>
      <dc:creator>Robert Craven</dc:creator>
      <dc:date>2001-08-30T13:49:17Z</dc:date>
    </item>
    <item>
      <title>Re(7): Schnittmenge zweier Textdateien</title>
      <link>http://forum.geizhals.at/t31313,140322.html#140322</link>
      <description>Die Ausgangssituation nennt aber 2 Dateien, da können sehr wohl Duplikate vorkommen.&lt;br/&gt;&lt;hr height="1" color="black"/&gt;&lt;img align="right" src="/mjycat.jpg"/&gt;Marinos J. Yannikos &amp;lt;&lt;a&gt;mjy@geizhals.at&lt;/a&gt;&gt;&lt;br/&gt;&lt;br/&gt;&lt;br&gt;&lt;em/&gt;&lt;sub/&gt;Education is an admirable thing, but nothing that is worth knowing can be taught&lt;br/&gt;-- Oscar Wilde&lt;br&gt;&lt;br&gt;</description>
      <pubDate>Thu, 30 Aug 2001 13:22:01 GMT</pubDate>
      <guid>http://forum.geizhals.at/t31313,140322.html#140322</guid>
      <dc:creator>mjy@geizhals.at</dc:creator>
      <dc:date>2001-08-30T13:22:01Z</dc:date>
    </item>
    <item>
      <title>Re(2): Schnittmenge zweier Textdateien</title>
      <link>http://forum.geizhals.at/t31313,140309.html#140309</link>
      <description>tja, da wollte ich mal hören, womit so etwas am einfachsten zu lösen ist.&lt;br&gt;&lt;br&gt;Ich dachte kurzfristig an ein perl-skript, da man das mit map in 5 zeilen lösen kann, ausserdem wäre es dann gleich online verfügbar. Habe allerdings keine Ahnung, wie lange das dann dauert. &lt;br/&gt;&lt;br&gt;</description>
      <pubDate>Thu, 30 Aug 2001 13:09:48 GMT</pubDate>
      <guid>http://forum.geizhals.at/t31313,140309.html#140309</guid>
      <dc:creator>cltom</dc:creator>
      <dc:date>2001-08-30T13:09:48Z</dc:date>
    </item>
    <item>
      <title>Re(6): Schnittmenge zweier Textdateien</title>
      <link>http://forum.geizhals.at/t31313,140303.html#140303</link>
      <description>Naja net wirklich. In einer Menge gibts mal von vornherein keine Doppelten. Damit stimmt dann schon die Ausganssituation nicht. Der Lösungsweg ist schon korrekt.&lt;br/&gt;&lt;p/&gt;&lt;br&gt;&lt;br&gt;&lt;br&gt;</description>
      <pubDate>Thu, 30 Aug 2001 13:04:45 GMT</pubDate>
      <guid>http://forum.geizhals.at/t31313,140303.html#140303</guid>
      <dc:creator>Robert Craven</dc:creator>
      <dc:date>2001-08-30T13:04:45Z</dc:date>
    </item>
    <item>
      <title>Re(2): Schnittmenge zweier Textdateien</title>
      <link>http://forum.geizhals.at/t31313,140300.html#140300</link>
      <description>Doppeleinträge sind (günstigerweise) sicher auszuschliessen.&lt;br/&gt;&lt;br&gt;</description>
      <pubDate>Thu, 30 Aug 2001 13:03:12 GMT</pubDate>
      <guid>http://forum.geizhals.at/t31313,140300.html#140300</guid>
      <dc:creator>cltom</dc:creator>
      <dc:date>2001-08-30T13:03:12Z</dc:date>
    </item>
    <item>
      <title>Re(5): Schnittmenge zweier Textdateien</title>
      <link>http://forum.geizhals.at/t31313,140294.html#140294</link>
      <description>Trivial, aber falsch. &lt;img src="smile.gif" width="16" height="19" align="absmiddle" alt=":-)"/&gt;&lt;br&gt;&lt;br/&gt;&lt;hr height="1" color="black"/&gt;&lt;img align="right" src="/mjycat.jpg"/&gt;Marinos J. Yannikos &amp;lt;&lt;a&gt;mjy@geizhals.at&lt;/a&gt;&gt;&lt;br/&gt;&lt;br/&gt;&lt;br&gt;&lt;em/&gt;&lt;sub/&gt;Education is an admirable thing, but nothing that is worth knowing can be taught&lt;br/&gt;-- Oscar Wilde&lt;br&gt;&lt;br&gt;</description>
      <pubDate>Thu, 30 Aug 2001 12:59:59 GMT</pubDate>
      <guid>http://forum.geizhals.at/t31313,140294.html#140294</guid>
      <dc:creator>mjy@geizhals.at</dc:creator>
      <dc:date>2001-08-30T12:59:59Z</dc:date>
    </item>
    <item>
      <title>Re(4): Schnittmenge zweier Textdateien</title>
      <link>http://forum.geizhals.at/t31313,140291.html#140291</link>
      <description>Mal von doppelten abgesehen. Aber das ist ja eh trivial &lt;img src="zwinker.gif" width="16" height="19" align="absmiddle" alt=";-)"/&gt;&lt;br/&gt;&lt;p/&gt;&lt;br&gt;&lt;br&gt;&lt;br&gt;</description>
      <pubDate>Thu, 30 Aug 2001 12:56:48 GMT</pubDate>
      <guid>http://forum.geizhals.at/t31313,140291.html#140291</guid>
      <dc:creator>Robert Craven</dc:creator>
      <dc:date>2001-08-30T12:56:48Z</dc:date>
    </item>
    <item>
      <title>Re(3): Schnittmenge zweier Textdateien</title>
      <link>http://forum.geizhals.at/t31313,140289.html#140289</link>
      <description>Wieso falsch? (x el (A Schnitt B)), wenn (x el A) und (x el B).&lt;br/&gt;&lt;p/&gt;&lt;br&gt;&lt;br&gt;&lt;br&gt;</description>
      <pubDate>Thu, 30 Aug 2001 12:55:14 GMT</pubDate>
      <guid>http://forum.geizhals.at/t31313,140289.html#140289</guid>
      <dc:creator>Robert Craven</dc:creator>
      <dc:date>2001-08-30T12:55:14Z</dc:date>
    </item>
    <item>
      <title>Re: Schnittmenge zweier Textdateien</title>
      <link>http://forum.geizhals.at/t31313,140287.html#140287</link>
      <description>1) kleinere Datei öffnen und alle Wörter in eine Hash-Tabelle (einmal!) eintragen&lt;br&gt;2) größere Datei öffnen und für jedes Wort in der Hash-Tabelle nachschauen, ob es in der anderen Datei vorgekommen ist. Falls ja, Wort ausgeben und Wort aus der Hash-Tabelle löschen (damit Wörter nicht doppelt ausgegeben werden!)&lt;br&gt;&lt;br/&gt;&lt;hr height="1" color="black"/&gt;&lt;img align="right" src="/mjycat.jpg"/&gt;Marinos J. Yannikos &amp;lt;&lt;a&gt;mjy@geizhals.at&lt;/a&gt;&gt;&lt;br/&gt;&lt;br/&gt;&lt;br&gt;&lt;em/&gt;&lt;sub/&gt;Education is an admirable thing, but nothing that is worth knowing can be taught&lt;br/&gt;-- Oscar Wilde&lt;br&gt;&lt;br&gt;</description>
      <pubDate>Thu, 30 Aug 2001 12:54:37 GMT</pubDate>
      <guid>http://forum.geizhals.at/t31313,140287.html#140287</guid>
      <dc:creator>mjy@geizhals.at</dc:creator>
      <dc:date>2001-08-30T12:54:37Z</dc:date>
    </item>
    <item>
      <title>Re: Schnittmenge zweier Textdateien</title>
      <link>http://forum.geizhals.at/t31313,140281.html#140281</link>
      <description>Texte sortieren (Doppelte streichen!). Kurze Liste gegen die Lange vergleichen. Wenn Hit dann zur Schnittmenge hinzufügen.&lt;br/&gt;&lt;p/&gt;&lt;br&gt;&lt;br&gt;&lt;br&gt;</description>
      <pubDate>Thu, 30 Aug 2001 12:52:07 GMT</pubDate>
      <guid>http://forum.geizhals.at/t31313,140281.html#140281</guid>
      <dc:creator>Robert Craven</dc:creator>
      <dc:date>2001-08-30T12:52:07Z</dc:date>
    </item>
    <item>
      <title>Re(2): Schnittmenge zweier Textdateien</title>
      <link>http://forum.geizhals.at/t31313,140278.html#140278</link>
      <description>Ineffizient und vermutlich falsch &lt;img src="zwinker.gif" width="16" height="19" align="absmiddle" alt=";-)"/&gt; (falsch gemäß Definition von "Schnittmenge", ob das auch in der Fragestellung so zu berücksichtigen ist, weiß ich natürlich nicht).&lt;br&gt;&lt;br/&gt;&lt;hr height="1" color="black"/&gt;&lt;img align="right" src="/mjycat.jpg"/&gt;Marinos J. Yannikos &amp;lt;&lt;a&gt;mjy@geizhals.at&lt;/a&gt;&gt;&lt;br/&gt;&lt;br/&gt;&lt;br&gt;&lt;em/&gt;&lt;sub/&gt;Education is an admirable thing, but nothing that is worth knowing can be taught&lt;br/&gt;-- Oscar Wilde&lt;br&gt;&lt;br&gt;</description>
      <pubDate>Thu, 30 Aug 2001 12:49:30 GMT</pubDate>
      <guid>http://forum.geizhals.at/t31313,140278.html#140278</guid>
      <dc:creator>mjy@geizhals.at</dc:creator>
      <dc:date>2001-08-30T12:49:30Z</dc:date>
    </item>
    <item>
      <title>Re: Schnittmenge zweier Textdateien</title>
      <link>http://forum.geizhals.at/t31313,140268.html#140268</link>
      <description>Nur ein kleiner Vorschlag der mir ad hoc einfällt:&lt;br&gt;Ich nehme an ',' ist das Trennzeichen.&lt;br&gt;Daher alle Strings in dem kleineren File in Mem lesen (Liste o.ä.),&lt;br&gt;Mit den Strings im größeren Vergleichen (1tes Zeichen, wenn gleich dann 2tes, usw..)&lt;br&gt;und die Schnittmenge wieder abspeichern.&lt;br&gt;&lt;br&gt;Aber bei Texten mit 700 und 3000 Zeilen bist du ziemlich sicher auf der schnellen Seite mit heutigem Standard Equipment.&lt;br&gt;&lt;br&gt;Für konkretere Angaben zur Geschwindigkeitsoptimierung wäre etwas mehr Info hilfreich (Welche Sprache? Wie schnell solls sein?).&lt;br&gt;&lt;br&gt;HTH&lt;br&gt;The Cleaner&lt;br/&gt;&lt;br&gt;</description>
      <pubDate>Thu, 30 Aug 2001 12:43:51 GMT</pubDate>
      <guid>http://forum.geizhals.at/t31313,140268.html#140268</guid>
      <dc:creator>The Cleaner</dc:creator>
      <dc:date>2001-08-30T12:43:51Z</dc:date>
    </item>
    <item>
      <title>Re: Schnittmenge zweier Textdateien</title>
      <link>http://forum.geizhals.at/t31313,140261.html#140261</link>
      <description>also wenns um die schnittmenge der wörter zweier textdateien geht würd ich mal eine aufmachen, &lt;br&gt;&lt;br&gt;wort einlesen - andere durschaun ob's das wort gibt. wenn ja: ist in schnittmenge; wenn nein: eben nicht. nächstes wort. goto anfang.&lt;br/&gt;&lt;br/&gt;&lt;br&gt;&lt;em&gt;................&lt;br/&gt;&lt;br&gt;"Ideally, &lt;u&gt;hyperthreading&lt;/u&gt;, which has been under development for four and a half years, will show meatier benefits. An individual could &lt;u&gt;play games while simultaneously downloading multimedia files&lt;/u&gt; from the Internet with a computer containing the technology"&lt;br&gt;&lt;div align="right"/&gt; - intel.com&lt;br&gt;&lt;/em&gt;&lt;br&gt;&lt;br&gt;</description>
      <pubDate>Thu, 30 Aug 2001 12:37:12 GMT</pubDate>
      <guid>http://forum.geizhals.at/t31313,140261.html#140261</guid>
      <dc:creator>Simon Oberhammer</dc:creator>
      <dc:date>2001-08-30T12:37:12Z</dc:date>
    </item>
    <item>
      <title>Schnittmenge zweier Textdateien</title>
      <link>http://forum.geizhals.at/t31313,140246.html#140246</link>
      <description>Welchen Weg würdet ihr gehen, wenn ihr die Schnittmenge von zwei Textdateien erhalten wollt. Beispiel:&lt;br&gt;&lt;br&gt;&lt;br&gt;Text1:&amp;nbsp;&amp;nbsp;HHH, KKK, LLL, OOO, PPP, SSS&lt;br&gt;Text2:&amp;nbsp;&amp;nbsp;BBB, MMM, OOO, SSS&lt;br&gt;&lt;br&gt;Ergebnis: OOO, SSS&lt;br&gt;&lt;br&gt;Die beiden Texte sind recht umfangreich (der eine 700 Zeilen, der andere 3000 Zeilen). Vielleicht kann man das bei der Lösung beachten.&lt;br/&gt;&lt;br&gt;</description>
      <pubDate>Thu, 30 Aug 2001 12:28:02 GMT</pubDate>
      <guid>http://forum.geizhals.at/t31313,140246.html#140246</guid>
      <dc:creator>cltom</dc:creator>
      <dc:date>2001-08-30T12:28:02Z</dc:date>
    </item>
  </channel>
</rss>
