<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:dc="http://purl.org/dc/elements/1.1/" version="2.0">
  <channel>
    <title>Java: Parsen großer Dateien</title>
    <link>http://forum.geizhals.at/feed.jsp?id=459858</link>
    <description>Geizhals-Forum</description>
    <item>
      <title>Re(14): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3793759.html#3793759</link>
      <description>&lt;blockquote&gt;&lt;em&gt; Theorie vs. Praxis&lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;Wie so oft&lt;br&gt;&lt;br&gt;&lt;blockquote&gt;&lt;em&gt; aber ich kenn das GHF halt auch als Ideenquelle&lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;Jap,ich bevorzug aber mein ICQ, mindestens 10 gut Ausgebildete Informatiker fast 24h auf Abruf bereit *g*&lt;br/&gt;</description>
      <pubDate>Fri, 24 Nov 2006 10:17:11 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3793759.html#3793759</guid>
      <dc:creator>Nagelfar</dc:creator>
      <dc:date>2006-11-24T10:17:11Z</dc:date>
    </item>
    <item>
      <title>Re(4): nun ... doch...</title>
      <link>http://forum.geizhals.at/t459858,3793755.html#3793755</link>
      <description>Ist eine satte Mischung aus Perl und C, soviel ich bis jetzt gesehen habe.&lt;br/&gt;</description>
      <pubDate>Fri, 24 Nov 2006 10:15:43 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3793755.html#3793755</guid>
      <dc:creator>m3t4tr0n</dc:creator>
      <dc:date>2006-11-24T10:15:43Z</dc:date>
    </item>
    <item>
      <title>Re(13): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3793750.html#3793750</link>
      <description>&gt;Allerdings bezweifel ich, dass das an einen Kunden rausgehen soll&lt;br&gt;&lt;br&gt;Nein, geht nicht an einen Kunden (ich glaub nicht, daß das wer haben will hehe). Die Entwicklungszeit beträgt rund 6 Wochen - das ist schon recht wenig, so daß ich auch (und grad weils nicht für Kunden ist &lt;img src="hornteeth.gif" width="16" height="26" align="absmiddle" alt="&amp;gt;&amp;#58;-D"/&gt;) mit durchschnittlich guten Ergebnissen zufrieden bin.&lt;br&gt;&lt;br&gt;&gt;sonst würds nicht ein Anfänger (net bös gmeint) &lt;br&gt;&lt;br&gt;Jedenfalls Anfänger, wenns um solche Datenmassen geht. Auf dem Papier sieht nach der Modellierung alles so schön aus - Theorie vs. Praxis. &lt;img src="teeth.gif" width="16" height="19" align="absmiddle" alt="|-D"/&gt;&lt;br&gt;&lt;br&gt;&gt;allein entwickeln müssen.&lt;br&gt;&lt;br&gt;Bin in einem 3er Team in einem 12er Team. Nicht, daß ich nicht mit den Kollegen drüber diskutiert hätte, aber ich kenn das GHF halt auch als Ideenquelle. &lt;img src="zwinker.gif" width="16" height="19" align="absmiddle" alt=";)"/&gt;&lt;br/&gt;</description>
      <pubDate>Fri, 24 Nov 2006 10:12:41 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3793750.html#3793750</guid>
      <dc:creator>m3t4tr0n</dc:creator>
      <dc:date>2006-11-24T10:12:41Z</dc:date>
    </item>
    <item>
      <title>Re: Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3793703.html#3793703</link>
      <description>Nachdem es hier schon mal kurz angeklungen ist, das Ganze in einer DB zu speichern.&lt;br&gt;&lt;br&gt;Was waere den von JavaDB zu halten in diesem Fall.&lt;br&gt;&lt;a href="http://developers.sun.com/prodtech/javadb/" rel="noopener" target="_blank"&gt;http:/&lt;wbr/&gt;/&lt;wbr/&gt;developers.sun.com/&lt;wbr/&gt;prodtech/&lt;wbr/&gt;javadb/&lt;wbr/&gt;&lt;/a&gt; &lt;br&gt;&lt;br&gt;Vielleicht kann einer von den Java-Kennern etwas dazu sagen ?&lt;br&gt;Scheint ja vom Platz recht klein zu sein.&lt;br&gt;&lt;br/&gt;</description>
      <pubDate>Fri, 24 Nov 2006 09:56:03 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3793703.html#3793703</guid>
      <dc:creator>cyran</dc:creator>
      <dc:date>2006-11-24T09:56:03Z</dc:date>
    </item>
    <item>
      <title>Re(11): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3793674.html#3793674</link>
      <description>Toll &lt;img src="tongue.gif" width="16" height="19" align="absmiddle" alt=":P"/&gt;&lt;br&gt;&lt;br&gt;Gib das mal nem DAU Kunden.. oder Leuten die nicht mal helloworld Programme starten können &lt;img src="zwinker.gif" width="16" height="19" align="absmiddle" alt=";)"/&gt;&lt;br&gt;&lt;br&gt;Und man glaubt gar nicht wieviele Leute es noch gibt die mit .jar sowieso nix anfangen können &lt;img src="tongue.gif" width="16" height="19" align="absmiddle" alt=":P"/&gt;&lt;br&gt;&lt;br&gt;Wenns keine EXE ist gehts auch net ausführen... &lt;img src="crazy.gif" width="16" height="19" align="absmiddle" alt="%-)"/&gt;&lt;img src="flenn.gif" width="16" height="19" align="absmiddle" alt=":´("/&gt;&lt;br/&gt;</description>
      <pubDate>Fri, 24 Nov 2006 09:44:38 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3793674.html#3793674</guid>
      <dc:creator>thE</dc:creator>
      <dc:date>2006-11-24T09:44:38Z</dc:date>
    </item>
    <item>
      <title>Re(9): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3793653.html#3793653</link>
      <description>Und wie setzt du den Wert auf max. wenn du vorher nicht weißt wieviel MB RAM der hat?!&lt;br/&gt;</description>
      <pubDate>Fri, 24 Nov 2006 09:37:03 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3793653.html#3793653</guid>
      <dc:creator>thE</dc:creator>
      <dc:date>2006-11-24T09:37:03Z</dc:date>
    </item>
    <item>
      <title>Re(3): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3793616.html#3793616</link>
      <description>Naja mach halt ne Dll oder so Datei drauß &lt;img src="tongue.gif" width="16" height="19" align="absmiddle" alt=":P"/&gt;&lt;br/&gt;</description>
      <pubDate>Fri, 24 Nov 2006 09:21:00 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3793616.html#3793616</guid>
      <dc:creator>thE</dc:creator>
      <dc:date>2006-11-24T09:21:00Z</dc:date>
    </item>
    <item>
      <title>Re(11): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3793599.html#3793599</link>
      <description>Nun ja...&lt;br&gt;&lt;br&gt;AFAIK liegts an der VM... Du kannst aber was "perverses" bauen:&lt;br&gt;&lt;br&gt;1.) 2 getrennte VMs starten&lt;br&gt;2.) 2 Apps in die 2 VMs&lt;br&gt;3.) die Apps kommunizieren untereinander und parsen gemeinsam... So daß jede VM mit 2GB auskommt.... Also quasi ein Cluster auf demselben Rechner.&lt;br&gt;&lt;br&gt;Das klingt mal blödsinnig, es liegt aber einfach daran, daß du auch auf einem System mit 20GB Ram nur so rund 2-3GB in eine VM reinbekommst... Drum mehr VMs starten &lt;img src="zwinker.gif" width="16" height="19" align="absmiddle" alt=";-)"/&gt;&lt;br/&gt;</description>
      <pubDate>Fri, 24 Nov 2006 09:09:27 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3793599.html#3793599</guid>
      <dc:creator>Linux_Sucks</dc:creator>
      <dc:date>2006-11-24T09:09:27Z</dc:date>
    </item>
    <item>
      <title>Wenn wir schon oT sind:</title>
      <link>http://forum.geizhals.at/t459858,3793590.html#3793590</link>
      <description>Wird jedenfalls ein spannender Umstieg für Javianer....&lt;br&gt;&lt;br&gt;32bit waren beim Beginn vom Java eh super... Nur sollten neue JavaVMs schön langsam echt 64bit schaffen.&lt;br&gt;Ich bin ja gespannt, wie das gelöst wird - oder wie es gelöst wurde, so ich es verpennt habe.&lt;br&gt;&lt;br&gt;Denn daß eine 32bit-VM via Serialisierung seine Klassen einer 64bit-VM liefert, kann man sich ja noch "leichter" vorstellen... Andersrum ists sicher doppelt so schwer. Wird sicher eine Herausforderung für Sun - und die Entwickler, aber sicher auch spannend und lehrreich... *freu*&lt;br&gt;&lt;br&gt;Was sagst eigentlich zur 6er-VM ? Also zum RC.... Schon eingelesen, was kommt ?&lt;br&gt;Zu meiner Schande muß ich gestehen, daß ich fix nur auf 1.4 baue... Portabel und so... Scheint so, als obs nun einiges zum Nachstrabern gibt &lt;img src="zwinker.gif" width="16" height="19" align="absmiddle" alt=";-)"/&gt;.&lt;br&gt;&lt;br&gt;Angeblich sind ja generics nun fix drinnen - oder kam das schon mit der 5er ???&lt;br/&gt;</description>
      <pubDate>Fri, 24 Nov 2006 09:06:24 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3793590.html#3793590</guid>
      <dc:creator>Linux_Sucks</dc:creator>
      <dc:date>2006-11-24T09:06:24Z</dc:date>
    </item>
    <item>
      <title>Re(10): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3793593.html#3793593</link>
      <description>&gt;AFAIK schaffst nicht einmal 3GB&lt;br&gt;&lt;br&gt;Mehr als 2600M konnte ich der VM nicht mitgeben, obwohl ich 4GB zur Verfügung habe.&lt;br&gt;&lt;br&gt;Ich hoffe eher, daß der neue Ansatz (&lt;a href="http://forum.geizhals.at/t459858,3793571.html#3793571" rel="noopener" target="_blank"&gt;http:/&lt;wbr/&gt;/&lt;wbr/&gt;forum.geizhals.at/&lt;wbr/&gt;t459858,3793571.html#3793571&lt;/a&gt; ) fruchten wird. Parsen zweier langer Char[] (geht in wenigen Sekunden und braucht kaum Speicher) und gegen Ende des Programms nochmal die Indizes dazu besorgen... bis dahin kann ich eventuell auch die Char[] Größe reduzieren.&lt;br/&gt;</description>
      <pubDate>Fri, 24 Nov 2006 09:05:28 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3793593.html#3793593</guid>
      <dc:creator>m3t4tr0n</dc:creator>
      <dc:date>2006-11-24T09:05:28Z</dc:date>
    </item>
    <item>
      <title>Re(10): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3793586.html#3793586</link>
      <description>&gt;AFAIK schaffst nicht einmal 3GB&lt;br&gt;&lt;br&gt;Mehr als 2700M konnte ich der VM nicht mitgeben, obwohl ich 4GB zur Verfügung habe.&lt;br&gt;&lt;br&gt;Ich hoffe eher, daß der neue Ansatz (&lt;a href="http://forum.geizhals.at/t459858,3793571.html#3793571" rel="noopener" target="_blank"&gt;http:/&lt;wbr/&gt;/&lt;wbr/&gt;forum.geizhals.at/&lt;wbr/&gt;t459858,3793571.html#3793571&lt;/a&gt; ) fruchten wird. Parsen zweier langer Char[] (geht in wenigen Sekunden und braucht kaum Speicher) und gegen Ende des Programms nochmal die Indizes dazu besorgen... bis dahin kann ich eventuell auch die Char[] Größe reduzieren.&lt;br/&gt;</description>
      <pubDate>Fri, 24 Nov 2006 09:05:28 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3793586.html#3793586</guid>
      <dc:creator>m3t4tr0n</dc:creator>
      <dc:date>2006-11-24T09:05:28Z</dc:date>
    </item>
    <item>
      <title>Re(15): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3793574.html#3793574</link>
      <description>&gt;Keine Ahnung ob es da schon was gibt. 64bit OS sind afaik nicht so verbreitet.&lt;br&gt;Thema Numbercrunching, große Daten, ... Kenne ich echt kein 32bit-OS im Produktiveinsatz....&lt;br&gt;Wir verwenden da rein Unixoide... AIX, Linux, Solaris, ... sogar zOS ist ja inzwischen Thema Daten 64bittig...&lt;br&gt;&lt;br&gt;64bitOS sind IMHO, AFAIK, ... absoluter Standard - ausgenommen Homeuser.&amp;nbsp;&amp;nbsp;Als Daumenregel würde ich mal annehmen, daß ab 2-3GB Ram ein 64bit-OS absolut sinnvoll ist... und sei es nur um sinnvoll swappen zu können &lt;img src="zwinker.gif" width="16" height="19" align="absmiddle" alt=";-)"/&gt;. Aber ist ein bißchen oT... Er hat jedenfalls eines.&lt;br/&gt;</description>
      <pubDate>Fri, 24 Nov 2006 09:00:30 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3793574.html#3793574</guid>
      <dc:creator>Linux_Sucks</dc:creator>
      <dc:date>2006-11-24T09:00:30Z</dc:date>
    </item>
    <item>
      <title>Re(2): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3793571.html#3793571</link>
      <description>&gt;Musst du echt den ganzen Datenbestand im Speicher haben? &lt;br&gt;&gt;Wie willst danach drauf zugreifen?&lt;br&gt;&lt;br&gt;Ja, aber wie ich mittlerweile festgestellt habe, nicht die komplette Tupelinformation.&lt;br&gt;&lt;br&gt;Ersatzlösung ist es jetzt, die einzelnen Tupelinformationen in getrennten Parsedurchgängen zu besorgen, wenn sie benötigt werden - die Laufzeit leidet zwar ein wenig darunter, aber die ist vorerst auch nicht so wichtig.&lt;br&gt;&lt;br&gt;&gt;Noch was: Wieviele Datensätze (Tupel) sind das?&lt;br&gt;&lt;br&gt;Zwischen 150 Mio. und 20 Mio.&lt;br/&gt;</description>
      <pubDate>Fri, 24 Nov 2006 08:59:49 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3793571.html#3793571</guid>
      <dc:creator>m3t4tr0n</dc:creator>
      <dc:date>2006-11-24T08:59:49Z</dc:date>
    </item>
    <item>
      <title>Re(2): nun ... doch...</title>
      <link>http://forum.geizhals.at/t459858,3793564.html#3793564</link>
      <description>Wenn die Vorgabe Java ist, ist es eh außer Diskussion... Für mich wirkte es so, als ob es keine Vorgabe gibt und er es auch in C lösen könnte... &lt;br&gt;&lt;br&gt;Welchen Flamewar hab ich übrigens verpaßt ?&lt;br/&gt;</description>
      <pubDate>Fri, 24 Nov 2006 08:57:08 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3793564.html#3793564</guid>
      <dc:creator>Linux_Sucks</dc:creator>
      <dc:date>2006-11-24T08:57:08Z</dc:date>
    </item>
    <item>
      <title>Re(2): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3793563.html#3793563</link>
      <description>&gt;Schon mal überlegt das ganze in C zu schreiben?&lt;br&gt;&lt;br&gt;Hab Java als Projektvorgabe... man würde mich würgen, würde ich jetzt C in den Raum werfen (auch wenn alle ähnlichen Projekte bisher in C geschrieben worden sind...). &lt;img src="teeth.gif" width="16" height="19" align="absmiddle" alt="|-D"/&gt;&lt;br/&gt;</description>
      <pubDate>Fri, 24 Nov 2006 08:56:50 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3793563.html#3793563</guid>
      <dc:creator>m3t4tr0n</dc:creator>
      <dc:date>2006-11-24T08:56:50Z</dc:date>
    </item>
    <item>
      <title>Re: nun ... doch...</title>
      <link>http://forum.geizhals.at/t459858,3793553.html#3793553</link>
      <description>Sry, nach dem Flamewar gestern hab ich entschieden, mich hier nicht mehr auf Diskussionen einzulassen &lt;img src="smile.gif" width="16" height="19" align="absmiddle" alt=":)"/&gt; Seine Anforderung/Vorgabe scheint Java zu sein, deshalb sind Diskussionen über C/C++ für micht nicht zielführend.&lt;br/&gt;</description>
      <pubDate>Fri, 24 Nov 2006 08:53:45 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3793553.html#3793553</guid>
      <dc:creator>Nagelfar</dc:creator>
      <dc:date>2006-11-24T08:53:45Z</dc:date>
    </item>
    <item>
      <title>Re(13): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3793548.html#3793548</link>
      <description>4 Gig VIRTUAL Memory sind nicht so unüblich... Und wir reden ja von seinem speziellen Fall... Und nur um den geht's &lt;img src="zwinker.gif" width="16" height="19" align="absmiddle" alt=";-)"/&gt;&lt;br&gt;&lt;br&gt;Ich habe keine Ahnung, ob es inzwischen eine JavaVM gibt, in der man die Heapsize auf 64bit-Werte setzen kann, also zB 10GB (denn das hätte ihm ja sofort geholfen), vermute allerdings nein... Denn ab dann stelle ich mir Serialisierung von Objekten stressiger vor (wenn die serialisierten Objekte einer 32bit-VM unterschiedliche Referenzgrößen haben als bei einer 64bit-VM).&lt;br/&gt;</description>
      <pubDate>Fri, 24 Nov 2006 08:51:50 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3793548.html#3793548</guid>
      <dc:creator>Linux_Sucks</dc:creator>
      <dc:date>2006-11-24T08:51:50Z</dc:date>
    </item>
    <item>
      <title>nun ... doch...</title>
      <link>http://forum.geizhals.at/t459858,3793541.html#3793541</link>
      <description>&gt;Eben und net schon wieder Java ist langsam, gell &lt;br&gt;&lt;br&gt;Bei reinem number-Crunching muß es langsam sein (ne VM hat ja so einiges zu tun &lt;img src="zwinker.gif" width="16" height="19" align="absmiddle" alt=";-)"/&gt; ).&lt;br&gt;Ich bin bei Dir, daß in der Regel Programme eh auf Eingaben warten, mir ist auch klar, daß _angeblich_ Javadatenbanken wie Derby eine recht gute Performance haben...&lt;br&gt;&lt;br&gt;Trotz allem würde ich bei CPU-Bound programmen auch C bevorzugen. Wobei es AFAIK ja auch einen Compiler Java-NativeCode gibt, der net so schlecht sein soll - dann wäre es wieder ok.&lt;br&gt;&lt;br&gt;Ich würde also behaupten, daß das Vorurteil "Java ist grundsätzlich langsam" falsch ist - genauso aber auch das Vorurteil "Java ist eh immer gleich schnell wie C, ..." &lt;img src="zwinker.gif" width="16" height="19" align="absmiddle" alt=";-)"/&gt;&lt;br&gt;&lt;br&gt;Ich vermute, daß sein Proggy, daß mehrfach 70 Mio Tupel aggregiert/analysiert/... durchaus CPU-Bound sein könnte... Also sowohl aus dem Eck als auch wegen der Memory-Limits wäre Java vermutlich in diesem Fall nicht meine erste Wahl.&lt;br/&gt;</description>
      <pubDate>Fri, 24 Nov 2006 08:48:29 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3793541.html#3793541</guid>
      <dc:creator>Linux_Sucks</dc:creator>
      <dc:date>2006-11-24T08:48:29Z</dc:date>
    </item>
    <item>
      <title>Re(11): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3793528.html#3793528</link>
      <description>Nun ja... Er hatte in seinem Eröffnungspost geschrieben, daß er auf einem 64bit-OS entwickelt...&lt;br&gt;Damit kann man es - notfalls - mit SWAP lösen. Ist zwar nicht die super-Performante Lösung, aber besser die zweitbeste Lösung jetzt als die beste nie (klingt auch nach einem Java-kompatiblen Motto &lt;img src="zwinker.gif" width="16" height="19" align="absmiddle" alt=";-)"/&gt; )&lt;br/&gt;</description>
      <pubDate>Fri, 24 Nov 2006 08:43:03 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3793528.html#3793528</guid>
      <dc:creator>Linux_Sucks</dc:creator>
      <dc:date>2006-11-24T08:43:03Z</dc:date>
    </item>
    <item>
      <title>Re(9): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3793519.html#3793519</link>
      <description>Ahem... Nein &lt;img src="zwinker.gif" width="16" height="19" align="absmiddle" alt=";-)"/&gt;.&lt;br&gt;&lt;br&gt;Zumindest AFAIK bei Java... Denn du kommst ja auch bei einem 64bit-OS net über die 4GB-Grenze drüber (AFAIK schaffst nicht einmal 3GB).&lt;br&gt;&lt;br&gt;Bei C wäre es relativ wurscht - 64bit-Memoryzugriffe sind da Streßfrei.&lt;br&gt;&lt;br/&gt;</description>
      <pubDate>Fri, 24 Nov 2006 08:39:56 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3793519.html#3793519</guid>
      <dc:creator>Linux_Sucks</dc:creator>
      <dc:date>2006-11-24T08:39:56Z</dc:date>
    </item>
    <item>
      <title>Re(7): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3793444.html#3793444</link>
      <description>Naja, er hatte ja schon mal nen memory out Error, wenn er es mit weniger xmx startet!&lt;br&gt;&lt;br&gt;&lt;br&gt;Von daher würde ich den C weg schon mal überlegen!&lt;br&gt;&lt;br&gt;Obs jetzt wirklich schneller ist, sei mal dahingestellt!&lt;br&gt;&lt;br&gt;Vorteil ist jener, das C Programme ja nicht mit irgendeinem Speicherlimit (außer dem Speicher selbst) gestartet werden!&lt;br/&gt;</description>
      <pubDate>Fri, 24 Nov 2006 08:07:57 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3793444.html#3793444</guid>
      <dc:creator>thE</dc:creator>
      <dc:date>2006-11-24T08:07:57Z</dc:date>
    </item>
    <item>
      <title>Re(5): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3793409.html#3793409</link>
      <description>Ich bin Java Programmierer&amp;nbsp;&amp;nbsp;^^&lt;br&gt;&lt;br&gt;Und würde sowas trotzdem mit C machen (okay ich bin auch C/C++ Entwickler &lt;img src="tongue.gif" width="16" height="19" align="absmiddle" alt=":P"/&gt;)&lt;br/&gt;</description>
      <pubDate>Fri, 24 Nov 2006 07:39:06 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3793409.html#3793409</guid>
      <dc:creator>thE</dc:creator>
      <dc:date>2006-11-24T07:39:06Z</dc:date>
    </item>
    <item>
      <title>Re(3): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3793384.html#3793384</link>
      <description>Den java.lang.memory Error hätte er nicht mehr &lt;img src="zwinker.gif" width="16" height="19" align="absmiddle" alt=";)"/&gt;&lt;br&gt;&lt;br&gt;Achja und schneller wirds auch sein!&lt;br/&gt;</description>
      <pubDate>Fri, 24 Nov 2006 07:16:27 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3793384.html#3793384</guid>
      <dc:creator>thE</dc:creator>
      <dc:date>2006-11-24T07:16:27Z</dc:date>
    </item>
    <item>
      <title>Re(2): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3793041.html#3793041</link>
      <description>&lt;a href="http://forum.geizhals.at/t459858,3792417.html#3792417" rel="noopener" target="_blank"&gt;http:/&lt;wbr/&gt;/&lt;wbr/&gt;forum.geizhals.at/&lt;wbr/&gt;t459858,3792417.html#3792417&lt;/a&gt; &lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 21:18:57 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3793041.html#3793041</guid>
      <dc:creator>Linux_Sucks</dc:creator>
      <dc:date>2006-11-23T21:18:57Z</dc:date>
    </item>
    <item>
      <title>Re: Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792985.html#3792985</link>
      <description>Was soll dann nachher mit dem Tupel[] passieren? Musst du echt den ganzen Datenbestand im Speicher haben? Wie willst danach drauf zugreifen? Hast eine Vorgabe bezüglich Laufzeit?&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 21:00:48 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792985.html#3792985</guid>
      <dc:creator>Robert Craven</dc:creator>
      <dc:date>2006-11-23T21:00:48Z</dc:date>
    </item>
    <item>
      <title>Re: Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792990.html#3792990</link>
      <description>Was soll dann nachher mit dem Tupel[] passieren? Musst du echt den ganzen Datenbestand im Speicher haben? Wie willst danach drauf zugreifen? Hast eine Vorgabe bezüglich Laufzeit?&lt;br&gt;&lt;br&gt;Noch was: Wieviele Datensätze (Tupel) sind das?&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 21:00:48 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792990.html#3792990</guid>
      <dc:creator>Robert Craven</dc:creator>
      <dc:date>2006-11-23T21:00:48Z</dc:date>
    </item>
    <item>
      <title>Re: Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792954.html#3792954</link>
      <description>Nur so ne Frage, was machst du mit den Daten dann?&lt;br&gt;&lt;br&gt;Schon mal überlegt das ganze in C zu schreiben?&lt;br&gt;&lt;br&gt;Einhängen in eine Liste (zB eine von der STL) und file einlesen ist in c auch net so schwer!&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 20:49:32 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792954.html#3792954</guid>
      <dc:creator>thE</dc:creator>
      <dc:date>2006-11-23T20:49:32Z</dc:date>
    </item>
    <item>
      <title>Re(10): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792517.html#3792517</link>
      <description>&gt;Ich würde sagen - probier mal die Lösung ohne ArrayList, &lt;br&gt;&gt;wirklich nur ein Array fester Größe und gut ists. &lt;br&gt;&lt;br&gt;Hat leider nichts gebracht. Ich hab inzwischen den Typen "Tupel" auf zwei byte und keine Integer beschränkt - siehe da, es läuft annehmbar mit ArrayList/Vector oder Array fester länge. Mein Ziel scheint es also wirklich zu sein, die Anzahl an Objekten zu reduzieren.&lt;br&gt;&lt;br&gt;Wenn das reine Parsen schon so speicherfressend ist, graut mir schon vor der eigentlichen Aufgabe mit den Daten. &lt;img src="teeth.gif" width="16" height="19" align="absmiddle" alt="|-D"/&gt;&lt;br&gt;&lt;br&gt;Danke jedenfalls für deine Ratschläge. &lt;img src="smile.gif" width="16" height="19" align="absmiddle" alt=":)"/&gt;&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 17:20:26 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792517.html#3792517</guid>
      <dc:creator>m3t4tr0n</dc:creator>
      <dc:date>2006-11-23T17:20:26Z</dc:date>
    </item>
    <item>
      <title>Re(8): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792472.html#3792472</link>
      <description>Werd ich mir alles mal ansehen - ich bin ja jetzt ordentlich mit Vorschlägen überhäuft worden.&lt;br&gt;&lt;br&gt;Danke an alle, die sich meiner annehmen! &lt;img src="teeth.gif" width="16" height="19" align="absmiddle" alt="|-D"/&gt;&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 16:53:31 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792472.html#3792472</guid>
      <dc:creator>m3t4tr0n</dc:creator>
      <dc:date>2006-11-23T16:53:31Z</dc:date>
    </item>
    <item>
      <title>Re(7): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792442.html#3792442</link>
      <description>Ach ja, eines muß ich noch reinwerfen...&lt;br&gt;&lt;br&gt;Du baust also &lt;br&gt; - einen Parser&lt;br&gt; - mit fixem "Alphabet"&lt;br&gt; - mit definierten Aktionen, die er treffen soll, wenn definierte Folgen auftreten...&lt;br&gt;&lt;br&gt;Wieso höre ich in meinem Hinterkopf Flex/Yacc-Rufe ??? Wäre das möglich ??? &lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 16:38:41 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792442.html#3792442</guid>
      <dc:creator>Linux_Sucks</dc:creator>
      <dc:date>2006-11-23T16:38:41Z</dc:date>
    </item>
    <item>
      <title>Re(6): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792438.html#3792438</link>
      <description>Also abgesehen von der MySQL würde ich es auch so sehen...&lt;br&gt;&lt;br&gt;Wobei Java+DB... Wüste Designpatterns ahead &lt;img src="zwinker.gif" width="16" height="19" align="absmiddle" alt=";-)"/&gt;... Nachdem er nun nicht so viel Coded (so seine Worte)... &lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 16:34:46 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792438.html#3792438</guid>
      <dc:creator>Linux_Sucks</dc:creator>
      <dc:date>2006-11-23T16:34:46Z</dc:date>
    </item>
    <item>
      <title>Re(5): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792435.html#3792435</link>
      <description>um den aufwand zu minimieren würde ich allerdings einfach jedes einzelne tuppel in eine mysql-datenbank schmeissen, dann liese sich auch schön abfragen und man müßte sich um die implementierung nicht mehr kümmern.&lt;br&gt;&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 16:33:50 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792435.html#3792435</guid>
      <dc:creator>bneu</dc:creator>
      <dc:date>2006-11-23T16:33:50Z</dc:date>
    </item>
    <item>
      <title>Re(7): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792433.html#3792433</link>
      <description>Weil du schon bei DB warst... Wäre es net sinnvoller, alles in einer DB zu halten ?&lt;br&gt;&lt;br&gt;Andere Frage:&lt;br&gt;1.) Du hast also (anonymisiert) ein Alphabet mit den Werten A,B,C,D,a,b,c,d... sind die Case-sensitive ? Könnte also das Bitmuster-speichern nicht echt ordentlich helfen ?&lt;br&gt;&lt;br&gt;2.) Du erzeugst einfach zu viele Objekte... Also Referenzen. Könntest du nicht einfach die Zeilen speichern ? Und eine Methode providen, die dir auf die Zeile ein Tupel zurückliefert, daß du gleich nach Verwendung wegwirfst ? Wäre langsamer aber Mem-schonender&lt;br&gt;&lt;br&gt;3.) Brauchst du 100%ig alle Tupel ? Oder kannst du die Relevanten werte nicht aufaggregieren ?&lt;br&gt;Beispiel: Wenn du Durchschnittswerte berechnen willst, kannst entweder alle Werte addieren und durch die Anzahl dividieren (=der einfache aber "teure" Ansatz... Denn dann mußt alle Werte speichern) - oder immer nur den Durchschnitt speichern und jeden neuen Wert gewichtet dazu"durchschnitten"... dann mußt dir nur die aktuelle Position und den bisherigen Durchschnitt merken - also fix 2 Werte, egal ob du den Durchschnitt über 10 oder 10 Mio werte baust...&lt;br&gt;&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 16:32:39 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792433.html#3792433</guid>
      <dc:creator>Linux_Sucks</dc:creator>
      <dc:date>2006-11-23T16:32:39Z</dc:date>
    </item>
    <item>
      <title>Re(7): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792436.html#3792436</link>
      <description>Weil du schon bei DB warst... Wäre es net sinnvoller, alles in einer DB zu halten ?&lt;br&gt;&lt;br&gt;Andere Frage:&lt;br&gt;1.) Du hast also (anonymisiert) ein Alphabet mit den Werten A,B,C,D,a,b,c,d... sind die Case-sensitive ? Könnte also das Bitmuster-speichern nicht echt ordentlich helfen ?&lt;br&gt;&lt;br&gt;2.) Du erzeugst einfach zu viele Objekte... Also Referenzen. Könntest du nicht einfach die Zeilen speichern ? Und eine Methode providen, die dir auf die Zeile ein Tupel zurückliefert, daß du gleich nach Verwendung wegwirfst ? Wäre langsamer aber Mem-schonender&lt;br&gt;&lt;br&gt;3.) Brauchst du 100%ig alle Tupel ? Oder kannst du die Relevanten werte nicht aufaggregieren ?&lt;br&gt;Beispiel: Wenn du Durchschnittswerte berechnen willst, kannst entweder alle Werte addieren und durch die Anzahl dividieren (=der einfache aber "teure" Ansatz... Denn dann mußt alle Werte speichern) - oder immer nur den Durchschnitt speichern und jeden neuen Wert gewichtet dazu"durchschnitten"... dann mußt dir nur die aktuelle Position und den bisherigen Durchschnitt merken - also fix 2 Werte, egal ob du den Durchschnitt über 10 oder 10 Mio werte baust...&lt;br&gt;&lt;br&gt;EDIT:&lt;br&gt;4.) Eines noch: Kann es sein, daß es nur fixe Wertfolgen gibt ? Daß zB AB nicht möglich ist, BA aber schon ? Dann könntest in einem char vielleicht die "Gruppe" speichern, also "AB"=&gt;1, "AC"=&gt;2, ... &lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 16:32:39 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792436.html#3792436</guid>
      <dc:creator>Linux_Sucks</dc:creator>
      <dc:date>2006-11-23T16:32:39Z</dc:date>
    </item>
    <item>
      <title>Re(5): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792432.html#3792432</link>
      <description>char = 2x bytes&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 16:30:09 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792432.html#3792432</guid>
      <dc:creator>nergal</dc:creator>
      <dc:date>2006-11-23T16:30:09Z</dc:date>
    </item>
    <item>
      <title>Re(4): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792430.html#3792430</link>
      <description>Ich komm beim Index grad mal mit gut Integer aus. &lt;img src="teeth.gif" width="16" height="19" align="absmiddle" alt="|-D"/&gt;&lt;br&gt;&lt;br&gt;Und Char hat doch Bytegröße?&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 16:29:43 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792430.html#3792430</guid>
      <dc:creator>m3t4tr0n</dc:creator>
      <dc:date>2006-11-23T16:29:43Z</dc:date>
    </item>
    <item>
      <title>Re(8): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792429.html#3792429</link>
      <description>Nein. toArray benötigt dieses leere Array, sonst wandelt er mir die ArrayList nicht um, aber das scheint nun eh hinfällig geworden zu sein.&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 16:28:49 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792429.html#3792429</guid>
      <dc:creator>m3t4tr0n</dc:creator>
      <dc:date>2006-11-23T16:28:49Z</dc:date>
    </item>
    <item>
      <title>Re(3): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792426.html#3792426</link>
      <description>Und mit 'byte' für alle drei Parameter kommst Du nicht über die Runden? Wäre eine deutliche Ersparnis!&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 16:27:40 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792426.html#3792426</guid>
      <dc:creator>nergal</dc:creator>
      <dc:date>2006-11-23T16:27:40Z</dc:date>
    </item>
    <item>
      <title>Re(6): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792420.html#3792420</link>
      <description>Wenn er eine Leerzeile hat, überprüft er, ob über haupt noch was kommt, oder noch eine Leerzeile - wenn dem so ist, dann mach ich aus meiner ArrayList ein Array - das geht so weit ich weiß nur über diesen Weg. Tupel[0] würde mir ja nicht das zurüggeben, was ich will. &lt;img src="smile.gif" width="16" height="19" align="absmiddle" alt=":)"/&gt;&lt;br&gt;&lt;br&gt;Der Teil ist auch noch nicht so... naja... &lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 16:22:56 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792420.html#3792420</guid>
      <dc:creator>m3t4tr0n</dc:creator>
      <dc:date>2006-11-23T16:22:56Z</dc:date>
    </item>
    <item>
      <title>Re(11): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792417.html#3792417</link>
      <description>Hab grad nachzählen lassen - sind nur 79 Mio Tupel. &lt;img src="teeth.gif" width="16" height="19" align="absmiddle" alt="|-D"/&gt;&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 16:19:19 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792417.html#3792417</guid>
      <dc:creator>m3t4tr0n</dc:creator>
      <dc:date>2006-11-23T16:19:19Z</dc:date>
    </item>
    <item>
      <title>Re(6): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792415.html#3792415</link>
      <description>Das Problem ist, daß ich zu weiteren Berechnungen wieder alle Tupel brauche - is a Krux. &lt;img src="teeth.gif" width="16" height="19" align="absmiddle" alt="|-D"/&gt;&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 16:18:06 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792415.html#3792415</guid>
      <dc:creator>m3t4tr0n</dc:creator>
      <dc:date>2006-11-23T16:18:06Z</dc:date>
    </item>
    <item>
      <title>Re(4): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792412.html#3792412</link>
      <description>Guter Ansatz...&lt;br&gt;&lt;br&gt;Bei einem 4-Bit-Alphabet könnte er als Kompromiß noch immer 50% sparen und trotzdem einfach operieren...&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 16:16:56 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792412.html#3792412</guid>
      <dc:creator>Linux_Sucks</dc:creator>
      <dc:date>2006-11-23T16:16:56Z</dc:date>
    </item>
    <item>
      <title>Re(2): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792411.html#3792411</link>
      <description>&gt;Sourcecode für die TupelKlasse &lt;br&gt;&lt;br&gt;&lt;br&gt;&lt;div class=code&gt;&lt;pre&gt;Tupel(char a, int positionA, char b, int positionB){&#xD;
		this.a = a;&#xD;
		this.b = b;&#xD;
		this.posA = positionA;&#xD;
		this.posB = positionB;&#xD;
	}&lt;/pre&gt;&lt;/div&gt;&lt;br&gt;&lt;br&gt;Mehr gibts da nicht.&lt;br&gt;&lt;br&gt;&gt;hast dich schon mit einem Profiler&lt;br&gt;&lt;br&gt;Das steht als nächstes auf dem Plan. &lt;img src="cry.gif" width="16" height="19" align="absmiddle" alt=":~("/&gt;&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 16:16:34 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792411.html#3792411</guid>
      <dc:creator>m3t4tr0n</dc:creator>
      <dc:date>2006-11-23T16:16:34Z</dc:date>
    </item>
    <item>
      <title>Re(5): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792407.html#3792407</link>
      <description>Diese Tupelfolgen, die du erkennen willst... &lt;br&gt;Wäre es möglich, nur diese zu speichern ?&lt;br&gt;&lt;br&gt;Wäre es zB Denkbar, daß dein Algo so ungefähr so aussieht:&lt;br&gt;&lt;br&gt;Lies_10_Zeilen_ein&lt;br&gt;suche_tupel_in_den_10_zeilen_und_speicher_nur_diese();&lt;br&gt;&lt;br&gt;do {&lt;br&gt;&amp;nbsp;&amp;nbsp;schmeiß_eine_zeile_weg&lt;br&gt;&amp;nbsp;&amp;nbsp;lies_eine_dazu&lt;br&gt;&amp;nbsp;&amp;nbsp;ist_ein_tupel_in_der_letzten_zeile_dazugekommen()&lt;br&gt;}&lt;br&gt;while not eof&lt;br&gt;&amp;nbsp;&amp;nbsp; &lt;br&gt;Wo ich hinwill:&lt;br&gt;Scheinbar liest du alle Daten ein und arbeitest dann damit.&lt;br&gt;Was du aber "brauchst" ist mehr so ein streaming-Algo, der einfach ein paar Zeilen liest, interessante auswertet (und vielleicht gleich behandelt) - und praktisch nur das allerallernötigste Speichert...&lt;br&gt;&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 16:14:56 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792407.html#3792407</guid>
      <dc:creator>Linux_Sucks</dc:creator>
      <dc:date>2006-11-23T16:14:56Z</dc:date>
    </item>
    <item>
      <title>Re(10): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792396.html#3792396</link>
      <description>Hmmm.... AFAIK wird bei Array-Operationen immer kopiert... Hier zwar wohl shallow, aber trotzdem.. &lt;img src="flenn.gif" width="16" height="19" align="absmiddle" alt=";-("/&gt;.&lt;br&gt;&lt;br&gt;Trotz allem sind die 160 Mio Tupel sein Problem - AFAIK.&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 16:08:32 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792396.html#3792396</guid>
      <dc:creator>Linux_Sucks</dc:creator>
      <dc:date>2006-11-23T16:08:32Z</dc:date>
    </item>
    <item>
      <title>Re(3): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792385.html#3792385</link>
      <description>aber kommen außer a-d und A-D noch andere Zeichen vor? Sonst kommt man ja mit 3Bit je Zeichen aus und das sind immerhin 3/8 der Datenmenge.&lt;br&gt;&lt;br&gt;also statt 1,5gb nur&lt;br&gt;&lt;br&gt; 0,56gb&lt;br&gt;&lt;br&gt;&lt;br&gt;ist aber dann mit der kodierung im byte-array wesentlich umständlicher&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 16:02:09 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792385.html#3792385</guid>
      <dc:creator>bneu</dc:creator>
      <dc:date>2006-11-23T16:02:09Z</dc:date>
    </item>
    <item>
      <title>Re(2): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792362.html#3792362</link>
      <description>Dieses Tupel[] hätte bei meiner 160MB Datei einen Speicherbedarf von ~1.5GB - ich weiß nicht, wie ich dann die weiteren Operationen auf diesem Array durchführen soll. &lt;img src="sad.gif" width="16" height="19" align="absmiddle" alt=":("/&gt;&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 15:55:12 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792362.html#3792362</guid>
      <dc:creator>m3t4tr0n</dc:creator>
      <dc:date>2006-11-23T15:55:12Z</dc:date>
    </item>
    <item>
      <title>Re(4): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792353.html#3792353</link>
      <description>Das sind Teile eines Sequencealignments (DNA/Protein) - die sind leider so lang.&lt;br&gt;&lt;br&gt;Das Tupel brauch ich, da ich gewisse Tupelfolgen als "Signale" erkennen möchte und die Bewertung eben nur "pro Tupel" möglich ist.&lt;br&gt;&lt;br&gt;Die einzelnen Blöcke werden später als "ein Block" betrachet, allerdings liegen zwischen diesen Blöcken Indexsprünge und zusätzlich gibt es auch Stellen, an denen der Index nicht hochgezählt wird:&lt;br&gt;&lt;br&gt;&lt;br&gt;&lt;div class=code&gt;&lt;pre&gt;&#xD;
 1  2  3     4  5  6 | 18 19 20&#xD;
 A  B  C  -  B  C  A |  B  C  A&#xD;
 A  B  C  A  B  C  A |  B  -  A&#xD;
10 11 12 13 14 15 16 | 33    34&lt;/pre&gt;&lt;/div&gt;&lt;br&gt;&lt;br&gt;(Zwei Blöcke, die später als Tupelfolge verwendet werden soll(t)en.)&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 15:53:31 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792353.html#3792353</guid>
      <dc:creator>m3t4tr0n</dc:creator>
      <dc:date>2006-11-23T15:53:31Z</dc:date>
    </item>
    <item>
      <title>Re(4): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792377.html#3792377</link>
      <description>Das sind Teile eines Sequencealignments (DNA/Protein) - die sind leider so lang.&lt;br&gt;&lt;br&gt;Das Tupel brauch ich, da ich gewisse Tupelfolgen als "Signale" erkennen möchte und die Bewertung eben nur "pro Tupel" möglich ist.&lt;br&gt;&lt;br&gt;Die einzelnen Blöcke werden später als "ein Block" betrachet, allerdings liegen zwischen diesen Blöcken Indexsprünge und zusätzlich gibt es auch Stellen, an denen der Index nicht hochgezählt wird:&lt;br&gt;&lt;br&gt;&lt;br&gt;&lt;div class=code&gt;&lt;pre&gt;&#xD;
 1  2  3     4  5  6 | 18 19 20&#xD;
 A  B  C  -  B  C  A |  B  C  A&#xD;
 A  B  C  A  B  C  A |  B  -  A&#xD;
10 11 12 13 14 15 16 | 33    34&lt;/pre&gt;&lt;/div&gt;&lt;br&gt;&lt;br&gt;(Zwei Blöcke, die später als Tupelfolge verwendet werden soll(t)en.)&lt;br&gt;&lt;br&gt;Obs ne Möglichkeit wär, mir eine Menge möglicher Charkombinationen zu bestimmen und dann nur Referenzen zu speichern? Also wär dann ein Tupel 2 int + eine Referenz lang... sofern das was sparen würd. &lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 15:53:31 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792377.html#3792377</guid>
      <dc:creator>m3t4tr0n</dc:creator>
      <dc:date>2006-11-23T15:53:31Z</dc:date>
    </item>
    <item>
      <title>Re(3): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792327.html#3792327</link>
      <description>Nun ja...&lt;br&gt;&lt;br&gt;Du hast also ein 160MB-File. Wenn ich es richtig verstanden habe, merkst du Dir zu jedem Teil da drinnen 2 chars und 2 Ints - also 10 Bytes und den Objectheader... Krass viel.&lt;br&gt;&lt;br&gt;Die Frage ist, ob du das echt alles so brauchst... Oder ob du nicht dieselbe Aufgabe einfacher, eleganter und Platzsparender lösen könntest....&lt;br&gt;&lt;br&gt;Beispiel:&lt;br&gt;Angenommen, du merkst dir zu jedem Zeichen die X- und Y-Koordinate... Dann würde ich mir einen Array von Zeilen machen - und mit die Zeile/Spalte immer dynamisch holen anstatt alles vorab wegzuspeichern...&lt;br&gt;&lt;br&gt;Was machst denn genau mit den 160 Mio Tupeln ???&lt;br&gt;&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 15:42:18 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792327.html#3792327</guid>
      <dc:creator>Linux_Sucks</dc:creator>
      <dc:date>2006-11-23T15:42:18Z</dc:date>
    </item>
    <item>
      <title>Re: Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792288.html#3792288</link>
      <description>Warum serialisiert Du Tupel nicht und schreibst auf die Harddisk - natürlich nicht pro Tupel aber in Blöcken. Die kannst Du ja dann wieder einlesen in ein Array dessen Größe Du kennst!&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 15:34:08 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792288.html#3792288</guid>
      <dc:creator>nergal</dc:creator>
      <dc:date>2006-11-23T15:34:08Z</dc:date>
    </item>
    <item>
      <title>Re(9): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792260.html#3792260</link>
      <description>Ich habe den verdacht, dass die ArrayList ziemlichen Overhead erzeugt. Versuch die mal wegzulassen (ja, dann musst halt vorher mal schnell durchrennen, oder kann das nicht eh der BufferedReader sagen?).&lt;br&gt;&lt;br&gt;Kannst du Strings der Reihe nach in einem Array ablegen, oder sollen sie "logisch" voneinander getrennt sein?&lt;br&gt;&lt;br&gt;Ich würde sagen - probier mal die Lösung ohne ArrayList, wirklich nur ein Array fester Größe und gut ists. &lt;br&gt;&lt;br&gt;Was nämlich bei dem ToArray() passiert will ich mir gar nicht vorstellen - ich befürchte dass er da erst recht eine Kopie erstellen wird *graus*&lt;br&gt;&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 15:26:57 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792260.html#3792260</guid>
      <dc:creator>Somnatic</dc:creator>
      <dc:date>2006-11-23T15:26:57Z</dc:date>
    </item>
    <item>
      <title>Re(2): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792258.html#3792258</link>
      <description>Vector und Liste hatte ich grad getestet - da ist kein Unterschied spürbar. &lt;br&gt;&lt;br&gt;&gt;Anderer Punkt: Für jedes Byte da drin entstehen 12 Bytes+Objectheader ?&lt;br&gt;&gt;Brauchst du das echt so ??? Kannst du nicht stattdessen aggregierte &lt;br&gt;&gt;Zustände speichern ???&lt;br&gt;&lt;br&gt;Be easy on me - ich bin kein geübter Coder und muß deswegen fragen: Aggregierte Zuständ? Geht das in Richtung Datenbank?&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 15:26:43 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792258.html#3792258</guid>
      <dc:creator>m3t4tr0n</dc:creator>
      <dc:date>2006-11-23T15:26:43Z</dc:date>
    </item>
    <item>
      <title>Re: Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792241.html#3792241</link>
      <description>Hmmm... Habe mich da noch nicht viel befaßt, aber Array-Operationen sind per se mal net so super...&lt;br&gt;&lt;br&gt;Bist schon mal auf andere Collections-Klassen ausgewichen ? Vector basiert ja auf Arrays, aber vielleicht ist ja eine List weit besser in deinem Falle ???&lt;br&gt;&lt;br&gt;Anderer Punkt: Für jedes Byte da drin entstehen 12 Bytes+Objectheader ?&lt;br&gt;Brauchst du das echt so ??? Kannst du nicht stattdessen aggregierte Zustände speichern ??? &lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 15:21:03 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792241.html#3792241</guid>
      <dc:creator>Linux_Sucks</dc:creator>
      <dc:date>2006-11-23T15:21:03Z</dc:date>
    </item>
    <item>
      <title>Re(8): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792238.html#3792238</link>
      <description>Gut, die Integerzeile die über den Zeilen steht (besteht nur aus Anfangsidizes für jeweils eine der Zeilen) hab ich jetzt mal rausgelassen.&lt;br&gt;&lt;br&gt;3 5&lt;br&gt;ABCABCABCABC&lt;br&gt;ABCABCABCABC&lt;br&gt;&lt;br&gt;=&gt; Zeile 1 Zeichen 1 bekommt also Index 3 und Zeile 2 Zeichen 1 den Index 5 - und dann wird bis zum Ende des Blocks hochgezählt.&lt;br&gt;&lt;br&gt;&gt;Warum weisst du am Anfang nicht wieviele Zeilen es sind?&lt;br&gt;&lt;br&gt;Gut, ich könnte natürlich durch die Datei laufen und mir die Zeilenanzahl berechnen, aber spart das wirklich so viel Speicher? Wie gesagt, wenn ein Tupel 10x soviel Speicher benötigt, wie 2 Zeichen in der Datei, dann wird das ja auch bei einem Feld fester Länger ein großer Speicherbedarf. &lt;img src="schief.gif" width="16" height="19" align="absmiddle" alt=":-/"/&gt;&lt;br&gt;&lt;br&gt;Ich tendiere langsam wirklich dazu, das File irgendwie zu splitten - den die Performance bis zu einem bestimmten Zeitpunkt halte ich für recht gut.&amp;nbsp;&amp;nbsp;&lt;br&gt;&lt;br&gt;Dann müßte ich halt noch scharf nachdenken, wie es dann weitergeht. Ich möchte nur sicher sein, daß ich da keine groben Schnitzer drinnen habe, die das Problem bringen, oder ob das Problem einfach von der Datenmenge her rührt.&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 15:19:15 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792238.html#3792238</guid>
      <dc:creator>m3t4tr0n</dc:creator>
      <dc:date>2006-11-23T15:19:15Z</dc:date>
    </item>
    <item>
      <title>Re(7): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792200.html#3792200</link>
      <description>Also es sind immer 2 Zeilen, die zusammengehören?&lt;br&gt;&lt;br&gt;Wie sind da die Integers drin?&lt;br&gt;&lt;br&gt;Warum weisst du am Anfang nicht wieviele Zeilen es sind?&lt;br&gt;&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 15:10:03 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792200.html#3792200</guid>
      <dc:creator>Somnatic</dc:creator>
      <dc:date>2006-11-23T15:10:03Z</dc:date>
    </item>
    <item>
      <title>Re(6): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792193.html#3792193</link>
      <description>Oh - Mistverständnis. &lt;img src="smile.gif" width="16" height="19" align="absmiddle" alt=":)"/&gt;&lt;br&gt;&lt;br&gt;B:&lt;br&gt;&lt;div class=code&gt;&lt;pre&gt;AbbAcDcA&#xD;
ABBACDCa&#xD;
&#xD;
AbbAcDcAABBACDCa&#xD;
AbbAcDcAABBACDCa&#xD;
&#xD;
AbbAcDcAABBACDCaAbbAcDcAABBACDCa&#xD;
AbbAcDcAABBACDCaAbbAcDcAABBACDCa&#xD;
&#xD;
AbbAcDcAABBACDCa&#xD;
AbbAcDcAABBACDCa&#xD;
&#xD;
AbbAcDcAABBACDCaAbbAcDcAABBACDCaAbbAcDcAABBACDCa&#xD;
AbbAcDcAABBACDCaAbbAcDcAABBACDCaAbbAcDcAABBACDCa&#xD;
&#xD;
&lt;/pre&gt;&lt;/div&gt;&lt;br&gt;&lt;br&gt;Wobei das nicht wirklich immer Wiederholungen sind, das Alphabet größer und eben unterschiedlich viele "Blöcke".&lt;br&gt;&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 15:07:16 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792193.html#3792193</guid>
      <dc:creator>m3t4tr0n</dc:creator>
      <dc:date>2006-11-23T15:07:16Z</dc:date>
    </item>
    <item>
      <title>Re(6): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792194.html#3792194</link>
      <description>Oh - Mistverständnis. &lt;img src="smile.gif" width="16" height="19" align="absmiddle" alt=":)"/&gt;&lt;br&gt;&lt;br&gt;ZB:&lt;br&gt;&lt;div class=code&gt;&lt;pre&gt;AbbAcDcA&#xD;
ABBACDCa&#xD;
&#xD;
AbbAcDcAABBACDCa&#xD;
AbbAcDcAABBACDCa&#xD;
&#xD;
AbbAcDcAABBACDCaAbbAcDcAABBACDCa&#xD;
AbbAcDcAABBACDCaAbbAcDcAABBACDCa&#xD;
&#xD;
AbbAcDcAABBACDCa&#xD;
AbbAcDcAABBACDCa&#xD;
&#xD;
AbbAcDcAABBACDCaAbbAcDcAABBACDCaAbbAcDcAABBACDCa&#xD;
AbbAcDcAABBACDCaAbbAcDcAABBACDCaAbbAcDcAABBACDCa&#xD;
&#xD;
&lt;/pre&gt;&lt;/div&gt;&lt;br&gt;&lt;br&gt;Wobei das nicht wirklich immer Wiederholungen sind, das Alphabet größer und eben unterschiedlich viele "Blöcke".&lt;br&gt;&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 15:07:16 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792194.html#3792194</guid>
      <dc:creator>m3t4tr0n</dc:creator>
      <dc:date>2006-11-23T15:07:16Z</dc:date>
    </item>
    <item>
      <title>Re(3): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792186.html#3792186</link>
      <description>&lt;blockquote&gt;&lt;em&gt; Ich hab eben keinen Plan, wie ich das alternativ machen kann.&lt;br&gt;&lt;/em&gt;&lt;/blockquote&gt;&lt;br&gt;Stückerlweise &lt;img src="smile.gif" width="16" height="19" align="absmiddle" alt=":)"/&gt;&lt;br&gt;&lt;br&gt;Kommt halt drauf an was du nacher damit anstellen willst &lt;img src="smile.gif" width="16" height="19" align="absmiddle" alt=":)"/&gt;&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 15:04:38 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792186.html#3792186</guid>
      <dc:creator>Somnatic</dc:creator>
      <dc:date>2006-11-23T15:04:38Z</dc:date>
    </item>
    <item>
      <title>Re(2): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792184.html#3792184</link>
      <description>Das ToArray wird erst am Schluß ausgeführt - das könnte dann die nächste Baustelle sein, ist mir auch klar geworden, aber so weit komm ich eben gar nicht erst.&lt;br&gt;&lt;br&gt;&gt;generell solltest vielleicht das kozept, das ganze file in den speicher zu lesen, &lt;br&gt;&gt;überdenken...&lt;br&gt;&lt;br&gt;Ich hab eben keinen Plan, wie ich das alternativ machen kann.&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 15:04:03 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792184.html#3792184</guid>
      <dc:creator>m3t4tr0n</dc:creator>
      <dc:date>2006-11-23T15:04:03Z</dc:date>
    </item>
    <item>
      <title>Re(5): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792183.html#3792183</link>
      <description>ähm .. ich meinte eher die datei, die du einliest &lt;img src="smile.gif" width="16" height="19" align="absmiddle" alt=":)"/&gt;&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 15:03:43 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792183.html#3792183</guid>
      <dc:creator>Somnatic</dc:creator>
      <dc:date>2006-11-23T15:03:43Z</dc:date>
    </item>
    <item>
      <title>Re(4): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792171.html#3792171</link>
      <description>&lt;br&gt;&lt;div class=code&gt;&lt;pre&gt;&#xD;
try {&#xD;
	br = new BufferedReader(new FileReader(new File(fileName)));&#xD;
			&#xD;
	// while buffer not empty&#xD;
	while (br.ready()){&#xD;
&#xD;
		// discard empty lines, multiple empty lines are handled as EOF&#xD;
		check = br.readLine();&#xD;
		while (check.length()==0){ &#xD;
			if(br.ready()){&#xD;
				check = br.readLine();&#xD;
			}else{&#xD;
				// make a tupel array&#xD;
				tupels = al.toArray(new Tupel[0]);&#xD;
				//return the tupel array&#xD;
				return tupels;					}&#xD;
		}&#xD;
&#xD;
		partA = br.readLine().toLowerCase();&#xD;
		partB = br.readLine().toLowerCase();&#xD;
		&#xD;
		// put both chars at position i as a tupel into the array list&#xD;
		for (int i = 0; i &amp;lt; partA.length(); i++){			                    &#xD;
			// create new tupel and add to arraylist&#xD;
			Tupel tup = new Tupel(...);&#xD;
			al.add(tup);	&#xD;
		}&#xD;
}&#xD;
} catch ...&#xD;
	&#xD;
// make a tupel array&#xD;
tupels = vt.toArray(new Tupel[0]);&#xD;
// return tupel array&#xD;
return tupels;&lt;/pre&gt;&lt;/div&gt;&lt;br&gt;&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 15:00:53 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792171.html#3792171</guid>
      <dc:creator>m3t4tr0n</dc:creator>
      <dc:date>2006-11-23T15:00:53Z</dc:date>
    </item>
    <item>
      <title>Re(4): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792175.html#3792175</link>
      <description>&lt;br&gt;&lt;div class=code&gt;&lt;pre&gt;&#xD;
try {&#xD;
	br = new BufferedReader(new FileReader(new File(fileName)));&#xD;
			&#xD;
	// while buffer not empty&#xD;
	while (br.ready()){&#xD;
&#xD;
		// discard empty lines, multiple empty lines are handled as EOF&#xD;
		check = br.readLine();&#xD;
		while (check.length()==0){ &#xD;
			if(br.ready()){&#xD;
				check = br.readLine();&#xD;
			}else{&#xD;
				// make a tupel array&#xD;
				tupels = al.toArray(new Tupel[0]);&#xD;
				//return the tupel array&#xD;
				return tupels;					}&#xD;
		}&#xD;
&#xD;
		partA = br.readLine().toLowerCase();&#xD;
		partB = br.readLine().toLowerCase();&#xD;
		&#xD;
		// put both chars at position i as a tupel into the array list&#xD;
		for (int i = 0; i &amp;lt; partA.length(); i++){			                    &#xD;
			// create new tupel and add to arraylist&#xD;
			Tupel tup = new Tupel(...);&#xD;
			al.add(tup);	&#xD;
		}&#xD;
} catch ...&#xD;
	&#xD;
// make a tupel array&#xD;
tupels = vt.toArray(new Tupel[0]);&#xD;
// return tupel array&#xD;
return tupels;&lt;/pre&gt;&lt;/div&gt;&lt;br&gt;&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 15:00:53 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792175.html#3792175</guid>
      <dc:creator>m3t4tr0n</dc:creator>
      <dc:date>2006-11-23T15:00:53Z</dc:date>
    </item>
    <item>
      <title>Re(4): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792169.html#3792169</link>
      <description>&lt;br&gt;&lt;div class=code&gt;&lt;pre&gt;&#xD;
try {&#xD;
	br = new BufferedReader(new FileReader(new File(fileName)));&#xD;
			&#xD;
	// while buffer not empty&#xD;
	while (br.ready()){&#xD;
&#xD;
		// discard empty lines, multiple empty lines are handled as EOF&#xD;
		check = br.readLine();&#xD;
		while (check.length()==0){ &#xD;
			if(br.ready()){&#xD;
				check = br.readLine();&#xD;
			}else{&#xD;
				// make a tupel array&#xD;
				tupels = al.toArray(new Tupel[0]);&#xD;
				//return the tupel array&#xD;
				return tupels;					}&#xD;
		}&#xD;
&#xD;
		partA = br.readLine().toLowerCase();&#xD;
		partB = br.readLine().toLowerCase();&#xD;
		&#xD;
		// put both chars at position i as a tupel into the array list&#xD;
		for (int i = 0; i &amp;lt; partA.length(); i++){			                    &#xD;
			// create new tupel and add to arraylist&#xD;
			Tupel tup = new Tupel(...);&#xD;
			vt.add(tup);	&#xD;
		}&#xD;
}&#xD;
} catch ...&#xD;
	&#xD;
// make a tupel array&#xD;
tupels = vt.toArray(new Tupel[0]);&#xD;
// return tupel array&#xD;
return tupels;&lt;/pre&gt;&lt;/div&gt;&lt;br&gt;&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 15:00:53 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792169.html#3792169</guid>
      <dc:creator>m3t4tr0n</dc:creator>
      <dc:date>2006-11-23T15:00:53Z</dc:date>
    </item>
    <item>
      <title>Re: Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792156.html#3792156</link>
      <description>problem ist wohl alles, wo daten im speicher kopiert werden (mit dem ToArray hast den ganzen datenhaufen vielleicht doppelt im speicher (oder dreifach))&lt;br&gt;&lt;br&gt;(generell solltest vielleicht das kozept, das ganze file in den speicher zu lesen, überdenken...)&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 14:53:22 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792156.html#3792156</guid>
      <dc:creator>adhoc</dc:creator>
      <dc:date>2006-11-23T14:53:22Z</dc:date>
    </item>
    <item>
      <title>Re(3): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792134.html#3792134</link>
      <description>kannst evtl. mal einen kurzen Ausschnitt aus der Quelldatei posten? Kann mir das grad nicht vorstellen ..&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 14:46:43 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792134.html#3792134</guid>
      <dc:creator>Somnatic</dc:creator>
      <dc:date>2006-11-23T14:46:43Z</dc:date>
    </item>
    <item>
      <title>Re(2): Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792125.html#3792125</link>
      <description>&gt; Kanns sein dass die ArrayList einen gewaltigen Overhead hat?&lt;br&gt;&lt;br&gt;Das ist eine gute Frage... Bei Eingabegröße 1MB hat das Tupel[] am Schluß ~10MB - ich denke einfach, daß das von der Größe her schon ein Problem ist. &lt;br&gt;&lt;br&gt;&gt;Das ArrayList.toArray() ist sicher auch nicht ideal.&lt;br&gt;&lt;br&gt;Soweit (also bis zum Schluß) kommts ja leider nicht. &lt;img src="sad.gif" width="16" height="19" align="absmiddle" alt=":("/&gt;&lt;br&gt;&lt;br&gt;&gt;Warum nicht gleich ein array mit fixer Größe erstellen, die Zeilenanzahl &lt;br&gt;&gt;ist ja nicht wirklich dynamisch, oder?&lt;br&gt;&lt;br&gt;Es sind pro Datei unterschiedlich viele Doppelzeilen mit unterschiedlicher Länge - ich kann leider nicht mit festen Größen rechnen.&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 14:41:42 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792125.html#3792125</guid>
      <dc:creator>m3t4tr0n</dc:creator>
      <dc:date>2006-11-23T14:41:42Z</dc:date>
    </item>
    <item>
      <title>Re: Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792109.html#3792109</link>
      <description>Kanns sein dass die ArrayList einen gewaltigen Overhead hat?&lt;br&gt;&lt;br&gt;Das ArrayList.toArray() ist sicher auch nicht ideal.&lt;br&gt;&lt;br&gt;Warum nicht gleich ein array mit fixer Größe erstellen, die Zeilenanzahl ist ja nicht wirklich dynamisch, oder?&lt;br&gt;&lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 14:35:47 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792109.html#3792109</guid>
      <dc:creator>Somnatic</dc:creator>
      <dc:date>2006-11-23T14:35:47Z</dc:date>
    </item>
    <item>
      <title>Java: Parsen großer Dateien</title>
      <link>http://forum.geizhals.at/t459858,3792087.html#3792087</link>
      <description>Hallo!&lt;br&gt;&lt;br&gt;Ich hab ein Problem beim Parsen von großen Datein (160MB++). Eine Datei enthält mehrere String-Doppelzeilen, aus denen für jede Position Tupel-Objekte (= zwei Chars, zwei Integers) erstellt werden sollen. Diese Objekte sollen in ein Array, was dann die Ausgabe des Parsevorgangs bilden soll.&lt;br&gt;&lt;br&gt;Das Problem - der Speicher. Mit "java -Xmx2600M" tuts das 64-bit Linux recht weit, aber kurz vor Ende der Datei ist Schluß (Prozess hängt mit 2.7GB Speicher und 0% CPU). Ist Xmx unter 1024M krieg ich sofort einen Fehler mangels Heap Space. Mit kleinen Testdateien funktioniert der Parser hingegen problemlos.&lt;br&gt;&lt;br&gt;Die Objekte zwischenzuspeichern wäre vielleicht eine Idee, ich weiß aber nicht, wie ich dann am Ende das ganze wieder zu einem Array zusammensetzen soll.&lt;br&gt;&lt;br&gt;Irgendwelche Ideen, wie man das ohne Hardwareaufrüstung im bösen Ausmaß machen kann?&amp;nbsp;&amp;nbsp;&lt;img src="cry.gif" width="16" height="19" align="absmiddle" alt=":~("/&gt;&lt;br&gt;&lt;br&gt;Grober Vorgang:&lt;br&gt;&lt;br&gt;&lt;div class=code&gt;&lt;pre&gt;BufferedReader &amp;lt;- FileReader &amp;lt;- File&#xD;
While (BufferedReader nicht leer) {&#xD;
   Zeile 1 = BufferedReader.readLine()&#xD;
   Zeile 2 = BufferedReader.readLine()&#xD;
      For (Zeilenlänge) {&#xD;
          ArrayList.add(New Tupel(...))&#xD;
      }&#xD;
}&#xD;
Tupel[] = ArrayList.toArray&#xD;
return Tupel[]&lt;/pre&gt;&lt;/div&gt;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; &lt;br/&gt;</description>
      <pubDate>Thu, 23 Nov 2006 14:25:19 GMT</pubDate>
      <guid>http://forum.geizhals.at/t459858,3792087.html#3792087</guid>
      <dc:creator>m3t4tr0n</dc:creator>
      <dc:date>2006-11-23T14:25:19Z</dc:date>
    </item>
  </channel>
</rss>
