Hobby-Projekt Findory.com "Nachahmung"
Geizhals » Forum » Programmierung » Hobby-Projekt Findory.com "Nachahmung" (7 Beiträge, 237 Mal gelesen) Top-100 | Fresh-100
Du bist nicht angemeldet. [ Login/Registrieren ]
Hobby-Projekt Findory.com "Nachahmung"
03.03.2010, 18:45:37
Hallo!

falls ihr die website findory.com nicht kennt: Wiki (eng)

greg linden, programmierer des amazon.com empfehlungsalgorithmus, hat auf dieser seite bis 2007 "personalisierte nachrichten" angeboten. ich habe den dienst damals sehr nützlich gefunden, mich immer dafür interessiert wie das funktioniert und finde es schade, dass er das projekt schlussendlich eingestellt hat.

da mich das projekt immer interessiert hat, würde ich jetzt gerne so eine personalisierte seite nachbauen und frage mich mit welchen tools und sprachen so etwas umgesetzt werden kann.

im moment reicht mir ein nachrichtenarchiv (keine aktuellen feeds nötig) zu personalisieren und ganz simpel auf korrelationen zu setzen. das heißt eine datenbank A manuell mit nachrichten zu füllen und diese auf eine website zu stellen. internetnutzer können sich dann per username und passwort (datenbank B) einloggen und nachrichten lesen (wie bei findory).

datenbank C verknüpft dann A und B und speichert das leseverhalten der nutzer (user 1 hat artikel a,e,f,l,s gelesen, user 2 hat artikel b,t,u,w,z, user 3 usw. usw.). aus dieser datenbank errechne ich mir zwei korrelationsmatrizen X (user x user) und Y (nachricht x nachricht).

wenn sich ein user z einloggt, bekommt er einen screen ähnlich wie bei findory zu sehen mit circa 1/3 zufälligen nachrichten, 1/3 nachrichten die user mit der höchsten korrelation zu z auch gelesen haben und 1/3 nachrichten, die die höchste korrelation zu den letzten 10 gelesenen nachrichten aufweisen.

ich habe keinerlei ambitionen mit dieser sache geld zu verdienen, mir macht es einfach spaß mich damit zu beschäftigen und ich bin mir sicher ich kann fähigkeiten die ich mir dafür aneignen muss später brauchen. ausserdem bin ich nicht alleine und wir haben auch keinen zeitdruck (und wollen auch keinen bei einem hobbyprojekt). ich würde mich freuen wenn die zahl der unnötigen kommentare, die die unmöglichkeit dieses unterfangens unterstellen, überschaubar bleibt. nun zu meinen fragen technischer natur:

1)
technisch haben wir für eine erste demo (die noch keine personalisierung vornimmt, sondern lediglich die datenbanken generiert) HTML, PHP und CSS für das front end verwendet, MySQL als datenbank und Apache als webserver.

gibt es daran etwas auszusetzen bzw. gibt es tools die eurer meinung nach geeigneter wären?

2)
wir überlegen gerade, wie die zuteilung der nachrichten technisch gelöst werden sollte. wie gesagt reicht uns eine nicht-echtzeit lösung, es müssen daher nicht live sämtliche korrelationen berechnet werden. wir tendieren zu folgender lösung:
aus der datenbank C wird alle x stunden/tage automatisch eine korrelationsmatrix X (user) und y (nachrichten) erstellt und diese je wieder in zwei MySQL datenbank gespeist. dazu würden wir python verwenden.
aus diesen kann dann die website gefüllt werden.

hat irgendjemand verbesserungsvorschläge oder bedenken was diesen prozess angeht? konzeptionell oder technisch? dafür wären wir natürlich dankbar.

wenn jemandem eine komplett andere herangehensweise einfällt, wäre das natürlich auch interessant.


Liebe Grüße
Mr. Coco

Antworten PM Alle Chronologisch
 
Melden nicht möglich
 

Dieses Forum ist eine frei zugängliche Diskussionsplattform.
Der Betreiber übernimmt keine Verantwortung für den Inhalt der Beiträge und behält sich das Recht vor, Beiträge mit rechtswidrigem oder anstößigem Inhalt zu löschen.
Datenschutzerklärung