Für alle, die YaCy (noch) nicht nutzen oder kennen:
YaCy ist als eine 2003 entwickelte P2P-Suchmaschine. Man kann sowohl diesem P2P Prinzip folgen und den Index mittels der Ergebnisse eigener Crawler und fremder Crawler des Netzwerk anreichern, als auch seinen rein privaten Index anfertigen. YaCy ist in Java geschrieben und kann über ein Webinterface bedient werden.
Eingesetzt wird YaCy beispielsweise von der Johannes-Gutenberg-Universität Mainz.
Durch die Architektur ergeben sich einige Vor-, aber auch eine Reihe an Nachteilen.
YaCy - http://yacy.net/
Eigentlich wollte ich YaCy nur mal antesten und habe es mal aufgesetzt, seit dem rennt es vor sich her und hat mir innerhalb von ein paar Tagen einen ca 100GB Index erwirtschaftet. Bei Testsuchen werden mir auch brauchbare Ergebnisse geliefert.
Was mir allerdings ein bisschen Bauchschmerzen bereitet ist, dass bei der P2P Technologie wohl duzende Crawler unterwegs sind, die unter Umständen doch recht aggressiv geschaltet sind - immerhin erzeugte mein Crawler in der Standardeinstellung mehrere duzend Seitenaufrufe pro Sekunde pro Domain, man stelle sich das mal für hunderte oder tausende Peers vor, die gemeinsam oder redundant Seiten crawln. Außerdem können (werden) wohl auch Medieninhalte indexiert (werden). Wie sieht es da rechtlich aus, wenn man die Suchmaschine öffentlich schaltet oder auch nur den Index mit dem Netzwerk teilt?
Klar genießen Suchmaschinen in gewisser Weise mehr Freiheiten, aber wird eine "private" Suchmaschine bzw ein Node aus einer P2P Suchmaschine auch so behandelt?
Ich wollte mal nachfragen, wer YaCy kennt und vielleicht sogar selbst nutzt und was eure Meinungen dazu sind.
YaCy ist als eine 2003 entwickelte P2P-Suchmaschine. Man kann sowohl diesem P2P Prinzip folgen und den Index mittels der Ergebnisse eigener Crawler und fremder Crawler des Netzwerk anreichern, als auch seinen rein privaten Index anfertigen. YaCy ist in Java geschrieben und kann über ein Webinterface bedient werden.
Eingesetzt wird YaCy beispielsweise von der Johannes-Gutenberg-Universität Mainz.
Durch die Architektur ergeben sich einige Vor-, aber auch eine Reihe an Nachteilen.
YaCy - http://yacy.net/
Eigentlich wollte ich YaCy nur mal antesten und habe es mal aufgesetzt, seit dem rennt es vor sich her und hat mir innerhalb von ein paar Tagen einen ca 100GB Index erwirtschaftet. Bei Testsuchen werden mir auch brauchbare Ergebnisse geliefert.
Was mir allerdings ein bisschen Bauchschmerzen bereitet ist, dass bei der P2P Technologie wohl duzende Crawler unterwegs sind, die unter Umständen doch recht aggressiv geschaltet sind - immerhin erzeugte mein Crawler in der Standardeinstellung mehrere duzend Seitenaufrufe pro Sekunde pro Domain, man stelle sich das mal für hunderte oder tausende Peers vor, die gemeinsam oder redundant Seiten crawln. Außerdem können (werden) wohl auch Medieninhalte indexiert (werden). Wie sieht es da rechtlich aus, wenn man die Suchmaschine öffentlich schaltet oder auch nur den Index mit dem Netzwerk teilt?
Klar genießen Suchmaschinen in gewisser Weise mehr Freiheiten, aber wird eine "private" Suchmaschine bzw ein Node aus einer P2P Suchmaschine auch so behandelt?
Ich wollte mal nachfragen, wer YaCy kennt und vielleicht sogar selbst nutzt und was eure Meinungen dazu sind.