Copyright © 1998, 1999
Aribert Deckers
and
Copyright © 1998, 1999
Antares Real-Estate

Suchmaschinen

18.1.1999

Die Suchmaschinen erfassen nur einen sehr kleinen Teil der mittlerweile rund 300 Millionen Seiten im WWW. Ein Test mit den Seiten des Servers, auf dem ich mit meiner Web-Site zu Gast bin, zeigte ein niederschmetterndes Ergebnis: Von mehr als 600 vorhandenen Seiten zeigte eine Suchmaschine nur eine einzige, selbst die beste brachte es nur auf rund 250 Seiten. Meist sind es nur eine Handvoll Seiten, nicht mehr als ein Dutzend oder zwei. Dies, obwohl die Suchmaschinen angeblich 1x wöchentlich die Web-Sites nach Seiten abgrasen.

Wie soll man angesichts solch katatrophaler Zustände im WWW doch noch etwas finden können?
Mit
1. Suchmaschinen,
2. Links und
3. internen Suchmaschinen

Nun, 1. über die großen Suchmaschinen. Dies aber nur als "allererste Näherung". Dann, als 2. Schritt, - und das ist in den allermeisten Fällen eine gute Methode - über die Link-Listen auf Web-Sites.

Es dauert in der Regel mindestens 5 Stunden, bis man 4 oder 5 gute Quellen gefunden hat. Man braucht gute Nerven, viel Zeit und natürlich viel Geld für das Telefon...

Die 3. Quelle, die internen Suchmaschinen , sind meist recht zuverlässig - wenn man sie erst einmal gefunden hat...: Zeitungen, Zeitschriften, Forschungsinstitute, Firmen, Datenbanken und spezialisierte Web-Sites haben für die eigenen Online-Archive oft eine eigene Suchmaschine "onboard" oder lassen die Suche durch eine beauftragte Suchmaschine durchführen.. Hier kann man wirklich finden, was man sucht. Aber, wie gesagt: Bis man diese Web-Sites und ihre internen Suchmaschinen gefunden hat, dauert es eine geraume Weile...

Bevor Sie sich auf die lange und beschwerliche Suche machen, sollten Sie zuerst die meiner Meinung nach allerbeste medizinische Link-Quelle im WWW besuchen:
http://www.kib.ki.se/ * Karolinska Institutets bibliotek

Meine allergrößte Hochachtung für die Betreiber dieser Web-Site!

(* Die Schreibweisen der URLs habe ich anderen Web-Sites entnommen.)

Falls Sie staunen wegen des so identischen Aussehens mancher Suchmaschinen: Wundern Sie sich nicht, es sind die gleichen! Durch die Aufkäufe von weiteren Suchmaschinen und durch die Benutzung der gleichen Grundkonstruktionen darunter ist die Ähnlichkeit kein Zufall, sondern Folge des Konzentrationsprozesses, der inzwischen auch die Suchmaschinen erfaßt hat.

Die Einträge meiner Aufstellung sind nach den URLs alphabetisch sortiert. Die Suchmaschinen oder anderen Dienste sind zum Teil sehr allgemein, zum Teil aber auch auf sehr merkwürdige Themen spezialisiert. Eine Gruppierung nach Unterthemen habe ich nicht durchgeführt, die Aufteilung ist zugegebenermaßen etwas willkürlich. Man muß mit den Suchmaschinen erst üben, bevor man diejenigen findet, mit denen man besser zurechtkommt oder deren Ergebnisse einem besser gefallen.

Cave Canem!


Um an Quellen für Lyme-Disease zu gelangen, war es notwendig, eine Suchmaschine "leerzupumpen". Bei 23.500 Fundstellen: Wie kommt man über die Hürde von 200 oder 1000 maximal angezeigten Treffern?

Ein Teil der Suchmaschinen erlaubt eine Suche nach vorgegebenem Kriterium, zum Beispiel in der Form

A und B

Wort A und Wort B müssen in der gesuchten Web-Seite vorkommen. Das stimmt zwar im allgemeinen nicht, weil wegen der Meta-Tags oder Fehlern oder Sabotage auch falsche Seiten angezeigt werden. Aber diese Fehler bleiben einem nicht erspart.

Im Fall Lyme-Disease stellte sich heraus, daß das Wort "Lyme" immer vorkommen mußte: Es war der einzige Anhaltspunkt. "Lyme" liefert 23.500 gemeldete Fundstellen...

Also schränkt man die Suche ein:

lyme AND town

Die Suchbegriffe klein geschrieben und die logische Verknüpfung "und" englisch als AND geschrieben. Gehen wir von dem (jetzt nicht nachgeprüften) Fall aus, man erhielte damit 900 Treffer, dann kann man sich diese 900 Treffer anzeigen lassen. (Maximal 1000 bekommt man ja.)

Macht 23.500 - 900. Um bei der weiteren Suche diese 900 auszuklammern, dreht man jetzt den Spieß um:

lyme AND NOT town

Bedeutet: Alles mit "Lyme" drin, wo das Wort "Town" nicht vorkommt. Klingt gut. Findet man solche Wörter, bei denen man Zug um Zug weniger als 1000 Treffer erhält kommt man gut voran: Erst das Wort haben wollen, dann das Wort für die weitere Suche ausschließen.

lyme AND NOT town AND NOT age AND NOT female AND not critical

-... und so weiter. Die Zeile wird mit der Zeit zu lang, so daß man sortieren muß:

lyme AND NOT(town OR age OR female OR critical)

Das ist logisch die gleiche Zeile wie jene darüber! Nur anders geschrieben. Beachten Sie, daß in der Klammer aus dem AND ein OR wird!!! Die Suchaufgabe lautet: "Suche mir alles, was das Wort "Lyme" enthält, aber NICHT "Town" ODER "Age" ODER "female" ODER "critical"!

Jedes neue Wort wird mit AND angehängt:

lyme AND NOT(town OR age OR female OR critical) AND eye

Wie man sieht: reine Beschäftigungstherapie, nur notwendig, um die schwachsinnige 1000-er Schranke zu umgehen.

Man hat nicht mit jedem Suchwort das Glück, große Portionen aus dem Kuchen herausschneiden zu können. Manch ein Wort bringt nur 10 oder vielleicht 50 Treffer, vielleicht auch 100 oder 200. Das ist eindeutig zu wenig!!! Sehen Sie sich die Seiten an und lesen sie! Sie müssen ein Wort finden, das öfter vorkommt. Nur dann macht die Ernte mit diesem Wort einen Sinn.

Komplizierter ist der Fall, wenn man ein Wort mit mehr als 1000 Fundstellen findet. Dann muß gleichzeitig ein zweites, vielleicht sogar ein drittes oder viertes Wort zuhilfe genommen werden:

lyme AND disease

"disease" kommt SEHR häufig vor! Also ein zusätzliches Wort nehmen:

lyme AND disease AND help

(Wie alle Beispiele ist auch dieses rein aus der Luft gegriffen!) Nachdem man vielleicht mit "help" Glück gehabt hat, muß man die benutzten Wörter Zug um Zug gegeneinander ausspielen:

1. lyme AND disease AND help
2. lyme AND disease AND NOT help

Sind nun weniger als 1000 Treffer, so kann man diese mit dem "AND NOT help" ernten. Aber das ist nur ein Teil der Affaire!

3. lyme AND NOT help AND NOT disease

Falls 3. weniger als 1000 Treffer geliefert hat: gut. Falls nicht: weiter abspalten, Zug um Zug mit neuen Wörtern.

3. lyme AND disease AND help AND therapy ..................Hilfswort abspalten
4. lyme AND disease AND help AND NOT therapy .........Spieß umdrehen
5. lyme AND disease AND NOT help ...............................beim 1. Wort Spieß umdrehen
und so weiter...

Am Ende steht man - nach Stunden mühevoller hin-und-her-Springerei mit solchen Hilfswörtern (auf die man erst einmal kommen muß!) vor einem neuen Problem, einem wirklich dicken Brocken: Die Zeile des Suchformulars erlaubt nur soundsoviele Buchstaben, man ist am Ende der Fahnenstange angelangt.

Nun wird die Suche erst recht kompliziert, weil man immer und immer wieder stochern muß, um neue Fundstellen zu ernten, die Zeile aber dennoch nicht länger werden zu lassen. So werden denn die letzten Quellen zu einem Quell großen Zorns: 6 oder 8 Stunden Herumsuchen und Herumirren wegen vielleicht 5000 oder 2000 oder vielleicht nur 300 Fundstellen. Aber man braucht sie!

Natürlich erhält man jetzt Doubletten en masse. Wirklich neue Treffer gibt es kaum, dafür Kilotonnen von Doubletten.

Eine Bitte um Hilfe ode Ausnahmegenehmigung, die per Email an die Betreiber der Suchmaschine bzw deren Wartungspersonal gesandt wird, wird barsch mit einem Standard-Text abgeschmettert: Man müsse die Suchmaschine vor bösen Subjekten und üblen Machenschaften schützen, heißt es. "Und tschüß!"

Um das Ganze bis an die Grenze zu testen, habe ich eine Suchmaschine mit der obigen Methode leergepumpt: für 23.500 Fundstellen rund 25 Stunden Online-Zeit. Das zeigt, wie sinnlos die Suchmaschinen durch schwachsinniges, asoziales Verhalten ihrer Betreiber geworden sind - und wieviel wichtiger es ist, gute Link-Listen zu finden. Die großen Suchmaschinen sind, das muß ich betonen, heute nur noch Verteiler für Reklameschrott. Wer nicht unbedingt damit arbeiten muß, der sollte die Finger davon lassen!

Ein weiterer Rat: Geben Sie niemals bei einer Suchmaschine (und erst recht nicht bei einer Web-Site!) Ihre Email-Adresse an! Sie würden anschließend Tag für Tag mit Bergen von Reklame regelrecht "bombardiert".

Je näher man an die magischen Wörter "business", "money" oder "commerce" kommt (Warnsignale!), desto größer die Menge an Werbung, die einem täglich die Mailbox platzen läßt. Werbe-Emails von 30 bis 100, ja sogar über 150 kBytes sind keine Seltenheit, 30 kBytes die Regel! Pro Stück natürlich... Wollen Sie Ihre Emails herunterladen, machen die echten Emails vielleicht nur noch 1/100, 1/1000 oder weniger aus von jener Datenmenge, für die Sie teure Mengengebühr (falls Sie einen schlechten ISP haben), ganz sicher aber die hohen Telefonkosten zahlen müssen. Unter Umständen mehrere Mark pro Tag. Jeden Tag!

Denken Sie immer daran:
Werbung im Internet ist
Werbung, für die SIE zahlen müssen!

Reine Suchmaschinen

Zeitungen

Spezialisiertere medizinische Quellen

Sonstiges

- - -
 


retour zur Titelseite


Copyright © 1998, 1999
Aribert Deckers
and
Copyright © 1998, 1999
Antares Real-Estate