zurück Startseite weiter Durchsuchen Sie diese Homepage oder das ganze Web ... Der Suchbaum zeigt Ihnen, wo Sie Ihre Suche am besten starten ... Schreiben Sie mir eine Email - Feedback tut gut! Über diese Homepage ...
 

Wenn Webseiten lügen

Manchmal geschehen merkwürdige Sachen, wenn Sie im Web suchen. Vielleicht wollten Sie sich kurz vor Ihrem Tauchurlaub ein bißchen über den Manta, den völlig harmlosen "Teufelsrochen" informieren und die Antwort der Suchmaschine zeigt vor allem Verknüpfungen auf die Seiten von irgend welchen Fans eines gleichnamigen Autos. Das kann man ja noch verstehen. Sie hätten eben zusätzlich angeben sollen, dass es sich um einen Rochen bzw. Fisch dreht. Aber was zum Teufel macht die Werbung einer Zigarettenmarke in der Antwort der Suchmaschine? Und was die Seite der bekannten Deutschen Filmgesellschaft?

Nach oben ...

Neugierig laden Sie die beiden Seiten in Ihren Browser. Die Sache mit der Filmgesellschaft klärt sich rasch: die haben mal einen Film gedreht, in dessen Titel das erwähnte Auto vorkam. Gut. Aber die Zigaretten-Seite bleibt ein Rätsel. Nirgendwo auf der ganzen Seite findet sich das Wort 'Manta'. Hat die Suchmaschine einen Fehler gemacht?

Nein. Sicher nicht. Die Suchmaschine allerdings sieht Sachen, die Sie nicht sehen. Und unter normalen Umständen auch nicht sehen sollen. Zusätzlich zu dem Text, den Sie auf einer WebSeite sehen, gibt es noch jede Menge mehr Text, der dazu dient, dem Browser mitzuteilen, wie er die Seite darstellen soll -- und einige Elemente, die als versteckte Informationen über den Seiteninhalt dienen, speziell, um von den Suchmaschinen ausgewertet zu werden.

Nach oben ...

Zunächst einmal gibt es den sogenannten "Kopfbereich" des HTML-Dokuments. In diesem durch den <HEAD>-Tag (das spricht sich 'täg') abgegrenzten Bereich finden sich sogenannte <META>-Tags, in welchen Informationen stecken, die zum Beispiel von Suchmaschinen ausgewertet werden können. Beispielsweise könnte es im Kopfbereich des erwähnten Zigaretten-Dokuments folgendermaßen aussehen:

<html>
<head>
 <meta name="author" content="Johnny Smoky">
 <meta name="description" content="Zigaretten unserer Marke
 sollten Sie in Ruhe genießen.">
 <meta name="keywords" content="zigaretten,
 tabak, freizeit, fun, sportliche, manta, erfolg,
 freiheit, laune">
 <title>Zigaretten von XY</title>
</head>

Und hier die Übersetzung aus dem Fachchinesischen:

Die erste Zeile "<meta name="author" content="Johnny Smoky>" erschließt sich wohl noch leicht: Dieser Metatag verrät den Gestalter der Seite -- der ja nicht mit dem Autor des Seitentexts identisch sein muß.

Der zweite Metatag "<meta name="description" [...]>" liefert eine Beschreibung des Seiteninhalts. So sollte es jedenfalls sein. Denn dieser Text wird von vielen Suchmaschinen verwendet, um dem Suchenden eine Kurzbeschreibung der Fundstelle zu liefern. Deshalb sind Manipulationen an dieser Stelle eher selten: auch der Autor der oben erwähnten Zigarettenseite war immerhin ehrlich genug, hier den Inhalt der Seite zu verraten. Wollte er Sie unbedingt auf seine Seite locken, hätte er auch ein paar Takte über den Manta schwadronieren können.

Der dritte Metatag "<meta name="keywords" [...]> ist eine Liste von Schlüsselwörtern, unter welchen bestimmte Suchmaschinen die Seite auflisten sollen. Das schöne an diesem Meta-Tag ist (für unehrliche Webmaster), dass diese Stichwörter auf der Webseite nicht zu sehen sind. Deshalb haben Sie auch das Stichwort 'Manta' nicht auf der Zigarettenseite gefunden.

Nach oben ...

Was animiert nun Web-Autoren dazu, 'hinter' ihren Web-Seiten falsche Angaben zu verstecken? Dumme Frage: das liebe Geld natürlich. Denn die Hoffnung, die direkt hinter den falschen Stichworten steht, ist, dass die Seite mehr page hits erzielt. Viele page hits bringen viel Werbung. Und Werbung bringt Geld. Dabei sagt ein page hit gar nicht viel darüber aus, wie intensiv eine Seite konsumiert wird. Er verrät lediglich, dass ein Internet-Surfer auf einen Link geklickt hat, der diese Seite aufgerufen hat.

Ob der Surfer gleich wieder weitergeklickt hat, als er/sie sah, wo er/sie gelandet ist, fällt unter den Tisch. Hinter der ganzen Geschichte steckt also auch eine Menge Wunschdenken: nämlich, dass die Seite durch die falschen Stichwörter mehr Aufmerksamkeit erhält. Vielleicht hat in unserem Zigarettenbeispiel irgend ein phantasievoller Werbeschaffender herausbekommen, dass Leute, die einen Manta fahren, überdurchschnittlich oft rauchen. Und da wäre es doch gelacht, wenn man die nicht auf die Zigarettenseite locken und zum Konsum gerade dieser Zigarettenmarke verführen könnte.

Nach oben ...

Aber der Trick mit den "keywords" ist beileibe nicht der einzige, den die Web-Autoren auf Lager haben. Auch im eigentlichen Seitenbereich (<BODY>) des HTML-Dokuments gibt es genug Verstecke: Einen davon hatte ich lange Zeit auf der Titelseite ziemlich offensichtlich 'versteckt'. Ganz unten auf der Startseite fanden sich merkwürdige 'Schatten', die sich kaum vom Hintergrund abhoben.

Hier ist der Text noch einmal schwarz auf weiß:

Wenn Sie eine Erklärung für diesen "Blindtext" haben wollen, lesen Sie das Kapitel über Suchstrategien.

Suchmaschinen oder search engines, metafinders oder Metasuchmaschinen, auch Meta-Suchmaschinen, Information Online-Recherche Usenet email Newsgroups informations netguide focus topic Slartibartfast William Shakespeare theater Suchmaschinen Metasuchmaschinen Internet-Verzeichnisse, Internet-Kataloge und Linklisten, suchen finden recherchieren Online-Recherche Internet-Kataloge Suchwerkzeuge Suchhilfen Suchmaschinen Datenbanken Kataloge Archive Hilfen Medline Informationen Fundsachen Erfolg Suchmaschinen Spider und Robots Wissen, Wissensbeschaffung, Informationsbeschaffung, Informationssuche, Erfahrung Forschen Spinnen Netzwerk Naturwissenschaften Biologie Physik Mathematik Chemie Informatik Software Hardware Rat Kontakte Menschen email Adressen Hinweise Wegweiser Boerse Index Hobby Hobbies Freizeit Vergnuegen Lernen Hausaufgaben Nachhilfe Einfuehrung Schulung sparen kostenlos gratis Boolsche Operatoren Suchtricks Suchmaschine Suchhilfe FAQs frequently asked questions Metasuchmaschine Metafinder Katalog Suchmaschinen, Metasuchmaschinen, Internet-Kataloge, Internet-Verzeichnisse, Online-Recherchen, Suchtechniken, Suchhilfen, Suchen, Finden, lehcsumlegukssulF Verzeichnis

Was soll nun dieser Wortsalat? Viele der Wörter passen zu "Suchen im Internet", aber manche sind doch ziemlich weit hergeholt. Und chaotisch zusammengewürfelt dazu. Außerdem waren sie auf der Titelseite kaum zu sehen. Das sagt uns schon, dass sie eigentlich nicht für die Augen des Lesers bestimmt waren. Sondern für die "Augen" der Suchmaschinen. Denn die speichern ja meist einen Teil des HTML-Dokuments oder gar das ganze Dokument in ihrer Datenbank und durchsuchen dieses dann bei Bedarf nach den Stichwörtern, die ein Kunde zur Suche eingegeben hat. Also wählen sie dann einen so manipulierte Seite auch aus, wenn sie eigentlich gar nicht zur Anfrage paßt -- schließlich kommt das Suchwort auf der Seite vor.

Nach oben ...

Genau genommen hätte ich diesen Text auch genau in der Farbe des Hintergrunds anzeigen können. Vollkommen unsichtbar. Aber ich wollte ja, dass Sie ihn auf den zweiten Blick entdecken. Weil ich Ihnen den Trick verraten wollte. Außerdem: Die Suchmaschinen (bzw. deren Betreiber) kennen natürlich ihre Pappenheimer (also: die Web-Autoren) und wollen ihrerseits dafür sorgen, dass die Suchergebnisse, die ihre Suchmaschinen erzeugen, möglichst zutreffend sind. Deshalb haben sie teilweise Funktionen eingebaut, damit solch versteckter Text nicht berücksichtigt -- oder solche Seiten sogar "zur Strafe" nicht in die Suchdatenbank aufgenommen werden. Pech gehabt! Denn schon dann, wenn die Textfarbe um nur einen Farbwert von der Hintergrundfarbe abweicht, ist sie für die Suchmaschine nicht mehr identisch, für das menschliche Auge aber trotzdem fast unsichtbar. Ich habe deshalb auch einen viel größeren Farbunterschied gewählt! Der kleinstmögliche Farbunterschied sähe zum Beispiel so aus:

ROT

Machen Sie einmal einen Doppelklick mitten in das rote Feld! Das Wort "ROT" ist rot mit dem kleinst möglichen Blaustich. Der Hintergrund ist einfach nur rot.

Inzwischen können Suchmaschinen aber manchmal auch diese minimal abweichenden Farbwerte als 'unsichtbar' erkennen und werten das als 'Regelverstoß'. Folge: Die entsprechende Seite wird nicht in den Index aufgenommen, bzw. sie fliegt raus!

Nach oben ...

Es gibt sogar einen Trick, mit dem man eine Suchmaschine dazu veranlassen kann, seine Seite zu einem bestimmten Stichwort zu notieren, das auf der Seite gar nicht zu finden ist: Dazu fügt der Web-Autor der <KEYWORDS>-Liste das gewünschte Wort hinzu und meldet anschließend die Seite bei eine Suchmaschine an, welche die <KEYWORDS> zur Sortierung der Seiten in ihrer Stichwort-Datenbank verwendet. Sobald der Web-Autor sich durch eine Suche mit eben dieser Suchmaschine davon überzeugt hat, dass die Seite in die Datenbank aufgenommen wurde, entfernt er das Stichwort aus der <KEYWORDS>-Liste. Das Stichwort ist 'unsichtbar'. Niemand kann beweisen, dass es einmal da war. Auf diese Weise haben in einigen Fällen Firmen erreicht, dass Suchende, die nach dem Produkt der Konkurrenz fragten, auf der eigenen Homepage landeten. Das hat natürlich zu juristischen Verwicklungen geführt.

Nach oben ...

Lug und Trug, wohin das Auge blickt. Oder gar nicht blicken kann. Was können Sie dagegen tun? Schließlich wollen Sie nicht ständig von so dreisten Web-Autoren geleimt werden. Denn das kostet Ihre Such-Zeit (und oft auch noch Gebühren). Leider gibt es dagegen kein 100%iges Gegenmittel.

Ich kann Ihnen nur raten: Wählen Sie für Ihre Suche möglichst eine gute Kombination von Stichworten. Vermeiden Sie "in"-Wörter und solche, die bekanntermaßen zu den häufigsten Suchwörtern im Internet gehören. Das sind zum Beispiel solche Wörter zum "Thema Nr. 1", die einem bleichgesichtigen, vereinsamten Computersüchtigen ohne Sozialkontakte in den Sinn kommen, wenn er vor der Suchmaske seiner Lieblingssuchmaschine hockt und noch nicht weiß, wie er die Nacht rumkriegen soll ;o)

Man sieht: auch im Internet ist alles wie IRL!

zurück Startseite weiter