Suchmaschinen im INTERNET

      
 


aktuelle Meldungen:
naechst.gif (256 Byte)

Bücher zum Thema:
naechst.gif (256 Byte)

 

http://www.archmatic.com/glossar/z_suchmash.htm

siehe auch (auf anderen Glossar-Seiten):

Browser
Domain-Namen, DNS
E-Mail
HTML (Homepage-Erstellung)
Internet
Internet-Zahlen / Community
Newsgroup
WAP und WML
World Wide Web

siehe auch Beitrag im AEC-WEB (nur mit einer Online-Verbindung):

Suchmaschinen-Anmeldung und weitere Tipps
die wichtigsten Suchmaschinen zum Anwenden
INTERNET und Architekten

      
 


   
Suchmaschinen (auch Searchengines) sind Suchdienste im INTERNET, die aufgrund von Suchbegriffen alle WWW-Sites, E-Mail-Adressen und andere Angebote im INTERNET aufspüren, die den angegebenen Suchbegriff enthalten. Damit sind Suchmaschinen eine nützliche Hilfe, sich in dem Millionen-Angebot zurechtzufinden und eine bestimmte Information zielsicher anzupeilen.

Es gibt im Netz dreierlei Arten von Suchmöglichkeiten:

  • Kataloge
  • Agenten
  • Retrieval-Engines

Die klassischen Suchmaschinen bedienen sich der beiden ersten Sucharten, Yahoo! ist z.B. ein Katalogsystem mit zusätzlicher Stichwortabfrage (beide Varianten gemischt), Alta Vista dagegen ist ein reines Retrieval-Angebot.

Bei der Benutzung von Katalogen wird zuerst ein Ober-Suchbegriff ausgewählt, beispielsweise "Business and Economy". Danach öffnet sich ein weiteres Verzeichnis mit weiteren Auswahlmöglichkeiten wie z.B. Companies und dann Architecture.
 

 


  Die Agenten treten oft als Zusätze von WWW-Browsern auf, die im Auftrag des Nutzers bestimmte Seiten auf Veränderungen überwachen.

Retrieval-Engines (Retrieval: Suchen und Auffinden gespeicherter Daten) suchen nach vorgegebenen Stichworten / Suchbegriffen, die in ein entsprechendes Formularfeld einzutippen sind. Die Suche läßt sich beeinflussen,

  • indem nur in einen Teil des INTERNETs (z.B. nur im WWW) gesucht wird,
  • oder die Zahl der angezeigten Antworten beschränkt wird.

Um von der Fülle der Antworten nicht erschlagen zu werden, solltet der Suchbegriff möglichst präzisiere sein. Wenn also ein bestimmtes Programm gesucht wird, empfiehlt es sich, nicht einfach nur "Software" anzugeben, sondern den genauen Namen des Programmes. Um die Trefferquote weiter zu erhöhen, können gleichzeitig auch mehrere Suchbegriffe mit logischen Verknüpfungen eingegeben werden. (Zu beachten ist, daß Umfang, Bedeutung und Syntax dieser Verknüpfungen von Suchmaschine zu Suchmaschine differieren!) Trotzdem ein paar Beispiele und einige weitere Tips:
 

 


 
  • Suchbegriffe im Plural ("Architekten" statt "Architekt") beschränken die Suche. Ein kleines Architekturbüro oder eine bestimmte Person wird man mit dem Suchbegriff "Architekten" nicht finden. Andererseits findet man mit "Architekt" aber alle Architekten und Architekturbüros und Architekturmagazine und Architektur....

  • genau passend finden
    Andererseits sollen vielleicht Seiten mit genauer Übereinstimmung gefunden werden - "Architekt" aber nicht "Architekten". Ein Punkt am Ende eines Suchbegriffes veranlaßt Lycos dazu, das Wort buchstabengetreu zu finden:

    LYCOS: architekt.

  • mindestens eines der Suchworte muß in den Ergebnissen enthalten sein
    Auf der Suche nach beispielsweise allen baurelevanten Themen kann man gleichzeitig nach mehreren Stichworten suchen - z.B. nach "Architektur" und "Bauwesen":

z.B. YAHOO, Lycos oder Altavista: architektur bauwesen

z.B. Fireball: architektur OR bauwesen

  • ALLE Suchworte müssen in den Ergebnissen enthalten sein
    Auf der Suche nach beispielsweise allen baurelevanten CAD-Programmen kann man die entsprechenden Stichworte- z.B. nach "Bau" und "CAD" - so miteinander verknüpfen, daß alle Suchbegriffe in den gefundenen Dokumenten enthalten sind:

z.B. YAHOO: bau +CAD

z.B. Fireball: bau AND CAD oder bau & CAD

  • Begriffe ausschließen
    Sollen bestimmte Begriffe NICHT in den gefundenen Dokumenten vorkommen, dann können diese ausgeschlossen werden. Wenn also beispielsweise alle baurelevanten Sites gefunden werden sollen, die nichts mit EDV zutun haben, dann geht das so:

    z.B. YAHOO: bau archiektur -computer -edv

    z.B. Fireball: bau OR archiketur AND NOT pc AND NOT edv

  • Phrasen
    Phrasen sind Sequenzen von Suchbegriffen, die in den gefundenen Dokumenten unmittelbar nebeneinander stehen müssen. Die Phrasen-Suche eignet sich besonders gut für die Recherche nach Personen- ("Leonardo da Vinci"), Firmen- ("Deutsche Bank") oder Korporationen-Namen ("Bündnis 90/Die Grünen"). Auch Film-, Buch- und Schallplattentitel oder Zitate lassen sich auf diese Weise mit hoher Treffergenauigkeit finden. Phrasen müssen vielen Suchmaschinen mit Anführungsstrichen eingegeben werden:

"Leonardo da Vinci"

Genauere Infos über die vielen Möglichkeiten der Verknüpfungen erhält man bei den meisten Suchmaschinen unter den Begriff "Help", "Hilfe", "options" oder "Optionen".
 

 


  Die Daten für ihre Suchmaschinen holen sich die großen Anbieter übrigens mit Hilfe von Robots. Das sind vollautomatische Programme, die überall in den Netzen umherschwirren und sich auf alles Neue stürzen und Wort für Wort abspeichern, oder durch die Anwender selbst, die ihre Homepage anmelden.

Hinweise für Homepage-Anbieter

Eigene WWW-Angebote können (mühsam) bei den einzelnen Suchmaschinen an- und abgemeldet werden. Eleganter erfolgt die Anmeldung über Dienstleister (z.B. hier) oder WWW-Angebote (z.B. www.fragezeichen.de/urleintrag - hier wird eine WEB-Site kostenlos in 9 Suchmaschinen automatisch eingetragen).

Über eine Datei - robots.txt - im Stammverzeichnis eines WWW-Angebotes, können Verzeichnisse spezifiziert werden, die von den Suchmaschinen nicht berücksichtigt werden sollen. In den folgenden Fall bleiben die Verzeichnisse /radom, /secure und /_private unberücksichtigt:

# robots for archmatic.com

User-agent: *

Disallow: /random
Disallow: /secure
Disallow: /_private

Bekannte Suchmaschinen im WWW sind (siehe auch im AEC.WEB):

... und eine direkt zum ausprobieren:

Infoseek

Suche in ...

Verknüpfungen: UND - ODER - NICHT - NAHE - "PHRASE"

außerdem noch interessant:
 

 


 

Ausführliche Informationen - mit sehr guter Beschreibung der einzelnen Suchdienste gibt es zudem in der Suchfibel von Stefan Karzauninkat.

Im AEC-WEB gibt es eine ständig wachsende Sammlung von Beiträgen zum Thema INTERNET und Architekten.
 

Meldungen  

   rlinie.gif (1017 Byte)

 


 

Suchmaschinen versagen: Studie zählt 800 Mio. Webseiten
(Meldung von Hightext, 12.7.1999)

Alle Internet-Suchmaschinen hinken der Entwicklung des Web hinterher. Zu diesem Ergebnis kommt eine Studie der Wissenschafts-Zeitschrift 'Nature'. Keine Suchmaschine katalogisiere mehr als 16 Prozent des Webs, heißt es. Noch vor anderthalb Jahren hatte eine ähnliche Untersuchung bessere Such-Ergebnisse dokumentiert. Damals deckten die besten Suchmaschinen 33 Prozent des Internets ab.

Die beste Suchmaschine, Northern Light erreicht eine Trefferquote von 16 Prozent. Dich auf den Fersen: Snap and Altavista. Hotbot, die bei der letzten Untersuchung auf 34 Prozent kam, rutsche auf einen Wert von nur noch elf Prozent.

Die Studie kam zu dem Ergebnis, daß es inzwischen durchschnittlich mehr als ein halbes Jahr dauert, bis eine Website von einem Crawler indiziert wird. Die Autoren schätzen, daß im Februar das durchsuchbare Web aus etwa 800 Millionen Seiten mit mehr als sechs Trillionen Zeichen besteht. Die Untersuchung im Dezember 1997 kam auf 320 Millionen.Zum Vergleich: Die US-Kongreßbibliothek mit ihren rund 800 Kilometern Buchrücken besteht aus 20 Trillionen Zeichen.

Die Studie wurde von den Informatik-Wissenscjhaftlern Steve Lawrence und C. Lee Giles am NEC Research Institute in Princeton, N.J. durchgeführt.
 

Das gezähmte Netz
(Meldung der Science News, 2.5.1998)

Einem Team von Forschern der Cornell Universität (www.cornell.edu) und das Almaden Forschungszentrums von IBM (http://www.ibm.com) ist es gelungen, eine Methode zu entwickeln, mit der die Anzahl von Antworten auf eine Internet-Suchanfrage beschränkt werden kann; das neue Verfahren stützt sich bei der Suche nicht, wie bisher üblich, auf Wörter im Text, sondern auf sogenannte Hotlinks. Diese Verweise zwischen Internet-Seiten stellen "genau die Art menschlicher Bewertung dar, die wir brauchen, um geeignete Quellen zu finden, die sich auf die Suchbegriffe beziehen", sagte Jon Kleinberg von der Cornell Universität. Sein Programm führt zunächst eine normale textbasierte Suche durch, die dann um diejenigen Internet-Seiten erweitert wird, auf die die gefundenen Seiten verweisen. Anschließend wertet das Programm unabhängig vom Text die Links aus und sortiert die Seiten anhand der Häufigkeit von Links, die auf die jeweilige Seite verweisen oder auf der jeweiligen Seite vorhanden sind. Nach mehreren Suchdurchgängen werden die Ergebnisse zu einer Liste der wesentlichen Informationsquellen zum gesuchten Thema zusammengefaßt. IBM hat den zugrundeliegenden Algorithmus zum Patent angemeldet.
 

Schlechte Noten für Suchmaschinen
(Meldung der PC-WELT von 7.4.1998)

Ohne die nützlichen Suchmaschinen wie Lycos, Yahoo oder Altavista bliebe manche Information im Internet unauffindbar. Eine amerikanische Studie hat jetzt aber ermittelt, daß diese Suchdienste nicht besonders effektiv arbeiten. Die beiden Forscher Steve Lawrence und Lee Giles des NEC Research Institute ermittelten in Ihrer Studie, daß auf einzelne Suchmaschinen allein kein Verlaß ist, wenn's um die vollständige Erfassung aller Dokumente zu einem Thema geht. Die Forscher gehen davon aus, daß mittlerweile rund 320 Millionen Seiten im WWW veröffentlicht sind. Die einzelnen Suchmaschinen decken aber nur drei (Lycos) bis 34 (Hotbot) Prozent dieser Informationen ab. Der Einsatz von Meta-Suchmaschinen, zum Beispiel Metacrawler, erhöht die Effizienz beim Aufstöbern der gesuchten Informationen erheblich: www.metacrawler.com
 

  
(zurück) zum Glossar:

  Bücher zum Thema:
 


Bestellungen aus Deutschland werden von unserem Partner AMAZON.de versandkostenfrei
und ohne Mindestbestellwert bearbeitet!

Noch mehr ausgewählte Bücher gibt es bei BAUBUCH.de.

   
Infos / BestellungDie Suchfibel
Wie findet man Informationen im Internet.

Stefan Karzauninkat

Juni 1999. Gebundene Ausgabe. 224 Seiten.
Klett Schulbuch - ISBN: 3122381052
Preis: DM 39,80 (EUR 20,35)
m-leer.gif (832 Byte)
Die Suchfibel gibt es auch ONLINE: www.suchfibel.de.


    

 

  (zurück) zum Glossar:

  
Copyright: Alfons Oebbeke, Neustadt 1997 bis 1999
Navigation ohne Frames:
 
l-aecweb.gif (761 Byte)- glossar-
# A B C D E F G H I J K L M N O P Q R S T U V W X Y Z