Blog informatii diverse

Scriu si comentez stiri aparute despre optimizare site-uri, politica, alte evenimente

Tag Archives: AOL

Informaţii generale SEO, istoria motoarelor de căutare

Istoria motoarelor de căutare
În primele zile ale dezvoltării internetului utilizatorii săi erau o minoritate privilegiată, şi cantitatea de informaţii disponibilă era relativ mică. Accesul era aproape restricţionat la angajaţii din diverse laboratoare şi universităţi, care îl foloseau pentru a obţine informaţii ştiinţifice. În acele zile problema găsirii informaţiilor pe internet nu era aşa de critică cum este acum.

Site-urile directoare erau una dintre primele metode folosite pentru a facilita accesul la resursele informaţiei pe reţea. Legăturile / linkurile către aceste resurse erau grupate în funcţie de subiect. Directorul Yahoo! a fost primul proiect din genul lui, deschis în aprilie 1994. Aşa cum numărul de site-uri din directorul Yahoo! a crescut în mod implacabil dezvoltatorii Yahoo! au făcut directorul “căutabil” (au adăugat directorului un motor de căutare). Desigur nu a fost un motor de căutare în adevăratul înţeles al cuvântului, deoarece căutările erau limitate la acele resurse / informaţii ale căror listări erau făcute în director. Nu căuta efectiv să afişeze resurse externe şi conceptul de SEO nu era încă cunoscut.

Asemenea linkuri directoare au fost folosite intens în trecut, dar în zilele noastre şi-au pierdut mult din popularitate. Motivul este simplu, chiar şi directoarele moderne cu multe resurse oferă informaţii referitoare la o mică parte din internet. De exemplu, cel mai mare director de pe reţea este în momentul actual DMOZ (sau Open Directory Project), director aparţinând motorului de căutare Google. Conţine informaţii despre aproape 5 milioane de resurse. Comparaţi aceste informaţii cu cele ale bazei de date ale motorului de căutare Google care conţin mai mult de 8 miliarde de documente.

Proiectul WebCrawler a pornit în anul 1994 şi a fost primul motor de căutare complet cu aceasta caracteristică. Motoarele de căutare Lycos şi AltaVista au apărut în anul 1995 şi pentru mulţi ani AltaVista a fost un jucător mare pe acest teren.

În anul 1997 Sergei Brin şi Larry Page au creat motorul de căutare Google ca un proiect de cercetare  la Universitatea Stanford. Google este acum cel mai popular motor de căutare din lume.

În momentul de faţa există trei motoare de căutare internaţionale de vârf – Google, Yahoo! şi motorul de cautare MSN (acum Bing). Fiecare dintre acestea au propria bază de date şi propriul algoritm de căutare. Foarte multe alte motoare de căutare folosesc rezultate provenind de la aceste trei mari motoare de căutare, şi aceeaşi expertiză SEO poate fi aplicată şi lor. De exemplu, motorul AOL (search.aol.com) foloseşte baza de date a Google în timp ce AltaVista, Lycos şi AllTheWeb folosesc baza de date a motorului de căutare Yahoo!.

Principii comune motoarelor de căutare
Pentru a înţelege tehnica SEO trebuie să fi conştient de arhitectura motoarelor de căutare. Toate conţin principalele componente de bază:

Spider – un program ca browser care descarcă paginile web.
Crawler – un program care urmăreşte automat toate linkurile de pe fiecare pagină.
Indexer – un program care analizează paginile descărcate de către spider şi de către crawler.
Database (bază de date) – spaţiu de stocare pentru paginile descărcate şi procesate.
Results engine – rezultatele cautate extrase din baza de date.
Web Server – un server care este responsabil cu interacţiunea dintre un utilizator şi celelalte componente ale unui motor de căutare.

Implementările specifice ale mecanismelor de căutare pot sa difere. De exemplu, componentele Spider+Crawler+Indexer, acest grup de componente poate fi implementat ca un singur program care să descarce pagini web, care să le analizeze şi apoi să folosească linkurile pentru a găsi noi resurse. Cu toate acestea componentele enumerate sunt moştenite de către toate motoarele de căutare şi principiile SEO sunt aceleaşi.

Spider – Acest program descarcă pagini web la fel cum face şi un browser web. Diferenţa este ca un browser afişează informaţia prezentată pe fiecare pagină (text, grafică / imagini, etc.) în timp ce un spider nu are nici o componentă vizuală, şi lucrează direct cu codul ascuns HTML al paginii. Poate că ştiţi deja că este o opţiune în browserele web standard pentru a vedea codul sursă HTML.

Crawler – Acest program găseşte toate linkurile de pe fiecare pagină. Sarcina sa este de a determina unde spider-ul ar trebui să meargă, fie pentru evaluarea linkurilor sau în conformitate cu o listă predefinită de adrese. Crawler-ul urmează aceste linkuri şi incearcă să găsească documente încă necunoscute motorului de căutare.

Indexer – Această componentă analizează fiecare pagină şi de asemenea analizează diverse elemente ca de exemplu: text, anteturi, caracateristici structurale şi stilistice, etichete speciale HTML (taguri), etc.

Database (baza de date) – Aceasta este o zonă de stocare pentru datele pe care motoarele de căutare le descarcă şi analizează. Câteodată mai este numit şi indexul motoarelor de căutare.

Results Engine (rezultatele motorului)Motorul rezultate clasează paginile. Determină care pagini se potrivesc cel mai bine la interogarea / căutarea unui utilizator şi în ce ordine paginile trebuie să fie listate / afişate. Aceasta este făcută în concordanţa cu algoritmul de afişare al motorului de căutare. Rezultă că page rank-ul (nota acordată de motoarele de căutare) este o valoroasă şi interesantă proprietate şi orice specialist SEO este interesat de ea, atunci când încearcă să îmbunătăţească rezultatele site-ului în căutări. În acest articol vom discuta despre factorii SEO care influenţează page rank-ul, în unele detalii.  (în alte articole se va discuta şi despre acest subiect)

Web Server –  Serverul web al motorului de căutare conţine de obicei pagini HTML cu un câmp de intrare, unde utilizatorul poate specifica interogarea de căutare (cuvintele cheie) pe care el sau ea le doreşte. Serverul web este de asemeni responsabil pentru afişarea rezultatelor căutate pentru utilizator sub forma unei pagini HTML.

Sursă preluare şi traducere informaţii site web seo-tutorial.seoadministrator.com.