Indicizzazione di un sito nei motori di ricerca. Come funziona l'indicizzazione del sito in "Yandex" e "Google"
Cos'è l'indicizzazione del sito? Come va? Puoi trovare le risposte a queste e ad altre domande nell'articolo. L'indicizzazione Web (indicizzazione nei motori di ricerca) si riferisce al processo di collegamento di informazioni su un sito a un database come robot di un motore di ricerca, che viene successivamente utilizzato per cercare informazioni sui progetti web che hanno subito tale procedura.
I dati sulle risorse web sono spesso costituiti daparole chiave, articoli, link, documenti. Audio, immagini e così via possono anche essere indicizzati. È noto che l'algoritmo per l'identificazione delle parole chiave dipende dal dispositivo di ricerca.
C'è un limite per i tipi di informazioni da indicizzare (file flash, javascript).
Gestione della comunione
L'indicizzazione di un sito è un processo complicato. Per gestirlo (ad esempio, per vietare l'introduzione di una pagina particolare), è necessario utilizzare il file robots.txt e le prescrizioni come Consenti, Disallow, Ritardo scansione, Agente utente e altri.
Utilizzati anche per l'indicizzazione sono tag <noindex> e <nofollow> oggetti di scena, che nascondono il contenuto della risorsa da robot di Google e Yandex (Yahoo utilizza il tag <nofollow>).
Nel motore di ricerca di Goglle, i nuovi siti sono indicizzati da un paio di giorni a una settimana e in Yandex da una settimana a quattro.
Vuoi che il tuo sito appaia nelle richiesterisultati del motore di ricerca? Quindi dovrebbe essere elaborato da Rambler, Yandex, Google, Yahoo e così via. È necessario informare i motori di ricerca (spider, sistemi) sull'esistenza del proprio sito Web e quindi eseguirne la scansione in tutto o in parte.
Molti siti non sono indicizzati nel corso degli anni. Le informazioni che sono su di loro non sono viste da nessuno tranne i loro proprietari.
Modi di elaborazione
L'indicizzazione del sito può essere eseguita in diversi modi:
- La prima opzione è l'aggiunta manuale. Devi inserire i dati del tuo sito attraverso i moduli speciali offerti dai motori di ricerca.
- Nel secondo caso, il robot del motore di ricerca stessotrova il tuo sito Web per riferimento e lo indicizza. Può trovare il tuo sito tramite link da altre risorse che portano al tuo progetto. Questo metodo è più efficace. Se il motore di ricerca ha trovato il sito in questo modo, lo considera significativo.
condizioni
L'indicizzazione del sito non è troppo veloce. I termini sono diversi, da 1-2 settimane. I collegamenti da risorse autorevoli (con eccellenti PR e Tits) velocizzano significativamente il posizionamento del sito nel database dei motori di ricerca. Oggi, il più lento è Google, anche se fino al 2012 potrebbe fare questo lavoro per la settimana. Sfortunatamente, tutto sta cambiando molto velocemente. È noto che Mail.ru lavora con siti Web in quest'area per circa sei mesi.
Indicizzazione del sito nei motori di ricerca da implementareNon tutti gli specialisti sono in grado. La tempistica di aggiungere al database delle nuove pagine già elaborate dal sito dei motori di ricerca influisce sulla frequenza di adeguamento del suo contenuto. Se una nuova informazione appare costantemente sulla risorsa, il sistema la considera aggiornata frequentemente e utile per le persone. In questo caso, il suo lavoro è accelerato.
Puoi seguire i progressi dell'indicizzazione di un sito web su sezioni speciali per i webmaster o sui motori di ricerca.
modifiche
Quindi, abbiamo già capito come andareindicizzazione del sito Va notato che i database dei motori di ricerca vengono aggiornati frequentemente. Pertanto, il numero di pagine aggiunte a loro nel progetto potrebbe cambiare (diminuire e aumentare) per i seguenti motivi:
- sanzioni sui motori di ricerca per il sito web;
- presenza di errori sul sito;
- cambiare gli algoritmi dei motori di ricerca;
- hosting disgustoso (inaccessibilità del server su cui si trova il progetto) e così via.
Risposte "Yandex" alle domande ordinarie
Yandex è un motore di ricerca utilizzatomolti utenti. Si posiziona al quinto posto tra i sistemi di ricerca nel mondo in termini di numero di richieste di ricerca elaborate. Se aggiungi un sito, potrebbe essere aggiunto al database troppo a lungo.
L'aggiunta di un URL non garantisce la sua indicizzazione. Questo è solo uno dei metodi con cui il robot di sistema viene informato che è stata visualizzata una nuova risorsa. Se non ci sono collegamenti al sito da altri siti Web o pochi di essi, l'aggiunta aiuterà a trovarlo più velocemente.
Se l'indicizzazione non si verifica, è necessario controllare, noc'era un crash del server al momento della creazione dell'applicazione dal robot "Yandex". Se il server segnala un errore, il robot finirà il suo lavoro e cercherà di eseguirlo come una soluzione completa. I dipendenti Yandex non possono aumentare la velocità di aggiunta di pagine alla base dei motori di ricerca.
L'indicizzazione di un sito in Yandex è carinaoccupazione difficile. Non sai come aggiungere una risorsa a un motore di ricerca? Se ha collegamenti da altri siti Web, non è necessario aggiungere un sito Web speciale: il robot lo cercherà automaticamente e indicizzerà. Se non si dispone di tali collegamenti, è possibile utilizzare il modulo "Aggiungi URL" per dichiarare al motore di ricerca che esiste un sito Web.
È necessario ricordare che l'aggiunta di un URL non garantisce l'indicizzazione della tua creazione (o la sua velocità).
Molti si chiedono quanto ci vuoleindicizzazione del sito in Yandex. I dipendenti di questa azienda non danno garanzie e non prevedono le date. Di norma, dal momento che il robot ha scoperto il sito, le sue pagine di ricerca vengono visualizzate in due giorni, a volte in un paio di settimane.
Processo di elaborazione
Yandex è un motore di ricerca che richiede precisione e attenzione. L'indicizzazione del sito consiste di tre parti:
- Cerca robot esegue la scansione delle pagine delle risorse.
- Il contenuto (contenuto) del sito è registrato nel sistema di ricerca del database (indice).
- Dopo 2-4 settimane, dopo aver aggiornato il database, è possibile vedere i risultati. Il tuo sito verrà visualizzato (o non verrà visualizzato) nei risultati di ricerca.
Controllo dell'indicizzazione
Come controllare l'indicizzazione del sito? Puoi farlo in tre modi:
- Inserisci il nome della tua azienda nella lineacerca (ad esempio, "Yandex") e controlla ciascun link nella prima e nella seconda pagina. Se trovi l'URL del tuo cervello lì, significa che il robot ha completato il suo compito.
- Puoi inserire l'URL del tuo sito nella riga di ricerca. Puoi vedere quanti elenchi di Internet sono visualizzati, cioè indicizzati.
- Iscriviti alle pagine del webmaster all'indirizzoMail.ru, Google, Yandex. Dopo aver superato la verifica del sito, sarai in grado di vedere i risultati dell'indicizzazione e di altri servizi del motore di ricerca creati per migliorare le prestazioni della tua risorsa.
Perché Yandex rifiuta?
L'indicizzazione del sito in Google viene eseguitacome segue: il robot nel database entra in tutte le pagine del sito, di scarsa qualità e qualità, senza scelta. Ma solo i documenti utili sono coinvolti nella classifica. Un "Yandex" esclude immediatamente tutto il cestino web. Può indicizzare qualsiasi pagina, ma il motore di ricerca alla fine eliminerà tutti i rifiuti.
Entrambi i sistemi hanno un indice incrementale. Sia quella che le altre pagine di bassa qualità influenzano la valutazione generale del sito. Impiega una filosofia semplice. Le risorse preferite di un particolare utente occuperanno posizioni più elevate nella sua emissione. Ma questo stesso individuo difficilmente troverà un sito che non gli è piaciuto l'ultima volta.
Ecco perché, prima di tutto, è necessario nascondere le copie dei documenti Web dall'indicizzazione, ispezionare la presenza di pagine vuote e non consentire l'emissione di contenuti di scarsa qualità.
Accelerazione di Yandex
Come puoi velocizzare l'indicizzazione del sito in "Yandex"? Sono richiesti i seguenti passaggi:
- Installa il browser Yandex sul tuo computer e sfoglia le pagine del sito che lo utilizzano.
- Conferma i diritti per gestire la risorsa in Yandex.Webmaster.
- Su Twitter pubblica un link all'articolo. È noto che dal 2012, Yandex ha collaborato con questa società.
- Per il sito aggiungi una ricerca da Yandex. Nella sezione "Indicizzazione" puoi specificare i tuoi URL.
- Inserire il codice "Yandex.Metrica" senza specificare il segno di spunta "L'invio di pagine per l'indicizzazione è vietato".
- Crea una Sitemap esistentesolo per il robot e non visibile al pubblico. Il controllo inizierà con lui. L'indirizzo della Sitemap è inserito in robots.txt o in un apposito modulo nel "Webmaster" - "Impostazione dell'indicizzazione" - "Sitemap".
Azioni intermedie
Cosa devi fare mentre la pagina web"Yandex" non è indicizzato? Motore di ricerca nazionale dovrebbe considerare il sito come fonte originale. Per questo motivo, anche prima della pubblicazione dell'articolo, è necessario aggiungere il suo contenuto al modulo "Testi specifici". Altrimenti, i plagi copieranno il record nella loro risorsa e saranno prima nel database. Di conseguenza, saranno riconosciuti dagli autori.
Database di Google
Per Google, gli stessi consigli, che abbiamo descritto sopra, sono adatti, solo i servizi saranno diversi:
- Google+ (invece di Twitter);
- Google Chrome
- Dispositivi Google per programmatori: "Scansione" - "Assomiglia a Googlebot" - Opzione "Scansione" - Opzione "Aggiungi all'indice";
- Cerca all'interno della risorsa da Google;
- Google Analytics (invece di Yandex.Metrics).
divieto
Qual è il divieto di indicizzazionesito? Puoi imporlo sia sull'intera pagina, sia sulla sua parte separata (link o testo). In effetti, c'è sia un divieto globale di indicizzazione che uno locale. Come viene implementato?
Considera il divieto di aggiungere un sito web al motore di ricerca in Robots.txt. Utilizzando il file robots.txt, puoi escludere l'indicizzazione di una singola pagina o di un'intestazione di una intera risorsa come questa:
- User-agent: *
- Non consentire: /kolobok.html
- Non consentire: / foto /
Il primo paragrafo dice che le istruzionidefinito per tutti i PS, il secondo indica il divieto di indicizzare il file kolobok.html e il terzo non consente di aggiungere l'intero riempimento della cartella foto al database. Se è necessario escludere più pagine o cartelle, specificarle tutte in "Robot".
Al fine di evitare l'indicizzazioneUn elenco Internet separato, è possibile applicare il meta tag robots. Differisce da robots.txt in quanto fornisce istruzioni a tutti i PS contemporaneamente. Questo meta tag è soggetto ai principi generali del formato html. Dovrebbe essere inserito nell'intestazione della pagina tra i tag <head> <head>. Ad esempio, una voce per un ban può essere scritta in questo modo: <meta name = "robots" content = "noindex, nofollow">.
Ajax
E come funziona l'indicizzazione dei siti Yandex Ajax? Oggi molti sviluppatori di siti Web utilizzano la tecnologia Ajax. Certo, lei ha grandi opportunità. Con esso, è possibile creare pagine Web interattive ad alta velocità e produttive.
Tuttavia, il robot del motore di ricerca vede la lista web.non come l'utente e il browser. Ad esempio, una persona guarda un'interfaccia comoda con gli elenchi di Internet mobile. Per un robot di ricerca, il contenuto della stessa pagina può essere vuoto o presentato come il resto del contenuto HTML statico, per la generazione di cui gli script non funzionano.
Puoi utilizzare gli URL con # per creare siti Ajax,ma il suo motore di ricerca per robot non usa. Di solito la parte dell'URL dopo il # è separata. Questo deve essere preso in considerazione. Pertanto, anziché l'URL del modulo http://site.ru/#example, rende un'applicazione alla pagina principale della risorsa, che si trova all'indirizzo http://site.ru. Ciò significa che il contenuto del foglio Internet potrebbe non essere incluso nel database. Di conseguenza, non verrà visualizzato nei risultati di ricerca.
Migliorare l'indicizzazione dei siti AjaxYandex supportava le modifiche al motore di ricerca e le regole di elaborazione degli URL per tali siti web. Oggi i webmaster possono indicare al motore di ricerca Yandex la necessità di indicizzazione creando lo schema appropriato nella struttura delle risorse. Per questo è necessario:
- Sostituisci # nell'URL della pagina con #!. Ora il robot capirà che sarà in grado di richiedere la versione HTML del contenuto di questo foglio Internet.
- La versione HTML del contenuto di tale pagina deve essere inserita nell'URL, dove #! sostituito da? _escaped_fragment_ =. </ ol </ p>