Login Registrati

Google non indicizza tutte le mie pagine


rekka Offline
Newbie
*

Regular Member


Messaggi: 14
Registrato: Dec 2013
Reputazione: 0
#1
Google non indicizza tutte le mie pagine
Ciao a tutti
Sono nella disperata situazione seguente. Da più di un mese google non aggiunge pagine indicizzate al mio sito. Oggi sono a 202 pagine inviate e me ne indicizza solo 112 esattamente come più di un mese fa quando ne inviavo circa 115.
Premetto che sto utilizzando il plugin Google SEO per mybb, e che circa 1 mese fa ho rinominato uno dei forum presenti nelle varie sezioni (uno dei più attivi).
Leggendo qua e la ho notato che il robot.txt che inviavo probabilmente era sbagliato poiché avendo il forum dentro la cartella aggiuntiva /forum/ non avevo messo il prefisso /forum/ dopo i disallow dentro il robot.txt.
Ora il robot.txt rimanda al seguente link contenente la sitemap misurando.org/forum/sitemap-index.xml, ma se vado a verificare con filezilla il file della sitemap non lo trovo… è corretto??? Se apro dal browser il link invece lo trovo. Se testo il sitemap con il link precedente in strumenti webmaster mi da conferma positiva.
Ora chiedo un aiuto per sistemare le cose ammesso che serva.
Se dovessi rigenerare la sitemap come faccio??? La sitemap del link misurando.org/forum/sitemap-index.xml può andar bene per il mio sito???
Se vi mando il allegato i seguenti file .htacces, robot.txt gentilmente potete dare un’occhiata e vedere se è tutto ok???
Grazie infinite dell’aiuto

28-03-2014, 10:27,
Cita mess.

Psyke Offline
Administrator
*******

Administrators


Messaggi: 194
Registrato: Dec 2012
Reputazione: 1
#2
RE: Google non indicizza tutte le mie pagine
Prima di tutto devi capire il funzionamento delle sitemap.xml e del file robots.txt.
La sitemap non è altro che un file che contiene tutti i link (importati) del sito/forum/blog da inviare ai motori di ricerca, appunto si viene a creare una mappa del sito.
Il file robots.txt è un file che configurato in un certo modo (seguendo la sua sintassi), blocca (o almeno consiglia il blocco del contenuto, sta ai motori di ricerca rispettarlo) la visualizzazione ed l'indicizzazione dei files,cartelle e pagine.
Entrambi hanno lo scopo di non far perdere tempo ai spiders che analizzano il sito, inviando pagine di contenuto e bloccando il passaggio a pagine prive di contenuto o con contenuto duplicato (modalità stampabile - modalità archivio).

Ora seguendo questo ragionamento, non si devono inserire link nella sitemap per poi bloccarli nel file robots.


Ho notato che stai utilizzando il file robots.txt  che ho creato io, ma non hai configurato bene google SEO, non tanto per il prefisso ma per l'url e le sitemap. Così facendo, stai creando delle sitemap con pagine prive di contenuto come il profilo utenti o peggio ancora il calendario (una volta che uno spieder ci entra ci si perde, perchè il calendartio genera pagine infinite prive di contenuto).
Ricordati di rinominare il tuo file Robots.txt in robots.txt perché molti motori di ricerca sono case sensitive.

La sitemap la genera google seo nel momento in cui clicki su apply per poi aggiornarla in automatico di volta in volta.
Il link della sitemap generata da google seo è  tuosito/misc.php?google_seo_sitemap=index  , invece con la riscrittura dell'url è tuosito/sitemap-index.xml.
Il file non esite fisicamente, ma viene generato dallo script di google seo e depositato nel database mysql (del resto tutto il forum mybb funziona così).

Se hai inviato 202 url a google ma ne ha indicizzati solo 112, i motivi possono essere tanti.
Sicuramente non dipendono dal fatto di aver rinominato una sezione, apprate il fatto che la riscrittura dell'url nelle discussioni in mybb non dipende dalle sezione (salvo configurazioni particolari), ma con google seo attivo si viene a generare un redirect 301 che reindirizza il vecchio url al nuovo.
I veri motivi potrebbe essere per il file robots.txt  oppure per il metatag noindex/nofollow oppure perchè google stesso non vuole indicizzare le pagine per altri suoi motivi (contenuto osceno, pagine prive di contenuto, pagine duplicate ecc..).

In ogni caso ti consiglio di leggerti/rileggerti e seguire la  Guida come configurare Google SEO MyBB, puoi anche saltare la riscrittura dell'url, ma il resto è quasi obbligatorio per un'ottimizzazione ottimale del SEO.

Una volta configurato tutto come si deve, google e gli altri motori di ricerca per aggiornare il loro database, ci potrebbero impiegare giorni/settimane/mesi. Tutto dipende dal numero di pagine e dall'importanza che i spiders assegnano al tuo sito.


28-03-2014, 22:20,
Cita mess.

rekka Offline
Newbie
*

Regular Member


Messaggi: 14
Registrato: Dec 2013
Reputazione: 0
#3
RE: Google non indicizza tutte le mie pagine
ciao grazie delle info. in questo momento ho rinominato il robots.txt. ora vado a rileggermi la discussione così cerco di farmi chiarezza.

l'utente ha aggiunto in seguito
come posso inviarti un .png così ti faccio vedere come sono messo??
c'è lo sul computer.
grazie

(Questo messaggio è stato modificato l'ultima volta il: 01-04-2014, 12:53 da rekka.)
01-04-2014, 12:46,
Cita mess.

Psyke Offline
Administrator
*******

Administrators


Messaggi: 194
Registrato: Dec 2012
Reputazione: 1
#4
RE: Google non indicizza tutte le mie pagine
Puoi uppare l'immagine in theimagehost.net oppure tinypic.com e linkarla.


01-04-2014, 15:55,
Cita mess.

rekka Offline
Newbie
*

Regular Member


Messaggi: 14
Registrato: Dec 2013
Reputazione: 0
#5
RE: Google non indicizza tutte le mie pagine
Grazie Psyke per le info. ho sistemato un pò le cose e le pagie indicizzate ora sono ok. però volevo migliorare ancora dal punto di vista SEO. Infatti credo di essere partito maluccio perchè oltre al problema di mybb che ha dei link poco chiari ho pure piazzato il forum nella sottocartella /forum/. Utilizzando il plugin google SEO mi ritrovo con delle parole ripeture nei link e questo non aiuta molto google. Vorrei anche accorciare il suffisso "FORUM" utilizzando solo la lettera "F".
Ora chiedo siccome eliminerò la sottocartella /forum/ e accorcerò i suffissi FORUM con F THREAD con T eccetera credo che si genereranno un sacco di pagine con errore 404. Come posso riconfigurare il htaccess in mofo di evitare ciò???
Io pensavo di prendere le regole di google seo nell'htaccess e spostarle assieme alle pagine reindirizzate che stanno più sotto sempre nel htaccess. Quelle vicine a quelle di default utilizzate da mybb.

che ne pensate?? 

l'utente ha aggiunto in seguito
Ecco il mio htaccess attuale:

Codice:
# EXAMPLE .htaccess FOR MYBB WITH GOOGLE SEO URL
# -------------------------------------------------------------------
# This file is identical to MyBB's htaccess.txt example file,
# with rewrite rules for a standard Google SEO install added.
#
# Before using this file please make sure to:
#
#   - replace /MyBB/ with your forum folder, e.g. / or /forum/
#   - replace yoursite/MyBB with your forum URL
#   - name the file '.htaccess' (starting with the dot, no .txt)
#
# Alternatively you can add the required rewrite rules to your
# existing .htaccess, the specific rules required will be displayed
# on the plugin status page once Google SEO URL is enabled.
# -------------------------------------------------------------------

Options -MultiViews +FollowSymlinks -Indexes

#
# If mod_security is enabled, attempt to disable it.
# - Note, this will work on the majority of hosts but on
#   MediaTemple, it is known to cause random Internal Server
#   errors. For MediaTemple, please remove the block below
#
<IfModule mod_security.c>
        # Turn off mod_security filtering.
        SecFilterEngine Off

        # The below probably isn't needed, but better safe than sorry.
        SecFilterScanPOST Off
</IfModule>

#
# MyBB "search engine friendly" URL rewrites
# - Note, for these to work with MyBB please make sure you have
#   the setting enabled in the Admin CP and you have this file
#   named .htaccess
#
<IfModule mod_rewrite.c>
        RewriteEngine on

        # Some hosts need a RewriteBase specification.
        RewriteBase /forum/

        # Google SEO workaround for search.php highlights:
        # Make this rule the first rewrite rule in your .htaccess!
        RewriteRule ^([^&]*)&(.*)$ http://www.misurando.org/forum/$1?$2 [L,QSA,R=301]

        # Google SEO Sitemap:
RewriteRule ^sitemap\-([^./]+)\.xml$ misc.php?google_seo_sitemap=$1 [L,QSA,NC]

# Google SEO URL Forums:
RewriteRule ^Forum\-([^./]+)$ forumdisplay.php?google_seo_forum=$1 [L,QSA,NC]

# Google SEO URL Threads:
RewriteRule ^Thread\-([^./]+)$ showthread.php?google_seo_thread=$1 [L,QSA,NC]

# Google SEO URL Announcements:
RewriteRule ^Announcement\-([^./]+)$ announcements.php?google_seo_announcement=$1 [L,QSA,NC]

# Google SEO URL Users:
RewriteRule ^User\-([^./]+)$ member.php?action=profile&google_seo_user=$1 [L,QSA,NC]

# Google SEO URL Calendars:
RewriteRule ^Calendar\-([^./]+)$ calendar.php?google_seo_calendar=$1 [L,QSA,NC]

# Google SEO URL Events:
RewriteRule ^Event\-([^./]+)$ calendar.php?action=event&google_seo_event=$1 [L,QSA,NC]

        # Google SEO 404:
        ErrorDocument 404 /forum/misc.php?google_seo_error=404

        # Default MyBB Rewrite Rules:
        RewriteRule ^forum-([0-9]+)\.html$ forumdisplay.php?fid=$1 [L,QSA]
        RewriteRule ^forum-([0-9]+)-page-([0-9]+)\.html$ forumdisplay.php?fid=$1&page=$2 [L,QSA]

        RewriteRule ^thread-([0-9]+)\.html$ showthread.php?tid=$1 [L,QSA]
        RewriteRule ^thread-([0-9]+)-page-([0-9]+)\.html$ showthread.php?tid=$1&page=$2 [L,QSA]
        RewriteRule ^thread-([0-9]+)-lastpost\.html$ showthread.php?tid=$1&action=lastpost [L,QSA]
        RewriteRule ^thread-([0-9]+)-nextnewest\.html$ showthread.php?tid=$1&action=nextnewest [L,QSA]
        RewriteRule ^thread-([0-9]+)-nextoldest\.html$ showthread.php?tid=$1&action=nextoldest [L,QSA]
        RewriteRule ^thread-([0-9]+)-newpost\.html$ showthread.php?tid=$1&action=newpost [L,QSA]
        RewriteRule ^thread-([0-9]+)-post-([0-9]+)\.html$ showthread.php?tid=$1&pid=$2 [L,QSA]

        RewriteRule ^post-([0-9]+)\.html$ showthread.php?pid=$1 [L,QSA]

        RewriteRule ^announcement-([0-9]+)\.html$ announcements.php?aid=$1 [L,QSA]

        RewriteRule ^user-([0-9]+)\.html$ member.php?action=profile&uid=$1 [L,QSA]

        RewriteRule ^calendar-([0-9]+)\.html$ calendar.php?calendar=$1 [L,QSA]
        RewriteRule ^calendar-([0-9]+)-year-([0-9]+)\.html$ calendar.php?action=yearview&calendar=$1&year=$2 [L,QSA]
        RewriteRule ^calendar-([0-9]+)-year-([0-9]+)-month-([0-9]+)\.html$ calendar.php?calendar=$1&year=$2&month=$3 [L,QSA]
        RewriteRule ^calendar-([0-9]+)-year-([0-9]+)-month-([0-9]+)-day-([0-9]+)\.html$ calendar.php?action=dayview&calendar=$1&year=$2&month=$3&day=$4 [L,QSA]
        RewriteRule ^calendar-([0-9]+)-week-(n?[0-9]+)\.html$ calendar.php?action=weekview&calendar=$1&week=$2 [L,QSA]

        RewriteRule ^event-([0-9]+)\.html$ calendar.php?action=event&eid=$1 [L,QSA]

        <IfModule mod_env.c>
                SetEnv SEO_SUPPORT 1
        </IfModule>
</IfModule>

#
# If Apache is compiled with built in mod_deflade/GZIP support
# then GZIP Javascript, CSS, HTML and XML so they're sent to
# the client faster.
#
<IfModule mod_deflate.c>
        AddOutputFilterByType DEFLATE application/x-javascript text/css text/html text/xml
</IfModule>

(Questo messaggio è stato modificato l'ultima volta il: 12-04-2014, 20:24 da rekka.)
12-04-2014, 19:53,
Cita mess.

Psyke Offline
Administrator
*******

Administrators


Messaggi: 194
Registrato: Dec 2012
Reputazione: 1
#6
RE: Google non indicizza tutte le mie pagine
Se hai risolto il problema e ne hai uno nuovo di tutt'altro argomento, apri una nuova discussione.

Puoi usare i redirect permanent (301) in modo da non far apparire pagine 404 e non perdere la posizione delle pagine già indicizzate.


13-04-2014, 15:36,
Cita mess.

rekka Offline
Newbie
*

Regular Member


Messaggi: 14
Registrato: Dec 2013
Reputazione: 0
#7
RE: Google non indicizza tutte le mie pagine
Apro subito grazie

13-04-2014, 20:02,
Cita mess.


Vai al forum:


Utenti che stanno guardando questa discussione: 1 Ospite(i)


Copyright © 2002-2017 CheatVsGame