Încă una bună din minunatul Internet mioritic.

Din 4 site-uri care au anuntat investiții de 6 si 7 cifre (în EUR) trei sunt neoptimizate SEO iar mărimea și structura elementelor care compun paginile cât și lipsa suportului pentru caching in browser demonstrează un dispreț suveran față de internautul român și banda relativ limitată a acestuia. Eu ca eu, dar pe omul obișnuit cum ar trebui sumele așa-zis investite să-l facă să cumpere produse de pe aceste site-uri ?

Ca să nu mai spuneți ca nu ma “ocup” și de autohtoni …

… iar blogosfera zumzăie. Dat fiind că la relansarea de acum un an și jumătate am făcut câteva comentarii de care la vremea respectivă nu s-a sinchisit absolut nimeni, am să reiau un pic tema, poate că de data asta vor fi utile cuiva. Deja o parte din sugestiile altor bloggeri, unele foarte pertinente, au avut impact asupra site-ului care poate fi (acum) integral vizualizat pe un desktop cu rezoluția 1024×768, iar bannerele laterale au dispărut. » mai mult…

… sau mai bine zis playfuls.com, domeniul pe care era gazduit majoritatea continutului care le aducea trafic de Google. Si mai precis, tonele de pagini crawlate de pe diverse alte site-uri pentru ca – nu mai e demult un mister pentru nimeni – Jucaushii este unul dintre business-urile “de Adsense” romanesti bazate in mare proportie pe “Google spam”. Metoda este simpla, se aduna continut cu roboti (cu “japca” ar zice unii), se face optimizare SEO pe el si tocana rezultata se baga pe gatul lui GoogleBot pentru a fi indexata. Iata cum arata statistica de pe trafic (am rotit graficul pentru a-l face mai inteligibil):

playfuls_trafic.gif

Pentru a mai ascunde leopardul, cei de la Jucaushii au scos tag-ul de trafic.ro din pagini, iata insa ce spune Alexa de care e mai greu sa te ascunzi datorita naturii descentralizare a masuratorilor:

playfuls_alexa.jpg

Sau si mai clar, tot pe Alexa:

alexa_playfuls_traf.gif

Pam, pam. Undeva niste baieti sunt in alerta maxima, asta e sigur. Se fac tot felul de redirectari, curatenii, de exemplu funonline.playfuls.com “curge” acum spre www.funonline.ro. Totul in speranta ca “noul” playfuls.com mai parfumat, mai placut la pipait, isi va relua locul pe care il ocupa anterior in indexul Google.

Tot atat de sigur este ca batalia cu algoritmii lui Google dar mai ales cu armata de “verificatori” umani este greu de castigat. Vor urma probabil si alte site-uri, vom vedea la momentul oportun. Cred ca urmeaza o perioada interesanta pentru Internetul romanesc…

Multumesc lui Andrei pentru pont.

Scurta, ca sunt pe fuga… Noul site sport.ro are multe lucruri bune, printre care si SEO ca la carte a URL-urilor. La URL-urile stirilor insa cred ca s-a exagerat, exemplu:

http://www.sport.ro/stiri/5864/Wrestling/Box/Handbal/Atletism/Volei/Rugby/Gimnastica/
Baschet/Local-Kombat/K1/Formula-1/Tenis/Sporturi/Show/Cupa-Romaniei/Liga-1/
Liga-2-Seria-1/Liga-2-Seria-2/Fotbal-Intern/Nationala/Germania/Franta/Spania/Italia/
Anglia/Campionate-externe/Stranieri/Cupa-U/
Ronaldinho-va-construi-doua-stadioane-in-Brazilia.html

Ca user, poate nu observ. Ca SEO-ist, mi se ridica parul in cap de nervi. Ca IT-ist am notat ideea, e de mare angajament, ma duc sa-mi mai pun o cafea. Tare.

Mari succese in aceasta minunata zi de vineri 13 !

Update: s-au miscat repede baietii, iata ce imi afiseaza acum Firefox pe pagina cu pricina:

nicetry.gif

Uhhh … pardon ?

Update2: au reparat rewrite-ul in cateva ore. Bravo, joc de glezne frumos. Au sters si “sdfsdf”-urile de pe pagina cu Ronaldo. Mai ramane sa armonizeze verdele cu portocaliul si s-au scos.

Noul site al Romaniei Libere este lansat la o distanta temporala relativ mica de varianta precedenta, cea “AJAX-ificata”. Elaborata cu ajutorul firmei Zitec, noua formula (aparuta odata cu facelift-ul variantei de hartie) renunta la incarcarea dinamica de elemente in pagina si deci la AJAX. Orlando sustine ca este o mutare buna din punct de vedere business, pentru ca un site este in genere evaluat prin numarul de vizitatori si de pagini vizualizate, care sunt mai mici la o publicatie care isi afiseaza articolele cu AJAX. Contra-argumentele ii apartin lui Vivi, care – la lansarea versiunii care invinge orice grasime – a sustinut pe buna dreptate ca nimic nu te impiedica sa pui reclame si tag-uri de statistica in codul extras cu AJAX. In viziunea lui Vivi, marele castigator era utilizatorul care se bucura de o ergonomie mai buna. In background, si Google iesea un pic mai parfumat, ca mare pontificator al buzzword-ului AJAX.

Parerea mea este ca Orlando are dreptate. Nu este vorba numai de criteriul de business. In momentul in care in codul adus dinamic cu AJAX incepi sa arunci publicitate, taguri de statistica si diferite alte povesti toata treaba incepe sa miroasa neplacut. Ce rost are sa aduci cu AJAX 70-80% din continutul informational al unei pagini destinate vizualizarii publice ? Ai putea la fel de bine sa incarci pagina “clasic” si sa eviti balciul. AJAX isi are rostul cand vrei sa dinamizezi bucati mici de pagina, cu continut foarte fluid: mesaje in timp real, update-uri de preturi la o licitatie, situatia unui stoc foarte dinamic sau informatie specifica unui utilizator ori unui profil. Atunci cand un apel iti modifica prea multe elemente in pagina, este momentul sa-ti pui un semn de intrebare. Se vede treaba ca la RL si-au pus semnul de intrebare si bine au facut.

Un singur comentariu am de facut, legat de optimizarea pentru motoarele de cautare. Exista rewrite, exista si inainte, URL-ul este bine construit, bravo – e minunat. Dar, atunci cand toate articolele au titlul de pagina HTML “Romania Libera: editia online” si cand meta-tagul “description” al fiecarei pagini este identic si anume “Editia online a ziarului Romania Libera” nu trebuie sa mire pe nimeni faptul ca pe Google toate paginile sunt cam la fel descrise, si anume irelevant, plus un bonus de incoerenta de la versiunea precedenta:

rl_google.jpg

Observati ca saracul robot Google incearca sa extraga ceva informatie relevanta din primele cuvinte intalnite din pagina si ne serveste sistematic texte precum “Editii regionale – Bucuresti – Moldova … – RSS”. Nu cred ca trebuia sa exemplific eu, e de bun simt sa scrii un titlu si o descriere in HTML daca vrei ca lumea sa dea click atunci cand un rezultat de pe site-ul tau apare pe Google. In plus, e banal de implementat.

Alte problemute au mai mentionat si cei care au comentat pe thread-ul lui Orlando, nu insist. Eu mai am de intepat doar o mica buba legata de design. Este vorba de reclama din divul “reclama_continut_detalii_articol”, acel patrat maricel care vrei nu vrei trebuie sa se afiseze la 600 de pixeli mai jos de titlul articolului. Atunci cand articolul este mai scurt – si se intampla nu foarte rar – reclama cu pricina este singurica si aiurea pe un mare dreptunghi alb, imediat plasat dupa text. Poate face cineva ceva in acest sens. Sau, nu.

Ca si concluzie, orice am spune site-ul RL a progresat enorm fata de cel de acum aproape un an. Uitati-va numai la diferenta dintre pagina radacina, este clar ca sunt oameni care au priceput miza online-ului si au dorit sa investeasca munca si timp in imaginea ziarului pe Internet. Ce diferenta enorma in bine:

rl2006_2007.jpg

In incheiere, cateva remarci cu dedicatie pentru “baietii de la tehnic”. Mandriva Linux kinda sucks, dar gusturile nu se discuta. Cred. Ceea ce ma deranjeaza pe mine cel mai tare este ca in anul de gratie 2007 mai sunt site-uri Apache care nu au activat mod_gzip-ul si risipesc “cu gratie” banda de Internet atat a ziarului cat si a cititorilor. Banuiesc ca este doar o omisiune care se va rezolva cat de curand.

Am zis.

Dintr-un motiv care imi scapa, presa online din Romania are impresia ca SEO este o chestie sugubeata promovata de niste baieti glumeti. Sigur, nu vorbim de tehnici de blackhat sau spam, ci de lucruri absolut elementare pe care orice programator ASP din Cuca Macaii ar trebui sa le stie in momentul in care scrie cod pentru un site care va fi accesibil public. Cu atat mai mult seful lui de proiect sau consultantul care regizeaza intreaga schema. Dar – cum spuneam mai sus – lucrul acesta nu prea se intampla in Romania. Vezi site-uri foarte cunoscute, cu continut care ar trebui sa fie vizibil pe motoarele de cautare web si sa atraga un puhoi de trafic organic. Ei bine, aceste site-uri isi trag pur si simplu presul de sub picioare ignorand reguli pe care orice novice in programare ar trebui sa le stie inca din anii 2001-2002.

Exemplu concret. Sa luam trei site-uri de presa online specializate pe stiri cu specific economic pe care eu le frecventez, unul dintre ele fiind chiar oglinda unei publicatii reale: bloombiz.ro, capital.ro si wall-street.ro. Ne vom referi doar la una dintre regulile de baza a SEO. Anume, daca vrei ca un articol sa fie cat mai vizibil in rezultatele unei cautari, cuvantul cheie trebuie sa apara chiar in URL. Ideal, intreg titlul articolului trebuie sa apara in URL. Site-ul wall-street.ro face treaba asta demult, inca de pe la inceputul lui 2006 daca-mi aduc eu bine aminte. Hai sa vedem cum arata un URL de-al lor: pentru articolul “Companiile isi vor emite singure facturi”, URL-ul este :

http://www.wall-street.ro/articol/Companii/24095/Companiile-isi-vor-emite-singure-facturi.html

Perfect. Hai sa vedem pe capital.ro (site recent refacut !), link-ul pentru articolul “Cele mai bune plasamente în anul 2007″:

http://www.capital.ro/index.php?section=articole&screen=index&id=100595

Nu numai ca avem o problema la optimizarea pentru cuvintele cheie care alcatuiesc titlul articolului, dar sansele ca acest continut sa ajunga pe un index de cautare precum Google sunt minime. In general URL-urile de acest tip sunt tratate ca o unica pagina index.php. Un caz si mai interesant este bloombiz.ro, site recent reconstruit si acesta, unde pana mai acum vreo 2 luni aveam link-uri de tipul:

http://www.bloombiz.ro/articol_60164.html

care maresc sansele continutului de a fi indexat (drept dovada atat Bloombiz cat si Wall-Street au 90.000 de pagini pe Google in vreme ce Capital are doar un pic mai mult de 2300). Dar, un asemenea link steril nu creste gradul de optimizare la cuvinte cheie, deci posibilitatea ca un articol sa apara bine plasat la cautarile internautilor este destul de redusa. “Noul Bloombiz” face un pas gigantic in fata si ne intampina cu URL-uri de genul:

http://www.bloombiz.ro/article–Cele_mai_scumpe_masini_din_lume_in_2006–77918.html

(de fapt, vechiul URL care este cel indexat de Google va fi redirectat spre noul URL). Super, veti spune, amicii de la Bloombiz s-au gandit la toate atunci cand au lansat noua versiune. Ei bine, surpriza ! S-or fi gandit ei la ceva, dar nu si la faptul ca fisierul robots.txt are urmatorul continut:

User-agent: *
Disallow: /

In “traducere” pentru cei care nu stiu despre ce este vorba, acest fisier interzice robotilor – programe care extrag continut de pe Internet in mod automat – o parte din continut. In cazul de fata, fisierul cu pricina interzice tuturor robotilor sa ia orice fel de continut de pe site. Este o strategie cel putin inedita. Pe de o parte, se optimizeaza site-ul ca sa fie cat mai relevant la cautari, pe de alta parte li se interzice robotilor de pe Google sau Yahoo sa arunce o privire cat de mica pe site. Raman desigur doar spamerii si hotii de continut, pe care ii doare fix in basca de ce scrie in robots.txt – sa nu fim naivi.

Rezultatul din punct de vedere al traficului al acestor 3 strategii diferite de SEO se vede in Alexa. Am sa las graficul sa vorbeasca de la sine:

comparatie_trafic.png

Frustrant este ca, dintre cei 3, singurul care este un adevarat producator de continut si nu se bazeaza in mod decisiv pe copiere din alte surse este site-ul Capital. Care sta cel mai prost. Nu vreau sa dau idei vreunui tembel, dar daca se apuca un baiat interesant sa copieze intreg continutul de pe Capital si sa-l optimizeze corect – intr-un splog*, de exemplu – o sa aiba o caciula de trafic in doar cateva saptamani. Pe undeva, este normal – daca nu stii sa-ti exploatezi continutul, altcineva o va face in locul tau.
* splog = spam blog

avatar Sunt Adrian Spinei, lucrez în industria software din România de aproximativ 12 ... primăveri, bloghez din iunie 2003 iar din 2007 elucubrez aici în limba română. Pentru întrebări, invective și spam felurit adresa mea de email este aspinei [arond] yahoo.com.
Feedburner feed circulation icon
Am scris recent HotnewsRo Reader pentru mobilele cu Android - cititor specializat de știri de pe hotnews.ro