Trilulilu: posibil upgrade, mic studiu de cost

Trilulilu.ro (zis și Trilu) este copilul minune al webdoizero-ului românesc. Dovadă stă și recentul premiu la Internetics, secțiunea “Site-uri divertisment și timp liber”. Este cu atât mai remarcabil cu cât este unul dintre puținele site-uri premiate de Internetics care nici nu este realizat integral în Flash (la mare vogă se pare în netul mioritic) și nu șine de o publicație offline, agenție de presă sau firmă de advertising. Este un succes destul de atipic pentru Internetul românesc dominat de site-uri care trăiesc dintr-o formă sau alta de publicitate convențională (bannere sau site dedicat unui produs/serviciu) și de mirobolantele site-uri “corporate”.

Singura problema pe care am reproșat-o și o reproșez celor de la Trilu este lipsa aproape totală de transparență. și nu mă refer doar la finanțarea cu capital de risc, care mai mult ca sigur există dar este “secretă” – sau la pretextele subțiri cu care suntem sistematic serviți. Este clar că ei ar avea multe lucruri interesante de spus – din punct de vedere tehnic – pentru toți cei care visează să dezvolte un site major pe Internetul românesc, dar care nu au nici cea mai mică idee de complexitatea și costurile pe care le implică un astfel de site. Cam acesta ar fi motivul care m-a determinat să fac o mică investigație, care s-a dovedit a fi foarte (prea?) ușor de efectuat. Plus faptul că azi 3 noiembrie au avut mai multe perioade de downtime ba chiar au mai și schimbat prin ip-urile serverelor. Aceasta, cu o probabilitate mare, indică oareșce upgrade-uri (neanunțate afaik) de servere și/sau structura aplicației. Ca “factor secundar” este fratele meu care în ultimii 2-3 ani cam o dată la 6 luni are o mare idee faraonică de site video, niciodată pusă în aplicare, și m-a cam bătut la cap lately ca să-i estimez costurile unui setup de genul Trilu. Voi da și detalii despre sursele de informare folosite, poate scap pe viitor de întrebări de acest tip :)

netcraft_trilu.gif

Cum poți să afli din exterior detaliile despre un site ? Primul loc spre care te îndrepți este Netcraft – ei țin evidența locașiei și tipului de server de pe toate site-urile cât de cât mari de pe planetă. Nu exagerez, este vorba de întregul Internet. De acolo se pot extrage două rapoarte interesante: site report și uptime report. Se vede destul de clar că pe 27 septembrie 2007 Trilu s-au mutat de pe furnizorul local Euroweb la un furnizor francez, și anume OVH. Pe data de 3 noiembrie, adică azi, IP-rile serverelor s-au schimbat din nou, este drept tot la OVH, iar semnătura serverului nu mai este Apache ci “unknown” dar din câte am mai săpat eu unele dintre mașini încă rulează Apache, pe altele lighttpd. Uptime reportul este minunat dar nu reflectă în întregime realitatea, pagina de intrare fiind servită azi pe alocuri, dar sub forma unui mirific HTTP 504 Gateway Timeout. În traducere liberă asta înseamnă că serverul fiind foarte lent nu a fost capabil să livreze pagina în timp util. Pentru tehnicieni, codul semnalează prezența unui balancer sau a unui reverse proxy. Din istoricul furnizat de Netcraft, mai deducem că site-ul este executat în PHP iar sistemul de operare pe care rulează este Linux – o versiune de Debian (probabil un Debian etch “curat” care este destul de solid și stabil).

Următoarea etapă este examinarea surselor pe o pagină oarecare a site-ului, care ne revelează faptul că Trilu servește conținutul de pe 4 tipuri de servere: www (codul HTML generat), static (css, imaginile din pagini dar nu contentul propriu-zis), thumbs (iconițele de la imagini, filme și utilizatori) și fs (contentul propriu-zis). De aici încolo este ușor pentru că ei folosesc o numerotare secvențială a serverelor, folosind o sculă de interogare DNS care se numește dig (este uzuală pe Linux, dar versiunea de Windows este aici), într-un singur tur de magie am adunat următoarele adrese (de precizat că nu merge să extragi tot domeniu cu nslookup, ar fi fost banal dar am fost servit cu reject):

www.trilulilu.ro.	1800	IN	A	91.121.49.21

www.trilulilu.ro.	1800	IN	A	91.121.54.34

www.trilulilu.ro.	1800	IN	A	91.121.60.45

trilulilu.ro.           1778    IN      A       91.121.51.44
www1.trilulilu.ro.	1699	IN	A	91.121.51.44

www2.trilulilu.ro.	1707	IN	A	91.121.45.27

www3.trilulilu.ro.	1800	IN	A	91.121.54.34

www4.trilulilu.ro.	1800	IN	A	91.121.49.21

fs1.trilulilu.ro.	1800	IN	A	91.121.76.56

fs2.trilulilu.ro.	1800	IN	A	91.121.2.32

fs3.trilulilu.ro.	478	IN	A	91.121.18.68

fs4.trilulilu.ro.	1800	IN	A	91.121.68.29

fs5.trilulilu.ro.	477	IN	A	91.121.73.77

fs6.trilulilu.ro.	478	IN	A	91.121.27.125

fs7.trilulilu.ro.	1667	IN	A	91.121.73.79

static.trilulilu.ro.	1667	IN	A	91.121.53.117

static1.trilulilu.ro.	1667	IN	A	91.121.76.56

static2.trilulilu.ro.	557	IN	A	91.121.2.32

static3.trilulilu.ro.	1668	IN	A	91.121.18.68

static4.trilulilu.ro.	892	IN	A	91.121.68.29

static5.trilulilu.ro.	893	IN	A	91.121.73.77

static6.trilulilu.ro.	892	IN	A	91.121.27.125

static7.trilulilu.ro.	893	IN	A	91.121.73.79

thumbs1.trilulilu.ro.	1668	IN	A	91.121.76.56

thumbs2.trilulilu.ro.	1668	IN	A	91.121.2.32

thumbs3.trilulilu.ro.	1669	IN	A	91.121.18.68

thumbs4.trilulilu.ro.	1669	IN	A	91.121.68.29

thumbs5.trilulilu.ro.	1669	IN	A	91.121.73.77

thumbs6.trilulilu.ro.	1670	IN	A	91.121.27.125

thumbs7.trilulilu.ro.	1669	IN	A	91.121.73.79
login.trilulilu.ro.     1800    IN      A       91.121.51.44
db1.trilulilu.ro.       1768    IN      A       91.121.79.11

O inspecție vizuală rapidă [remarcați, strategie clasică, DNS-ul roundrobin cu adrese diferite pentru www] ne arată ca numai 14 IP-uri sunt unice. Deși la o adică acestea ar putea fi toate găzduite pe unul și același server, bunul simț și experiența îmi spun că acestea indică fiecare câte un server. Sincer, nu văd de ce ar fi obfuscat adresele IP grupându-le “împotriva naturii”, deși cine știe poate o vor face după ce vor citi acest articol (sic!).

Ok, avem așadar 13 servere Linux care răspund toate la ping și rulează ceva pe portul 80 (chit că unele redirectează browserul) și un posibil server de baze de date db1.trilulilu.ro (DNS public ? greșeluță) care răspunde la ping dar nu la altele (recunosc că nu am stat sa fac portscan). Serverele de conținut nu trebuie să duduie prea tare la capitolul procesor, doar să aibă hdd mare și memorie suficient de multă. Din acest punct de vedere probabil că opăiunea lor se situează undeva la nivelul de servere cu Core 2 Duo, între Superplan 2007 L și MG++. Sunt servere cu 1.5 TB de disk și 1-4 GB de RAM, trafic nelimitat, care costă între 69 și 199 EUR/lună. Aceasta înseamnă un prim cost situat aproximativ între 900 și 2600 EUR/lună. Serverul cu baza de date ar trebui să fie ceva mai răsărit, aș paria pe unul dintre bi-Xeoanele quad-core sau ceva similar, cu un cost între 500 și 600 EUR/lună. Dacă punem un backup necesar în caz că db1 o ia la vale (nu l-am găsit în DNS dar bănuiesc că există) ajungem la estimarea finală undeva între 2000 și 4600 EUR/lună plus TVA. Este evident un minim necesar, nu am inclus aici eventualele deal-uri specifice cu OVH, care pot ridica foarte mult nota de plată (prioritizarea pentru streaming video este cam 1000 EUR/lună/server din câte îmi amintesc, dar nu este necesară), costurile de backup, hdd-urile suplimentare (care nu sunt piperate dar se adună), costul cu forța de muncă (programatori, admin, moderatori) și – cine știe – poate că mai au unul-două servere ascunse pe care nu le-au listat prin DNS :) (tsk, tsk, tsk) …

Cam acesta a fost “statul pe margine și datul cu presupusul” ca să-l citez chiar pe Sergiu. Sunt curios cât de aproape de adevăr sunt. La ora la care am finalizat articolul trilulilu.ro încă are probleme, come on boys nu terminați upgrade-ul ca să vedem noile funcționalități ?

Ultima notă: Să însemne totuși mutarea pe OVH o posibilă deschidere spre publicul european ? Îmi amintesc de un argument într-o vreme cum că avantajul major al lui Trilu față de YouTube&co este prezența pe Internetul metropolitan din România, care facilitează traficul internauților mioritici … evident că nu mai este cazul, de pe OVH avem trafic extern.

This entry was posted in Internet and tagged , , . Bookmark the permalink.

11 Responses to Trilulilu: posibil upgrade, mic studiu de cost

  1. Mihaï says:

    se poate intampla sa tii secret un investitor, atunci cand acela are reputatie proasta

    de exemplu vreo firma franceza furnizor de content matur

  2. Un peu de rose dans un monde de brutes …

  3. Dacian says:

    nu cred ca un investor ar intra in trilu fara sa ia un procent din firma. din cate am vazut sunt tot aceleasi 3 firme in actionariat

  4. Dacian, de unde ai informatia ? Pot sa caut undeva actionariatul unei firme ? Eu stiu doar de motorul de cautare de pe mfinante care nu da acest gen de detalii.

    BTW “Site-urile Trilulilu sunt g?zduite în România și sunt intenșionate și direcșionate utilizatorilor din România” (am citat de pe http://www.trilulilu.ro/politica-de-confidentialitate) :D

  5. Vasile says:

    Adrian,
    se poate afla actionariatul de la registrul comertului.
    Nu cred ca trebuie sa platesti mai mult de 45 lei ( 30 lei taxa normala si 15 lei taxa de urgenta) ca sa obtii un certificat constatator in care ti se prezinta toate datele legate de firma celor care detin trilulilu.ro
    sunt ca si cei de la Neogen din punct de vedere al modelului de business si transparentei .
    Si presupun ca au acelasi model de afacere : se inspira de la cei mari si dupa aceea “inoveaza” :) .

    Oricum, meriti sincere felicitari pentru aceasta analiza legata de costurile unui start-up gen trilulilu.ro

    Spune-i te rog fratelui tau ca pentru viteza si costuri de gazduire mai mici merita sa foloseasca serviciile celor de la Amazon ( s3 si e2c daca nu ma inseala memoria).

  6. Vasile says:

    Adriane,
    si te rog spune-i fratelui tau sa se uite spre :
    http://www.nytimes.com/2007/11/04/technology/04digi.html?ex=1194843600&en=d7bca7adac453f20&ei=5070&emc=eta1
    merita mai mult decit sa pierzi tu vremea legat de copia celor de la trilulilu.

  7. Problema cu Amazon S3 este ca deocamdata au un singur datacenter, in US. Ceea ce network-wise este cam nasol, mai ales pentru site-uri cu pagini mari, video, download-uri, etc. Mai era o chestiune neplacuta, lipsa unui SLA, dar am inteles ca s-ar fi rezolvat recent …

  8. sla says:

    nu vad nimic inovator in afara de crocodilul din logo, in rest copie dupa youtube
    softul la fel daca cauti un pic gasesti cap/coada toate componentele principale, deci lucrezi un pic la logo si faci mult tam-tam

  9. Alin says:

    Informatii despre arhitectura (hardware si software) a unora dintre cele mai mari site-uri (inclusiv youtube) gasiti la http://highscalability.com/

  10. Opiario says:

    Adrian, spunei fratelui tau sa se concentreze mae degraba peun serviciu online de muzici.
    Sunt prin preajma dac se arde fo sinapsa n sensu asta.

  11. Pingback: Sergiu Biri? » Blog Archive » Ba da, în?eleg

Leave a Reply

Your email address will not be published. Required fields are marked *

*

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>