dinsdag, juni 05, 2007

Google's ranking algorithm nader bekeken

Een must-read in de New York Times: reporter Saul Hensell mocht een dag meelopen in 'Google's inner sanctum', de 'search quality' group die verantwoordelijk is voor de kwaliteit van de zoekmachine. Ook al is Google op talloze terreinen actief, dit is en blijft het hart van de onderneming.

Google in cijfers

Google bestrijkt 112 talen, tientallen miljarden webpagina's en honderden miljoenen zoekopdrachten per dag. De zoekmachine, het 'ranking algorithm', bestaat uit duizenden vergelijkingen. De index waarin gezocht wordt is een getrouwe kopie van het internet. Veel pagina's worden tegenwoordig om de paar dagen opnieuw bekeken.

Google search quality

De leiding ligt bij Udi Manber (afkomstig van de University of Arizona, Yahoo! en Amazon search). Het ranking algorithm ligt bij een team van Amit Singhal (ex AT&T Labs). Verder zijn er teams die zich wijden aan features (zoals de snippets bij resultaten) en er is een team dat verantwoordelijk is voor de index.

Google in termen

Belangrijke termen zijn Buganizer (het systeem waardoor werknemers problemen kunnen rapporteren, soms wel 100 per dag), Debug (een intern programma dat toont hoe zoekopdrachten en pagina's geevalueerd worden) en Freshness (de verhouding tussen oudere, gerespecteerde pagina's en nieuwe content). Wat Freshness betreft: Google hanteert de grootheid QDF, query deserves freshness. Op basis van een model wordt vastgesteld wat een gebruiker wil en of het onderwerp 'hot' is.

Google's algoritme

Google hanteert ruim 200 Signals (informatiebronnen), waaronder het aloude PageRank (hoe meer links naar een pagina wijzen hoe belangrijker de pagina is). Andere Signals zijn de informatie op een pagina (bijvoorbeeld bepaalde woorden of plaatjes), de wijze waarop een pagina in de tijd verandert, het patroon in zoekopdrachten en de zoekgeschiedenis van individuen (alleen voor ingelogde Gmail-gebruikers). Op basis van de Signals construeert Google Classifiers (formules), die aangeven wat de zoeker zoekt: een product, informatie, een persoon, etc. Het eindresultaat is een relevancy score van de pagina's. Daarbij wordt nog gekeken naar de topicality (hoe verhoudt zich het onderwerp van de pagina tot de zoekopdracht?) en diversity (opdat de eerste 10 resultaten niet al te eenvormig zijn).

dinsdag, mei 22, 2007

De markt internetadvertenties

WPP en Micosoft sloten zich afgelopen week aan bij Google en Yahoo! door internetreclamebureaus te kopen. Hier een uiteenzetting over het belang.


1. Recente deals


2. De internetreclamemarkt

Er zijn grofweg drie soorten spelers te onderschieden:

  • Adverteerders. Opvallend is dat dankzij Google en Yahoo! ook minuscule bedrijfjes op internet kunnen adverteren. Denk aan de kleine tekstadvertenties bij zoekresultaten en op allerlei websites.
  • Web sites, de aanbieders van inventory (reclameruimte). Hier geldt iets soortgelijks: ook allerlei kleine sites, zoals blogs, bevatten danzkij vooral Google reclames.
  • Tussenpersonen. Dit zijn de de partijen die de adverteerders en de sites bij elkaar brengen.

Denk bij de laatste aan:

  • De genoemde Google en Yahoo!
    Tekstadvertenties: Zij bieden hun netwerk van adverteerders (100 duizenden bedrijven) een veilingsysteem waar ze zoektermen kunnen 'kopen'. De tekstadvertenties verschijnen op de zoekpagina's en op talloze partnersites die de zoekmachine op hun pagina dragen (search ads). Ook verschijnen ze talloze partnersites inclusief webblogs, waar de tekstadvertenties gematcht worden bij de inhoud ervan (contextual ads). Dit is de markt die nog altijd voor explosieve groei zorgt bij Google en waar Yahoo! met Project Panama aan een inhaalslag werkt.
    Display advertenties (banners, video, rich media, etc.). Dit is van oudsher de markt waar Yahoo! de kampioen is. De bovengenoemde deals zorgen er dan ook voor dat de concurrentie voor Yahoo! sterk toeneemt.
  • Gevestigde reclamebureaus zoals WPP en Omnicom, die traditioneel adverteerders bedienen. Geen wonder dat zij Google als gevaar zien: een (kleine) adverteerder heeft WPP helemaal niet nodig en kan via Google eenvoudig een campagne opzetten. Grotere adverteerders huren bedrijven als WPP in voor diverse aanverwante zaken: reclameruimte inkopen, campagnes ontwikkelen (het creatieve werk) en monitoren, etc.
  • De bovengenoemde overnameprooien. Dit geldt met name de markt voor display advertenties.

3. Conclusies

  • De prijzen stijgen tot grote hoogtes.
  • Meer deals zullen volgen. Andere potentiele prooien zijn allereerst het beursgenoteerde ValueClick, alhoewel hier een FTC-onderzoek loopt. Verder: Quigo, Exponential Interactive, Revenue Science, BlueLithium, Tacoda, Zedo, AdBrite en AdECN. Potentiele overnemers zijn nu vooral IAC (een groot internetbedrijf dat in het bovenstaande rijtje ontbreekt), Omnicom (een WPP-rivaal) en News Corp (dat diverse internetbedrijven heeft gekocht).
  • Microsoft lijkt de wanhoop nabij. Google fungeert als moving target: eerst zoektechnologie (inclusief de markt voor tekstadvertenties), vervolgens diverse web applicaties (met name gratis Office-achtige systemen) en nu de gehele advertentiemarkt (display).
  • Yahoo! lijkt marktaandeel te zullen verliezen, maar men moet niet vergeten dat het een heel ander bedrijf is dan Google. Yahoo! is namelijk ook een zeer druk bezochte portal, dus een aanbieder van inventory. Op de eigen pagina's blijft Yahoo! natuurlijk 'monopolist' in het bedienen van adverteerders. Overigens mag je wel hopen dat Yahooo! zijn inventory zal laten groeien (door relaunches van bestaande sites, nieuwe sites en overnames).
  • Een bod van Microsoft op Yahoo! lijkt nu minder voor de hand te liggen, tenzij Microsoft opnieuw er niet in slaagt de jongste deal tot een succes te maken. Bedenk dat Microsoft op de zoekmarkt nog steeds marktaandeel verliest, ondanks forse investeringen.
  • Google is van alle internetbedrijven het meest actief in het beproeven van offline markten. Het veilingsysteem, waarin adverteerders en eigenaren van inventory bij elkaar worden gebracht, is ook toe te passen op bijvoorbeeld tijdschriften, radio, tv, mobiel, computergames en zelfs billboards. Yahoo! beperkt zich in dit opzicht tot kranten, mobiele telefoons en navigatietools.
  • WPP noemt Google de 'frenemy' (friend/enemy) en steekt niet onder stoelen of banken dat de overname van 24/7 Real Media werd ingegeven door Google's DoubleClick deal. Enerzijds helpt Google adverteerders (die tevens klant zijn van WPP) bij het verkopen van reclameruimte, anderzijds dreigt mede hierdoor 'disintermediatie'.