acr.blog - noł bulszit » site

Posts Tagged ‘site’

Damian Krawczyk
Wtorek, styczeń 19th, 2010 | Damian Krawczyk

Operator inurl i site w zapytaniu Google

Na wstępie napiszę, że opisywane tu rzeczy należy traktować jako duże prawdopodobieństwo, a nie stan faktyczny. Niestety nie dotarłem do źródeł, które mogłoby zmienić prawdopodobieństwo w pewnik. Być może Wy, drodzy czytelnicy, zweryfikujecie moje spostrzeżenia.

Niedawno zostało mi zadane pytanie o przyczynę dużej rozbieżności pomiędzy zapytaniami w wyszukiwarce:

site:strona.pl fraza1 (ponad 300 wyników)

site:strona.pl inurl:katalog fraza1 (ponad 4tys wyników)

Rozbieżności te są jak najbardziej na miejscu jeśli spojrzymy na wycinek z supportu Google dotyczącego operatorów:

inurl:
Po uwzględnieniu w zapytaniu ciągu [inurl:] Google ograniczy wyniki wyszukiwania do dokumentów zawierających dany wyraz w adresie URL. Na przykład zapytanie [inurl:wyszukiwarka google] spowoduje zwrócenie dokumentów zawierających wyraz „wyszukiwarka” w adresie URL oraz wyraz „google” w dowolnym miejscu (adresie lub poza adresem). Pomiędzy operatorem „inurl:” a następującym po nim wyrazem nie może być spacji.
Umieszczenie operatora „inurl:” przed każdym wyrazem zapytania da takie same wyniki, jak umieszczenie przed całym zapytaniem operatora „allinurl:”: [inurl:wyszukiwarka inurl:google] oznacza to samo co [allinurl: wyszukiwarka google].

Zatem w zapytaniu ’site:strona.pl inurl:katalog fraza1′ fraza1 może się znaleźć nie tylko w dokumencie, ale także w adresie URL. Muszą być spełnione oba warunki, czyli fraza ‘katalog’ musi się znaleźć w adresie URL ORAZ ‘fraza1′ musi się znaleźć w adresie URL lub też poza adresem (samo zapytanie site:strona.pl fraza1 oznacza konieczność relewantności danego dokumentu z frazą).
W związku z powyższym zastanowił mnie pewien wyjątkowy przykładowy wynik:

site:1sekunda.pl inurl:sekunda = 76 wyników

site:1sekunda.pl inurl:sekunda pozyczka = 104 wyniki

zdziwienie

Ma się to więc nijak do moich wywodów i tego jak rozumiem support Google. Z pomocą mi przyszedł Marcin i przedstawił prawdę objawioną. W tym akurat przypadku wyniki z pierwszej strony nie mają do końca pokrycia z wynikami ze strony ostatniej (bardziej realne wyniki), które przedstawiają się następująco:

site:1sekunda.pl inurl:sekunda = 34 wyniki

site:1sekunda.pl inurl:sekunda pozyczka = 30 wyników

Ufff, moje wywody w nawiązaniu do tych liczb są nadal aktualne. Jeśli znajdziecie jakieś fakty zaprzeczające temu tokowi myślenia, chętnie je obejrzę, zniszczę ten artykuł i schowam się pod ziemię.

wiecej | brak komentarzy

Damian Krawczyk
Wtorek, listopad 10th, 2009 | Damian Krawczyk

Rośnij duży, okrąglutki

Ilość stron w internecie rośnie, rośnie i rośnie. Rośnie w tempie zastraszającym choć… nie tak bardzo jak jeszcze parę lat temu. Niech miarą internetu będzie liczba zaindeksowanych w Google stron.

Zgodnie z tym, co pisano na blogu Google w połowie zeszłego roku, liczba zaindeksowanych stron oscylowała wówczas w okolicach 1 biliona. Chociaż nawet Google nie wiedział do końca ile ich jest:

“So how many unique pages does the web really contain? We don’t know; we don’t have time to look at them all!”

A jaka jest obecna liczba zaindeksowanych stron?

Oto statystyki z lutego 2009 znalezione na forum dla webmasterów Google:

site:.com - 18,310,000,000
site:.net - 2,310,000,000
site:.org - 2,220,000,000
site:.info - 273,000,000
site:.de - 1,280,000,000
site:.uk - 768,000,000
site:.nl - 385,000,000
site:.pl - 632,000,000

Jak to wygląda na dzień dzisiejszy:

site:.com - 25,360,000,000
site:.net - 10,530,000,000
site:.org - 8,140,000,000
site:.info - 1,340,000,000
site:.de - 8,880,000,000
site:.uk - 4,290,000,000
site:.nl - 2,310,000,000
site:.pl - 3,850,000,000

Przyjąwszy podobną tendencję wzrostu dla samych stron .com w drugim półroczu 2008 roku mamy zatem ponad 90% wzrost zaindeksowanych stron. Jeśli ma to też przełożenie na całkowtią ilość zaindeksowanych w Google stron można spekulować, że obecnie liczba zaindeksowanych stron waha się w granicach 2 bilionów.

Zgodnie z informacją liczba zaindeksowanych w Google stron w latach 2005-2008 wzrosła 125-cio krotnie. Jeżeli wzrost liczby stron w domenie .com ma przełożenie na wzrost liczby zaindeksowanych stron to można stwierdzić, że mamy do czynienia z mniejszym wzrostem zaindeksowanych stron.  Być może wytężona praca Search Quality nad usuwaniem SPAMu przynosi efekt? :) De facto jednak liczba nowo zaindeksowanych stron jest ogromna, dużo większa niż w latach poprzednich (działamy już bowiem na bilionach, a nie jak we wcześniej porównywanych latach milionach czy miliardach).

25124804-main_full

Miejmy nadzieję, że ten stale nadmuchiwany “balonik” nie pęknie jednak zbyt szybko.

wiecej | brak komentarzy