➡️ Z pełnym dokumentem Search Quality Evaluator Guidelines można zapoznać się pod
tym linkiem (jest to dokument w wygodnym formacie pdf).
Nowa struktura definicji spamu – nacisk na treści niskiej jakości i skalowanie AI
Google wprowadziło gruntowną reorganizację sekcji poświęconej spamowi. Dotychczasowa sekcja
4.6.3 „Auto-generated MC” została całkowicie usunięta, a w jej miejsce pojawiło się kilka nowych podrozdziałów, które dokładniej opisują różne formy nadużyć — w tym skalowane użycie AI do tworzenia treści. Wprowadzone zostały cztery kluczowe kategorie:
- Expired Domain Abuse (sekcja 4.6.3) – sytuacja, w której wygasła domena zostaje zakupiona i wykorzystana do publikacji treści bez wartości, tylko po to, by wykorzystać wcześniejszy autorytet domeny w rankingach.
- Site Reputation Abuse (sekcja 4.6.4) – publikacja treści przez zewnętrzne podmioty na stronach o wysokiej reputacji (np. serwisy medialne), tylko po to, by wykorzystać ich siłę rankingową. Treści te nie wnoszą wartości i nie są związane z główną tematyką serwisu.
- Scaled Content Abuse (sekcja 4.6.5) – masowe tworzenie treści „bez wysiłku i oryginalności”, często przy użyciu automatycznych narzędzi, takich jak AI. Google wyraźnie zaznacza, że generatywna AI może być narzędziem wykorzystywanym właśnie do tego typu nadużyć.
- Main Content Created with Little to No Effort (sekcja 4.6.6) – nowa kategoria „zbiorcza” obejmująca treści, które zostały skopiowane, sparafrazowane, osadzone z innych źródeł lub wygenerowane automatycznie – bez wysiłku, bez oryginalności i bez wartości dodanej dla odwiedzającego stronę.
W tej ostatniej sekcji Google jednoznacznie wskazuje, że:
„Ocena Lowest powinna być stosowana, jeśli całość lub prawie całość głównej treści strony (MC), w tym tekst, obrazy, dźwięk, wideo itd., została skopiowana, sparafrazowana, osadzona, wygenerowana automatycznie lub przy użyciu AI, albo ponownie opublikowana z innych źródeł — bez wysiłku, oryginalności i wartości dodanej. Dotyczy to również stron, które przypisują autorstwo źródłowe.”
To bardzo jasna deklaracja: jeśli główna treść strony powstała „hurtowo”, bez przemyślenia i dopracowania, Google uznaje ją za treść najniższej jakości — niezależnie od tego, kto ją formalnie „napisał”.
Skąd wiadomo, że treść jest generowana przez AI?
Google nie udostępnia quality raterom konkretnego narzędzia do wykrywania treści tworzonych przez AI, jednak nowe wytyczne zawierają jasne wskazówki, które mają pomóc w ich identyfikacji — szczególnie w kontekście treści parafrazowanych i automatycznie przetwarzanych.
W sekcji
4.6.6 Google zaznacza, że narzędzia automatyczne (w tym AI) mogą służyć do tworzenia
treści parafrazowanych, które polegają na streszczaniu lub przekształcaniu informacji z innych źródeł. Dodatkowe instrukcje dla raterów znalazły się w nowej sekcji
4.6.7, która określa cechy charakterystyczne tego typu treści:
Zawierają głównie powszechnie znane fakty lub informacje ogólne, bez głębi i analizy.
Wykazują duży poziom pokrycia z treściami z uznanych źródeł, takich jak Wikipedia czy portale referencyjne.
Sprawiają wrażenie streszczenia konkretnej strony (np. artykułu, forum), ale bez żadnej wartości dodanej.
Zawierają słowa lub frazy charakterystyczne dla treści generowanych przez AI, np. „As an AI language model...”.
Choć samo parafrazowanie nie jest zakazane, brak oryginalności i wkładu redakcyjnego może wystarczyć, by treść uznano za niskiej jakości. Google podkreśla, że nawet jeśli strona przypisuje autorstwo źródłowe, nie wystarczy to, by uzasadnić jej wartość w oczach użytkownika.
➡️
Kontynuuj lekturę – drugą część artykułu znajdziesz tutaj:
Czy Google obniża ocenę treści generowanych przez AI? (cz. 2)