Semalt는 Google Analytics에서 스팸 방지 조치에 대해 말합니다

Google 웹 로그 분석을 처리 할 때 실제로 원하는 것은 데이터에 전념하는 것입니다. 불행히도 스팸 메시지에는 항상 성가 시게 이상하고 실망스러운 만남이 있습니다. Google 웹 로그 분석의 스팸은 실제로 논쟁의 여지가있는 문제가되었으므로이 기사에서도 마찬가지입니다.

지난 2 년 동안 Google 트렌드는 Google 웹 로그 분석 스팸에 대한 검색 수와이를 극복하는 방법이 크게 증가한 것으로 나타났습니다. 스팸은 본질적으로 추천 보고서에서 스파이더와 봇이 생성 한 가짜 추천 트래픽을 의미하며, 이는 Google Analytics 데이터 보고서를 왜곡시킵니다. 따라서 Semalt 전문가 인 Artem Abgarian은 이러한 추천 스팸을 제거하는 방법에 대한 중요한 정보를 제공합니다.

먼저 기본 웹 사이트 및 대체 웹 사이트 도메인에서 주로 액세스하는 모든 Google 웹 로그 분석 추적 코드 소스를 정의해야합니다. 우리는 일반적으로 정규 표현식을 사용하여 도메인을 정의합니다. 정규 표현식은 기술 전문가가 아니어도 적용 할 수 있습니다. 각 도메인을 파이프 (|)로 분리하는 동안 모든 중지 전에 백 슬래시 (\)를 사용하여 각 도메인을 입력하면됩니다. 또한 도메인 내부 또는 도메인 사이에 간격이 없어야합니다. 도메인에 대한 트래픽 소스를 정의하면 필터를 사용하여 가짜 웹 사이트에서 나오는 모든 범위 데이터를 정리할 수 있습니다. '관리자'로 이동하여 '필터', '필터 추가'를 차례로 클릭 한 다음 '사용자 정의'로 필터 유형을 선택하고 '포함'옵션에서 작업을 확인하여 필터 설정을 활성화 할 수 있습니다. '버튼을 클릭하여 변경 사항을 적용하고 저장하십시오.

일부 스팸 데이터는 지정된 또는 정의 된 도메인 이름 내에서 크롤러의 도움으로 필터를 통과 할 수 있습니다. 이 경우 사용자 정의 필터를 사용하여 현재 알려진 모든 스팸 데이터 소스를 제외하십시오. 보다 능동적으로 모든 데이터 소스를 나타내는 획득 보고서를 사용하여 데이터를 스캔하고 평가할 수도 있습니다. 이 방법을 사용하면 보고서를 정리할 수있을뿐만 아니라 보고서를보고 이해할 수 있습니다. 이 단계는 '수집'아래를 클릭하고 '소스 / 매체'보고서로 이동하여 활성화됩니다. 모든 데이터 소스를 검사하고 스팸을 찾은 후에는 앞에서 설명한대로 데이터에서 스팸 소스를 제외시키는 명령으로 사용자 정의 필터를 작성하십시오. 또한 각 사용자 정의 필터의 정규식은 최대 255자를 초과하지 않아야합니다. 즉, 여러 스팸 소스를 제한하려면 여러 필터가 필요합니다.

셋째, 보고서에 가짜 코드 언어를 걸러 내도록 조심하십시오. 일반적으로 코드 언어는 약 5 자입니다. 가짜 코드 언어에는 마침표와 같은 문자가 포함됩니다. 이 경우. {13,} | \와 같은 정규식입니다. 전체 정지를 포함하여 13 자 이상의 문자로 코드화 된 언어를 제외하는 사용자 정의 필터를 작성하는 데 사용됩니다.

마지막으로 알려진 봇 또는 스파이더 트래픽에 대한 보고서를 제한하는 BOT 필터링을 활성화하여 Google Analytics 스팸을 제거해야합니다. '관리자'로 이동하여 '설정보기'를 선택하고 '봇 필터링'옵션을 클릭하여 선택하여이를 구성하십시오. 이러한 조치는 Google이 영구적 인 솔루션을 제시하기 전에 좌절감을 덜어줍니다.