ทราฟฟิกสแปมและบอตที่ไม่ดีมักโจมตีเว็บไซต์ของคุณอยู่เสมอ

เผยแพร่แล้ว: 2022-12-03

Spam And Bad Bot Traffic

ทุกๆ วันฉันดูเหมือนจะใช้เวลามากขึ้นในการตรวจสอบและบล็อกสแปมและทราฟฟิกบอทที่ไม่ดี

ไม่สำคัญว่าบล็อกหรือเว็บไซต์ของคุณจะใหญ่หรือเล็ก บอทกำลังโจมตีมันตลอดเวลา

เมื่อฉันตรวจสอบไซต์เล็ก ๆ ของฉันสองสามแห่งที่มีผู้เยี่ยมชมน้อยมากต่อวัน มีการเข้าชมบอทอัตโนมัติอย่างต่อเนื่อง

แต่เพื่อให้คุณทราบปริมาณการเข้าชมเว็บที่เป็นไปโดยอัตโนมัติ เป็นอันตราย หรือเป็นสแปม ฉันได้ตรวจสอบ Just Publishing Advice แบบสมบูรณ์แล้ว นี่คือผลลัพธ์

ในบทความนี้ ซ่อน
ตรวจสอบสแปมและการรับส่งข้อมูลบอทที่ไม่ดี
รายละเอียดกิจกรรมการรับส่งข้อมูลสแปมและบอตที่ไม่ดี
วิธีเข้าถึงข้อมูลการเข้าชมสแปมและบอตที่ไม่ดีสำหรับไซต์ของคุณ
จับสแปมเมอร์
กฎไฟร์วอลล์ Cloudflare เพื่อหยุดสแปมความคิดเห็น
คุณทำอะไรกับเครื่องขูดได้บ้าง?
เครื่องสแกนช่องโหว่
บอทที่ดีและบอทที่ไม่ดี
บทสรุป

ตรวจสอบสแปมและการรับส่งข้อมูลบอทที่ไม่ดี

คุณอาจตรวจสอบหมายเลขการจราจรของคุณด้วย Google Analytics (GA)

เป็นหนึ่งในเครื่องมือฟรีที่ดีที่สุดในการรับทราบว่าบล็อกหรือเว็บไซต์ของคุณทำงานได้ดีเพียงใด

ไม่มีอะไรดีไปกว่าการเห็นจำนวนผู้ใช้และการดูหน้าเว็บที่เพิ่มขึ้นอย่างต่อเนื่อง

แต่สิ่งที่ไม่ได้บอกคุณคือจำนวนการเข้าชมอัตโนมัติที่น่าสงสัยหรือเป็นอันตรายที่ไซต์ของคุณได้รับ

หากคุณต้องการค้นพบการรับส่งข้อมูลที่ GA เพิกเฉยหรือพลาดไป คุณต้องเจาะลึกลงไปด้วยแหล่งข้อมูลอื่นๆ

ฉันใช้เครื่องมือจำนวนหนึ่งเพื่อตรวจสอบและปกป้องไซต์ของฉันจากผู้ไม่หวังดี โชคดีที่ส่วนใหญ่ฟรี

บริการแบบชำระเงินเดียวที่ฉันใช้คือ Statcounter ซึ่งมีค่าใช้จ่ายเพียง $9.00 ต่อเดือน

โดยจะรวบรวมข้อมูลที่คล้ายกับ GA แต่ข้อได้เปรียบที่สำคัญคือรายงานที่อยู่ IP และกิจกรรมลิงก์ขาออก

ด้วยเหตุนี้ ฉันจึงสามารถตรวจสอบและจัดการสแครปเปอร์ การเข้าชมบอทอัตโนมัติ และตรวจสอบการคลิกโฆษณา Adsense ที่ไม่ถูกต้อง

ตอนนี้ไปที่ข้อมูลเพื่อแสดงสิ่งที่ฉันค้นพบ

รายละเอียดกิจกรรมการรับส่งข้อมูลสแปมและบอตที่ไม่ดี

โดยเฉลี่ยแล้ว ไซต์ของฉันได้รับการเข้าชมจากผู้ใช้จริงประมาณ 3,500 ครั้งต่อวัน

ฉันมักจะอยากมีมากกว่านี้ แต่ก็ไม่แย่เกินไป

Average daily visits
การเข้าชมเฉลี่ยรายวัน

แต่นี่ไม่ใช่ภาพเต็ม

เมื่อฉันตรวจสอบและรวบรวมข้อมูลการเข้าถึงจากแหล่งอื่น จำนวนการเข้าชมจริงบนเว็บไซต์ของฉันอยู่ที่ประมาณ 11,500 ครั้งต่อวัน

spam and bad bot traffic by numbers

อย่างที่คุณเห็น มีอะไรเกิดขึ้นมากมายบนไซต์ของฉันมากกว่ารายงานเครื่องมือวิเคราะห์ส่วนใหญ่

วิธีที่ดีกว่าในการดูข้อมูลนี้คือเปอร์เซ็นต์

นี่คือรายละเอียดเปอร์เซ็นต์ของการเข้าชมไซต์เฉลี่ยรายวันของฉัน

spam and bad bot traffic by percentages

จากการเข้าชมไซต์ของฉันทั้งหมดในแต่ละวัน มีเพียง 32% เท่านั้นที่เป็นผู้เข้าชมจริง

อย่างไรก็ตาม ตัวเลขนี้ดูเหมือนจะเป็นค่าเฉลี่ย

Help Net Security รายงานในปี 2021 ว่าทราฟฟิกอัตโนมัติคิดเป็น 64% ของทราฟฟิกอินเทอร์เน็ต

ทุกไซต์ถูกเข้าชมโดยบอท ดังนั้นจึงเป็นเรื่องจริง

แต่ก็ยังคุ้มค่าที่จะตรวจสอบการเข้าชมไซต์ของคุณเป็นครั้งคราว

วิธีเข้าถึงข้อมูลการเข้าชมสแปมและบอตที่ไม่ดีสำหรับไซต์ของคุณ

อย่างที่ฉันบอกไปก่อนหน้านี้ ฉันใช้เครื่องมือฟรีเป็นส่วนใหญ่

สิ่งเหล่านี้เป็นแนวป้องกันของฉันจากสแปมและการเข้าชมบอตที่ไม่ดี

1. คลาวด์แฟลร์

คุณอาจคิดว่า Cloudflare เป็นเพียง CDN ที่ทำให้ไซต์ของคุณโหลดเร็วขึ้น

แต่นั่นเป็นเพียงข้อดีส่วนหนึ่งของบัญชีฟรี ข้อดีที่แท้จริงของการใช้ Cloudflare คือความปลอดภัย

ไฟร์วอลล์เว็บแอปพลิเคชัน (WAF) เป็นแนวป้องกันแรกของฉัน

Cloudflare blocking

ฉันได้ปิดบังที่อยู่ IP เนื่องจากความเป็นส่วนตัว แต่คุณสามารถดูจำนวนบล็อกและความท้าทายทั้งหมดที่ออกในหนึ่งวันคือ 1,728

ด้วย WAF คุณสามารถตั้งกฎไฟร์วอลล์ของคุณเองหรือใช้เครื่องมือเพื่อบล็อกหรือท้าทายที่อยู่ IP หรือ ASN

เป็นเครื่องมือที่ดีที่สุดในการจัดการการเข้าชมที่ไม่พึงประสงค์บนไซต์ของคุณ

2. คำพูดติดปาก

แนวป้องกันที่สองของฉันคือปลั๊กอิน Wordfence บนไซต์ของฉัน

มันบล็อกการรับส่งข้อมูลที่เป็นอันตรายที่อาจผ่าน Cloudflare

Worfence blocks

จำนวนบล็อกจะแตกต่างกันไปในแต่ละวัน แต่โดยเฉลี่ยแล้ว จะบล็อกระหว่าง 250-450 ครั้งในแต่ละวัน

3. การป้องกันเซิร์ฟเวอร์

แนวป้องกันสุดท้ายคือเซิร์ฟเวอร์ ISP Apache ของฉัน

จากบันทึกการเข้าถึงและข้อผิดพลาด ฉันสามารถสแกนหากิจกรรมที่ไม่เหมาะสมใดๆ ที่เซิร์ฟเวอร์บล็อกได้ ฉันยังตรวจสอบได้ว่ากิจกรรมที่ได้รับอนุญาตดูน่าสงสัยหรือไม่

จากนั้นฉันสามารถใช้ Cloudflare หรือ Wordfence เพื่อดูแลกิจกรรมที่น่าสงสัยที่ฉันพบ

จับสแปมเมอร์

สแปมเมอร์สร้างความรำคาญมากกว่าภัยคุกคาม

แต่มีวิธีที่ค่อนข้างง่ายในการจัดการ

ปลั๊กอินสแปมความคิดเห็น WordPress

Akismet เป็นปลั๊กอินฟรีที่ใช้งานได้ดีในการต่อสู้กับสแปมความคิดเห็นในบล็อกของคุณ

Akismet anti spam

อัตราความแม่นยำอยู่ที่ประมาณ 99.5% ดังนั้นจึงทำงานได้ดีมาก

มีความคิดเห็นที่ถูกต้องตามกฎหมายประมาณ 4,000 รายการในไซต์ของฉัน แต่ Akismet ได้บล็อกความคิดเห็นสแปมกว่า 75,000 รายการ!

หากคุณได้รับสแปมจำนวนมาก ข้อเสียเพียงอย่างเดียวคือคุณต้องหมั่นลบความคิดเห็นสแปมที่ Akismet ตรวจจับได้

กฎไฟร์วอลล์ Cloudflare เพื่อหยุดสแปมความคิดเห็น

ยิ่งคุณได้รับการเข้าชมไซต์มากเท่าใด คุณก็จะได้รับความคิดเห็นที่เป็นสแปมมากขึ้นเท่านั้น

ในกรณีนี้ คุณสามารถใช้วิธีการค้อนขนาดใหญ่ในการแก้ปัญหาด้วยกฎไฟร์วอลล์ Cloudflare แบบง่ายๆ ที่จะบล็อกผู้ส่งสแปมความคิดเห็นจากไซต์ของคุณ

ข้อดีของกฎนี้คือมีประสิทธิภาพอย่างมากในการต่อต้านสแปมความคิดเห็น ข้อเสียเพียงเล็กน้อยคือมันเพิ่มแรงเสียดทานเล็กน้อยสำหรับผู้แสดงความคิดเห็นที่แท้จริง

พวกเขาจะได้รับการแจ้งเตือน Cloudflare อย่างรวดเร็วภายใน 2-5 วินาทีว่า กำลัง ตรวจสอบเบราว์เซอร์ของคุณ ก่อนที่พวกเขาจะสามารถโพสต์ความคิดเห็นได้

คนส่วนใหญ่คุ้นเคยกับสิ่งนี้ ดังนั้นจึงไม่ใช่ปัญหาใหญ่

แต่เนื่องจากนักส่งสแปมไม่ได้ใช้เบราว์เซอร์ปกติในการส่งความคิดเห็น พวกเขาจะถูกบล็อก

หากต้องการใช้วิธีนี้ ให้เพิ่มกฎต่อไปนี้ในไฟร์วอลล์ Cloudflare ของคุณ

Cloudflare comment spam firewall rule

ชื่อกฎ: คุณสามารถเลือกชื่อใดก็ได้เพื่อระบุกฎของคุณ

ฟิลด์: เส้นทาง URI

ตัวดำเนินการ: ประกอบด้วย

ค่า: /wp-comments.php

การดำเนินการ: JS Challenge

หลังจากที่คุณเปิดใช้งานกฎแล้ว คุณสามารถตรวจสอบได้ว่ากฎนั้นทำงานได้ดีเพียงใด

JS Challenge total

หากคุณวางเมาส์เหนือเปอร์เซ็นต์ คุณจะเห็นจำนวนความท้าทายที่แก้ไขได้

JS Challenge solved

หมายเลขที่แก้ไขมักจะเป็นความคิดเห็นจริงที่ผ่านการท้าทาย JS คุณสามารถตรวจสอบสิ่งนี้ได้ในบันทึกของไซต์ของคุณ

นี่คือบันทึกของความคิดเห็นจริงที่ผ่านและเข้าสู่คิวการกลั่นกรองของฉันเรียบร้อยแล้ว

สี่เหลี่ยมสีแดงไฮไลท์การตรวจสอบ Cloudflare ที่สำเร็จ

Genuine comment passed

ไม่ใช่กฎสำหรับไซต์ส่วนใหญ่ แต่ถ้าไซต์ของคุณถูกโจมตีด้วยสแปมความคิดเห็นจำนวนมาก มันมีประสิทธิภาพสูง

Akismet blocks

อย่างที่คุณเห็น ฉันต้องลบความคิดเห็นที่เป็นสแปมกว่า 75,000 รายการเมื่อเวลาผ่านไป

แต่ด้วยกฎนี้ แทบจะไม่มีใครผ่านไปได้ในตอนนี้

สิ่งหนึ่งที่ควรทราบก็คือตามกฎนี้ คุณอาจเห็น 4 ครั้งที่ถูกบล็อกโดย Cloudflare สำหรับการแสดงความคิดเห็นสแปมแต่ละครั้งที่ล้มเหลว

นี่เป็นเรื่องปกติเนื่องจาก Cloudflare บล็อกการทำงานของสคริปต์ที่ผู้ส่งอีเมลขยะใช้

อย่างไรก็ตาม สำหรับความคิดเห็นที่แท้จริง คุณจะเห็นหนึ่งรายการในไฟร์วอลล์ของคุณ เนื่องจากผู้ใช้ผ่านการทดสอบ JS แล้ว

ดังนั้นอย่าตกใจหากคุณเห็นกฎบล็อกการพยายาม 300-400 ครั้งต่อวัน

คุณอาจยังได้รับความคิดเห็นที่เป็นสแปมเป็นครั้งคราวหากผู้ส่งสแปมโพสต์ด้วยตนเอง แต่อาคิสเม็ทมักจะจับมันได้

หากคุณมีผู้ส่งสแปมความคิดเห็นมากพอ กฎไฟร์วอลล์นี้จะทำงานให้คุณ

อีเมลสแปม SEO

แคมเปญการเข้าถึงลิงก์ตอนนี้ไม่มีอะไรมากไปกว่าสแปม

ถือว่าเป็นการปฏิบัติที่ถูกต้องในการขอลิงก์ย้อนกลับในปีที่ผ่านมา

แต่ตอนนี้ เครื่องมือ SEO อย่าง Semrush ทำให้การทำให้แคมเปญเหล่านี้ส่งตรงไปยังที่อยู่อีเมลของคุณเป็นแบบอัตโนมัติเป็นเรื่องง่ายมาก

คุณทำอะไรไม่ได้นอกจากลบอีเมลเหล่านี้เมื่อมาถึง

ในกรณีของฉัน อาจเป็น 100-200 ต่อวัน ขอลิงก์ โพสต์ของแขก หรือตำแหน่งโพสต์ของผู้สนับสนุน

สำหรับฉัน เงินจำนวนนั้นเป็นสิ่งที่ฉันคิดว่าไม่มีอะไรมากไปกว่าสแปมล้วนๆ

คุณทำอะไรกับเครื่องขูดได้บ้าง?

web scraping

Python และรูปแบบอื่นๆ ของการขูดเว็บมีมากขึ้นเรื่อย ๆ

มันไม่ง่ายเลยที่จะรู้ว่าจะทำอย่างไรกับมัน

เมื่อเร็ว ๆ นี้ Linkedin พยายามหยุดโปรแกรมขูดเว็บ แต่ศาลสหรัฐฯ ตัดสินว่าการขูดข้อมูลนั้นถูกกฎหมาย

ค่อนข้างง่ายที่จะหา scapers ที่เข้าถึงไซต์ของคุณ คุณสามารถค้นหาบันทึกการเข้าถึงเซิร์ฟเวอร์ของคุณสำหรับตัวแทนผู้ใช้ เช่น python-requests หรือ python/3

คุณยังสามารถตั้งค่ากฎไฟร์วอลล์ชั่วคราวของ Cloudflare และออกคำสั่งจาวาสคริปต์ได้อีกด้วย (http.user_agent มี “python-requests”) หรือ (http.user_agent มี “Python/3”)

แต่มีเพียงเล็กน้อยที่คุณสามารถทำได้นอกเหนือจากการตรวจสอบ ครั้งเดียวที่คุณจำเป็นต้องท้าทายหรือบล็อก Scraper คือเมื่อมันโจมตีไซต์ของคุณบ่อยเกินไป

ฉันมีหนึ่งที่เข้าชมไซต์ของฉันมากกว่า 14,000 ครั้งต่อวันจากที่อยู่ IP ที่แตกต่างกันกว่า 50 แห่ง

มีเหตุผลที่ถูกต้องในการคัดลอก เช่น การวิจัย SEO หรือการรวบรวมข้อมูล แต่ก็ยังมีผู้ให้บริการเนื้อหาที่คัดลอก ขโมย และเผยแพร่เนื้อหาของคุณซ้ำ

แต่มันไม่ง่ายเลยที่จะบอกความแตกต่าง

เครื่องสแกนช่องโหว่

นี่เป็นอีกรูปแบบหนึ่งของทราฟฟิกบอทที่บางครั้งก็ดี แต่ส่วนใหญ่แย่

บริษัทรักษาความปลอดภัยบนเว็บจะสแกนหาซอฟต์แวร์ ปลั๊กอิน และช่องโหว่ของธีมอย่างเป็นธรรมชาติและเป็นประโยชน์ ซึ่งสามารถแพตช์และแก้ไขได้

แต่ก็มีแฮ็กเกอร์ที่กำลังมองหาช่องโหว่เดียวกันนี้เพื่อเข้าถึงและควบคุมเว็บไซต์

อีกครั้ง มันไม่ง่ายเลยที่จะบอกคนดีจากคนเลว

แนวทางที่ดีที่สุดคือให้ Cloudflare และ Wordfence จัดการปัญหาในกรณีส่วนใหญ่ แต่มีบางครั้งที่ฉันต้องเพิ่มบล็อกด้วยตนเองเพื่อให้แน่ใจ

บอทที่ดีและบอทที่ไม่ดี

เครื่องมือค้นหาเช่น Google และ Bing ใช้บอทเพื่อตรวจสอบไซต์ของคุณ หากไม่มีสิ่งเหล่านี้ ไซต์ของคุณจะไม่มีโอกาสถูกจัดทำดัชนีและจัดอันดับหน้าของคุณสำหรับการค้นหา

คุณต้องการให้ไซต์และบล็อกโพสต์ของคุณติดอันดับบน Google และ Bing ใช่แล้ว สิ่งเหล่านี้เป็นบอทที่ดีจริงๆ

บ็อตที่ดีอื่น ๆ ช่วยคุณวิเคราะห์การเข้าชมของคุณ สิ่งเหล่านี้อาจรวมถึง Ahrefs, Semrush และ Ubersuggest เป็นต้น

แต่ใช่ ยังมีบ็อตที่ไม่ดี เช่น แฮ็กเกอร์และสแปมเมอร์ที่ไม่คำนึงถึงผลประโยชน์สูงสุดของคุณ

การเรียนรู้วิธีบอกความแตกต่างนั้นไม่ใช่เรื่องง่ายเสมอไป แต่การบล็อกบอทมากเกินไปมักจะส่งผลเสียมากกว่าผลดี

อีกครั้ง สิ่งที่คุณทำได้คือติดตาม ตรวจสอบ และเลือกว่าสิ่งไหนที่คุณบล็อกหรือท้าทาย

ฉันใช้เครื่องมือออนไลน์ฟรีสองสามอย่างเพื่อช่วยฉันตรวจสอบ

หนึ่งคือ AbuseIPDB คุณสามารถตรวจสอบที่อยู่ IP ใดๆ เพื่อดูว่ามีรายงานว่ามีการละเมิดหรือไม่

อีกอันคือ Scamalytics ด้วยแอปนี้ คุณสามารถตรวจสอบคะแนนการฉ้อโกงของที่อยู่ IP ได้

บทสรุป

ไม่มีทางที่คุณจะหยุดการเข้าชมสแปมและบอตที่ไม่ดีบนเว็บไซต์หรือบล็อกของคุณได้

สิ่งที่คุณทำได้คือตรวจสอบและพยายามจัดการให้ดีที่สุดเท่าที่จะทำได้

แต่ไม่ต้องแปลกใจหากคุณพบว่าประมาณ 65% ของการเข้าชมไซต์ของคุณเป็นบอทอัตโนมัติ

รายงานล่าสุดจาก Imperva ยืนยันว่ากิจกรรมบอทที่ไม่ดีเพิ่มขึ้นทุกปี

เจ้าของไซต์ทุกคนสามารถทำได้และควรทำคือเรียนรู้วิธีจัดการภัยคุกคามอย่างมีประสิทธิภาพที่สุด

การอ่านที่เกี่ยวข้อง: Cloudflare Cache ทุกอย่างปรับปรุง WordPress TTFB ถึง 90%