C
ChaoBro

CloakBrowser:C++ ソースレベルの変更で 30 のボット検出サイトを突破

CloakBrowser:C++ ソースレベルの変更で 30 のボット検出サイトを突破

自動化ウェブスクレイピングをする人なら皆知っている痛み:Playwright や Puppeteer は便利だが、Cloudflare Turnstile や FingerprintJS にぶつかるとお手上げ。

解決策は二つに大別される:設定変更(user-agent 偽装、自動化マーカー隠蔽の JS 注入)か、有料フィンガープリントブラウザ(Multilogin、GoLogin、AdsPower)。前者は効果が diminishing、後者は月額課金で安くない。

CloakBrowser は第三の道を選んだ。

パッチではなくソースコード

CloakBrowser は設定パッチでも JS 注入でもない。Chromium の C++ ソースコードで 49 箇所のフィンガープリント関連部分を変更——canvas、WebGL、audio、fonts、GPU、screen、WebRTC、network timing、automation signals、CDP input behavior、すべて低レベルで処理。

アンチボットシステムはこれを正常なブラウザとしてスコアリングする。なぜなら、本質的に正常なブラウザだから。

テスト結果:30 の検出サイトすべて通過。Cloudflare Turnstile、FingerprintJS、BrowserScan 含む。reCAPTCHA v3 スコア 0.9——人間レベル、サーバー検証済み。

我的看法

CloakBrowser のポジショニングは明確:自動化用のアンチ検出ブラウザ。しかし銀の弾丸ではない。アンチボットシステムは継続的に進化しており、今日通るパッチが明日も通るとは限らない。プロジェクトには自動更新チェックがあるが、更新頻度とカバレッジは継続的な監視が必要。

172 コミット、50 タグ——セキュリティ関連プロジェクトとしてはメンテナンス深度は妥当だが、チーム規模は不明で長期持続性は疑問符。

データ収集、自動テスト、大規模ブラウザ操作をしているなら、CloakBrowser は現在最も完成度が高く移行コストの低いオープンソースオプション。 ただしコンプライアンス-sensitive な作業をしている場合は、まず法的リスクを理解すること。ツールは中立的だが、ユースケースは違う。

最新バージョン v0.3.29、Chromium 146.0.7680.177.4 ベース。新機能:ネイティブ SOCKS5 プロキシサポート、非同期コンテキスト起動、JS contextOptions エスケープハッチ。

主要ソース: